TE
科技回声
首页
24小时热榜
最新
最佳
问答
展示
工作
中文
GitHub
Twitter
返回个人资料
che_shr_cat 的提交内容
1
Are Deeper LLMs Smarter, or Just Longer?
3 点
作者
che_shr_cat
2 天前
暂无评论
2
Muon Optimizer Accelerates Grokking
8 点
作者
che_shr_cat
大约 1 个月前
暂无评论
3
ThoughtTerminator
2 点
作者
che_shr_cat
大约 1 个月前
暂无评论
4
Chain of Continuous Thought (Coconut)
3 点
作者
che_shr_cat
大约 1 个月前
暂无评论
5
Intuitive Physics Emergence in V-JEPA
1 点
作者
che_shr_cat
大约 2 个月前
暂无评论
6
Sound physics And basics of sound perception
2 点
作者
che_shr_cat
大约 2 个月前
暂无评论
7
BLT: Byte Latent Transformer
4 点
作者
che_shr_cat
5 个月前
暂无评论
8
A Single 'Super Weight' Can Break Your Billion-Parameter Model
2 点
作者
che_shr_cat
6 个月前
暂无评论
9
Jax Things to Watch for in 2025
1 点
作者
che_shr_cat
6 个月前
暂无评论
10
Diffusion models are evolutionary algorithms
126 点
作者
che_shr_cat
7 个月前
27 条评论
11
Make Softmax Great Again
2 点
作者
che_shr_cat
7 个月前
暂无评论
12
Deep Learning Frameworks: The Fourth Pillar of Deep Learning Revolution
1 点
作者
che_shr_cat
7 个月前
暂无评论
13
TextGrad: Automatic "Differentiation" via Text
3 点
作者
che_shr_cat
11 个月前
暂无评论
14
Superconducting Supercomputers
1 点
作者
che_shr_cat
11 个月前
暂无评论
15
Decoder-decoder architecture is coming
2 点
作者
che_shr_cat
12 个月前
暂无评论
16
Chronos: Using Pretrained LLMs for Probabilistic Time Series Forecasting
2 点
作者
che_shr_cat
大约 1 年前
暂无评论
17
Big Post About Big Context
49 点
作者
che_shr_cat
大约 1 年前
19 条评论
18
Neural Network Diffusion
1 点
作者
che_shr_cat
超过 1 年前
暂无评论
19
Thermodynamic AI is getting hotter
51 点
作者
che_shr_cat
超过 1 年前
5 条评论
20
Training LLMs with AMD GPUs on Frontier Supercomputer
1 点
作者
che_shr_cat
超过 1 年前
暂无评论
21
Beyond Chinchilla-Optimal Accounting for Inference in Language Model Scaling Law
1 点
作者
che_shr_cat
超过 1 年前
暂无评论
22
Project CETI
2 点
作者
che_shr_cat
超过 1 年前
暂无评论
23
GonzoML on Mamba and S6 (+previous post on S4)
1 点
作者
che_shr_cat
超过 1 年前
暂无评论
24
Conway's Game of Life Is Omniperiodic
2 点
作者
che_shr_cat
超过 1 年前
1 comment
25
GonzoML on Gemini
2 点
作者
che_shr_cat
超过 1 年前
暂无评论
26
Matryoshka Representation Learning
2 点
作者
che_shr_cat
超过 1 年前
暂无评论
← 上一页
下一页 →