TE
科技回声
首页
24小时热榜
最新
最佳
问答
展示
工作
中文
GitHub
Twitter
返回个人资料
xcodevn 的提交内容
1
Implementing DeepSeek R1's GRPO algorithm from scratch
192 点
作者
xcodevn
大约 1 个月前
3 条评论
2
The LLM pre-training data wall
2 点
作者
xcodevn
6 个月前
暂无评论
3
PodcastLM: An open-source AI podcast creator
3 点
作者
xcodevn
6 个月前
暂无评论
4
Scaling up self-attention inference
1 点
作者
xcodevn
8 个月前
暂无评论
5
Scaling up self-attention inference
1 点
作者
xcodevn
8 个月前
暂无评论
6
Letter from Professors Bengio, Hinton, Lessig, & Russell
2 点
作者
xcodevn
9 个月前
暂无评论
7
Logit Prisms: Decomposing Transformer Outputs for Mechanistic Interpretability
49 点
作者
xcodevn
11 个月前
8 条评论
8
Exploring MLP neurons inside Llama3 model
3 点
作者
xcodevn
11 个月前
1 comment
← 上一页
下一页 →