TE
科技回声
首页
24小时热榜
最新
最佳
问答
展示
工作
中文
GitHub
Twitter
返回个人资料
veryluckyxyz 的提交内容
1
A Case Study in CUDA Kernel Fusion
1 点
作者
veryluckyxyz
12 个月前
暂无评论
2
Lessons from the trenches on reproducible evaluation of language models
42 点
作者
veryluckyxyz
12 个月前
3 条评论
3
Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet
2 点
作者
veryluckyxyz
大约 1 年前
暂无评论
4
Zero-Shot Tokenizer Transfer
2 点
作者
veryluckyxyz
大约 1 年前
暂无评论
5
An Empirical Model of Large-Batch Training
2 点
作者
veryluckyxyz
大约 1 年前
暂无评论
6
Gradient Diversity: A Key Ingredient for Scalable Distributed Learning
3 点
作者
veryluckyxyz
大约 1 年前
暂无评论
7
Arctic-Embed: Scalable, Efficient, and Accurate Text Embedding Models
1 点
作者
veryluckyxyz
大约 1 年前
暂无评论
8
Automatically Detecting Under-Trained Tokens in Large Language Models
182 点
作者
veryluckyxyz
大约 1 年前
26 条评论
9
Large Language Models for Data Annotation: A Survey
2 点
作者
veryluckyxyz
大约 1 年前
暂无评论
10
Refusal in LLMs is mediated by a single direction
110 点
作者
veryluckyxyz
大约 1 年前
20 条评论
11
Automated Multi Agent Chat
2 点
作者
veryluckyxyz
大约 1 年前
暂无评论
12
Orca: A Distributed Serving System for Transformer-Based Generative Models
3 点
作者
veryluckyxyz
大约 1 年前
1 comment
13
Understanding Emergent Abilities of Language Models from the Loss Perspective
2 点
作者
veryluckyxyz
大约 1 年前
1 comment
14
LoRA+: Efficient Low Rank Adaptation of Large Models
181 点
作者
veryluckyxyz
大约 1 年前
47 条评论
15
Does Transformer Interpretability Transfer to RNNs?
3 点
作者
veryluckyxyz
大约 1 年前
暂无评论
16
MiniCPM: Potential of Small Language Models W Scalable Training Strategies
2 点
作者
veryluckyxyz
大约 1 年前
暂无评论
17
Building BerkeleyDB
2 点
作者
veryluckyxyz
大约 1 年前
暂无评论
18
Rotational Equilibrium: How Weight Decay Balances Learning Across NeuralNetworks
2 点
作者
veryluckyxyz
大约 1 年前
暂无评论
19
Dynamic Memory Compression: Retrofitting LLMs for Accelerated Inference
3 点
作者
veryluckyxyz
大约 1 年前
暂无评论
20
Bad arguments against a universal basic income
6 点
作者
veryluckyxyz
将近 9 年前
3 条评论
← 上一页
下一页 →