TE
科技回声
首页
24小时热榜
最新
最佳
问答
展示
工作
中文
GitHub
Twitter
返回个人资料
veryluckyxyz 的提交内容
1
Model Merging in Pre-Training of Large Language Models
2 点
作者
veryluckyxyz
2 天前
暂无评论
2
Understanding Perception and Reasoning Through Model Merging
2 点
作者
veryluckyxyz
8 天前
暂无评论
3
Building and better understanding vision-language models (2024)
2 点
作者
veryluckyxyz
12 天前
暂无评论
4
HF smolagents computer-agent demo
1 点
作者
veryluckyxyz
15 天前
暂无评论
5
Do Reasoning Models Show Better Verbalized Calibration?
2 点
作者
veryluckyxyz
大约 1 个月前
暂无评论
6
Robustly identifying concepts introduced during chat fine-tuning with crosscoder
6 点
作者
veryluckyxyz
大约 1 个月前
暂无评论
7
Retrieval with Learned Similarities
3 点
作者
veryluckyxyz
2 个月前
暂无评论
8
The Curse of Depth in Large Language Models
1 点
作者
veryluckyxyz
2 个月前
暂无评论
9
Looking Back at Speculative Decoding
36 点
作者
veryluckyxyz
3 个月前
5 条评论
10
Long-Context GRPO
60 点
作者
veryluckyxyz
3 个月前
22 条评论
11
HippoRAG: Neurobiologically Inspired Long-Term Memory for LLMs (2024)
65 点
作者
veryluckyxyz
3 个月前
4 条评论
12
Learning to Plan and Reason for Evaluation with Thinking-LLM-as-a-Judge
1 点
作者
veryluckyxyz
4 个月前
暂无评论
13
Process Reinforcement Through Implicit Rewards
1 点
作者
veryluckyxyz
5 个月前
暂无评论
14
Explaining Large Language Models Decisions Using Shapley Values
89 点
作者
veryluckyxyz
5 个月前
19 条评论
15
Phi-4 Technical Report
2 点
作者
veryluckyxyz
5 个月前
暂无评论
16
Alignment Faking in LLMs [pdf]
2 点
作者
veryluckyxyz
5 个月前
1 comment
17
What Makes Rotary Positional Encodings Useful?
1 点
作者
veryluckyxyz
6 个月前
暂无评论
18
Rethinking Softmax: Self-Attention with Polynomial Activations
2 点
作者
veryluckyxyz
7 个月前
暂无评论
19
Post-Training Layer Scaling Prevents Forgetting and Enhances Model Merging
1 点
作者
veryluckyxyz
7 个月前
暂无评论
20
Random Matrix Theory in Machine Learning Tutorial
2 点
作者
veryluckyxyz
8 个月前
暂无评论
21
Rerankers: A Lightweight Python Library to Unify Ranking Methods
1 点
作者
veryluckyxyz
8 个月前
暂无评论
22
Double Descent Demystified
1 点
作者
veryluckyxyz
8 个月前
暂无评论
23
Synthetic Continued Pretraining
3 点
作者
veryluckyxyz
8 个月前
暂无评论
24
Bright: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval
1 点
作者
veryluckyxyz
10 个月前
暂无评论
25
Artificial needles to real haystacks: Improving retrieval capabilities in LLMs
101 点
作者
veryluckyxyz
11 个月前
21 条评论
26
From Decoding to Meta-Generation: (LLMs)
2 点
作者
veryluckyxyz
11 个月前
暂无评论
27
Warp: On the Benefits of Weight Averaged Rewarded Policies
2 点
作者
veryluckyxyz
11 个月前
暂无评论
28
Experiments in Weak-to-Strong Generalization
1 点
作者
veryluckyxyz
11 个月前
暂无评论
29
NV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Models
3 点
作者
veryluckyxyz
12 个月前
暂无评论
← 上一页
下一页 →