首页 24小时热榜最新最佳问答展示工作

返回个人资料

veryluckyxyz 的提交内容

科技回声

基于 Next.js 构建的科技新闻平台，提供全球科技新闻和讨论内容。

首页

首页最新最佳问答展示工作

资源链接

HackerNews API 原版 HackerNews Next.js

© 2025 科技回声. 版权所有。

1

Model Merging in Pre-Training of Large Language Models

2 点作者 veryluckyxyz2 天前

2

Understanding Perception and Reasoning Through Model Merging

2 点作者 veryluckyxyz8 天前

3

Building and better understanding vision-language models (2024)

2 点作者 veryluckyxyz12 天前

4

HF smolagents computer-agent demo

1 点作者 veryluckyxyz15 天前

5

Do Reasoning Models Show Better Verbalized Calibration?

2 点作者 veryluckyxyz大约 1 个月前

6

Robustly identifying concepts introduced during chat fine-tuning with crosscoder

6 点作者 veryluckyxyz大约 1 个月前

7

Retrieval with Learned Similarities

3 点作者 veryluckyxyz2 个月前

8

The Curse of Depth in Large Language Models

1 点作者 veryluckyxyz2 个月前

9

Looking Back at Speculative Decoding

36 点作者 veryluckyxyz3 个月前

10

Long-Context GRPO

60 点作者 veryluckyxyz3 个月前

11

HippoRAG: Neurobiologically Inspired Long-Term Memory for LLMs (2024)

65 点作者 veryluckyxyz3 个月前

12

Learning to Plan and Reason for Evaluation with Thinking-LLM-as-a-Judge

1 点作者 veryluckyxyz4 个月前

13

Process Reinforcement Through Implicit Rewards

1 点作者 veryluckyxyz5 个月前

14

Explaining Large Language Models Decisions Using Shapley Values

89 点作者 veryluckyxyz5 个月前

15

Phi-4 Technical Report

2 点作者 veryluckyxyz5 个月前

16

Alignment Faking in LLMs [pdf]

2 点作者 veryluckyxyz5 个月前

17

What Makes Rotary Positional Encodings Useful?

1 点作者 veryluckyxyz6 个月前

18

Rethinking Softmax: Self-Attention with Polynomial Activations

2 点作者 veryluckyxyz7 个月前

19

Post-Training Layer Scaling Prevents Forgetting and Enhances Model Merging

1 点作者 veryluckyxyz7 个月前

20

Random Matrix Theory in Machine Learning Tutorial

2 点作者 veryluckyxyz8 个月前

21

Rerankers: A Lightweight Python Library to Unify Ranking Methods

1 点作者 veryluckyxyz8 个月前

22

Double Descent Demystified

1 点作者 veryluckyxyz8 个月前

23

Synthetic Continued Pretraining

3 点作者 veryluckyxyz8 个月前

24

Bright: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval

1 点作者 veryluckyxyz10 个月前

25

Artificial needles to real haystacks: Improving retrieval capabilities in LLMs

101 点作者 veryluckyxyz11 个月前

26

From Decoding to Meta-Generation: (LLMs)

2 点作者 veryluckyxyz11 个月前

27

Warp: On the Benefits of Weight Averaged Rewarded Policies

2 点作者 veryluckyxyz11 个月前

28

Experiments in Weak-to-Strong Generalization

1 点作者 veryluckyxyz11 个月前

29

NV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Models

3 点作者 veryluckyxyz12 个月前

← 上一页