TE
科技回声
首页
24小时热榜
最新
最佳
问答
展示
工作
中文
GitHub
Twitter
首页
Unpacking the HF in RLHF
4 点
作者
jbcranshaw
大约 2 年前
1 comment
jbcranshaw
大约 2 年前
Collapse
Some observations on a few ways different people actually gather feedback from humans in practice to improve LLMs. Sure I've missed some here, so let me know.
评论 #35087174 未加载