TE
科技回声
首页24小时热榜最新最佳问答展示工作
GitHubTwitter
首页

科技回声

基于 Next.js 构建的科技新闻平台,提供全球科技新闻和讨论内容。

GitHubTwitter

首页

首页最新最佳问答展示工作

资源链接

HackerNews API原版 HackerNewsNext.js

© 2025 科技回声. 版权所有。

Llama 3.1: Our most capable models to date

27 点作者 langitbiru10 个月前

3 条评论

ChrisArchitect10 个月前
[dupe]<p>More discussion: <a href="https:&#x2F;&#x2F;news.ycombinator.com&#x2F;item?id=41046540">https:&#x2F;&#x2F;news.ycombinator.com&#x2F;item?id=41046540</a><p><a href="https:&#x2F;&#x2F;news.ycombinator.com&#x2F;item?id=41046773">https:&#x2F;&#x2F;news.ycombinator.com&#x2F;item?id=41046773</a>
sagz10 个月前
405B is already being served on WhatsApp!<p><a href="https:&#x2F;&#x2F;ibb.co&#x2F;kQ2tKX5" rel="nofollow">https:&#x2F;&#x2F;ibb.co&#x2F;kQ2tKX5</a>
msoad10 个月前
MMLU PRO is the benchmark I trust the most. I noticed they are using 5 shots and CoT. Is that true for GPT4 and Sonnet as well?