TE
科技回声
首页24小时热榜最新最佳问答展示工作
GitHubTwitter
首页

科技回声

基于 Next.js 构建的科技新闻平台,提供全球科技新闻和讨论内容。

GitHubTwitter

首页

首页最新最佳问答展示工作

资源链接

HackerNews API原版 HackerNewsNext.js

© 2025 科技回声. 版权所有。

cerebras: 450 tokens/sec llama 3.1 70B

7 点作者 davidfiala9 个月前

2 条评论

IronWolve9 个月前
Cerebras fails the &quot;how many r&#x27;s in strawberry&quot; test. Grok is the only one who passed that test.<p>Going to be interesting to see the speed and accuracy keep increasing, cant imagine how fast&#x2F;accurate things will be in a decade. Cant wait.
davidfiala9 个月前
- 1,800tps on llama 3.1 8B<p>- 450tps on llama 3.1 70B<p>free chat interface is at: <a href="https:&#x2F;&#x2F;inference.cerebras.ai" rel="nofollow">https:&#x2F;&#x2F;inference.cerebras.ai</a> (requires login)