TE
科技回声
首页
24小时热榜
最新
最佳
问答
展示
工作
中文
GitHub
Twitter
首页
Fast Transformer Decoding: One Write-Head Is All You Need
4 点
作者
hislaziness
将近 2 年前
1 comment
hislaziness
将近 2 年前
A more efficient way to infer with lower memory requirements.