TE
科技回声
首页24小时热榜最新最佳问答展示工作
GitHubTwitter
首页

科技回声

基于 Next.js 构建的科技新闻平台,提供全球科技新闻和讨论内容。

GitHubTwitter

首页

首页最新最佳问答展示工作

资源链接

HackerNews API原版 HackerNewsNext.js

© 2025 科技回声. 版权所有。

Audio Datasets for Machine Learning

55 点作者 TakakiTohno大约 5 年前

3 条评论

beatle_sauce大约 5 年前
IMHO the speech dataset list is missing other interesting free corpora, e.g. the TEDlium dataset, Voxforge, Common Voice. A more comprehensive (but not complete) list can be found here: <a href="https:&#x2F;&#x2F;github.com&#x2F;kaldi-asr&#x2F;kaldi&#x2F;tree&#x2F;master&#x2F;egs" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;kaldi-asr&#x2F;kaldi&#x2F;tree&#x2F;master&#x2F;egs</a> (download links can be found in the scripts)
sschmitt大约 5 年前
Also see the &quot;Heidelberg Spiking Datasets&quot;: <a href="https:&#x2F;&#x2F;ieee-dataport.org&#x2F;open-access&#x2F;heidelberg-spiking-datasets" rel="nofollow">https:&#x2F;&#x2F;ieee-dataport.org&#x2F;open-access&#x2F;heidelberg-spiking-dat...</a>
MintChocoisEw大约 5 年前
Spoken Wikipedia corpus is especially impressive