total descendants::0 total children::0 1 ❤️ |
na https://voice.mozilla.org/en/data je fajn multiGB dataset, a tiez je tam par zaujimavych linkov na externe veci, Librispeech ( https://www.openslr.org/12 ) a Voxforge ( http://www.repository.voxforge1.org/downloads/SpeechCorpus/Trunk/ ) uz som poznal, ale aj to TED-lium vyzera fajne (54GB!!!) hlavne mi vsak urobil radost ten tatoeba project https://tatoeba.org/eng/downloads , pretoze je 1) viacjazycny (napr. pre nemcinu je tam > 16 tisic nahravok) 2) sentence-based (t.j. co nahravka, to veta ... a to je takmer uplne idealna situacia pre trenovanie TTS / ASR systemov) |
| |||||||||||||||||||||||