login::
pass::
name::
id::
node:
Re: deepspeech-sk
template:
4
parent:
deepspeech-sk
owner:
DrZak
viewed by:
created:
20.10.2022 - 23:00:46
cwbe coordinatez
:
101
63533
8446046
9011786
9012010
ABSOLUT
K
YBERIA
permissions
you:
r,
system:
public
net:
yes
⠪
neurons
stats
|
by_visit
|
by_K
source
tiamat
K
|
my_K
|
given_K
last
commanders
polls
total descendants::4
total children::2
show[
2
|
3
]
flat
Co je potrebne, aby tieto tooly vedeli proste trafit 90+ % slov a fungovat ako presny-ish translator jazykov - aj takych komplikovanejsich? Je to iba o hrubej vypocetnej sile?
title/content
title
content
user
000001010006353308446046090117860901201009015001
mirex
02.11.2022 - 08:46:50
, level: 1,
UP
NEW
Re[2]: deepspeech-sk
Za Speech-to-text:
Hrubú silu + veľa pamäte na ktorej to bude bežať + veľmi veľa zozbieraných dát (audio + textový prepis) na ktorých vytrénuješ ten jazykový model + každý rok vychádzajú vylepšené software ktoré vedia lepšie používať a rozoznávať jazyky.
90+ % už existuje, má ho google, pokiaľ viem má teraz 94% pre dobre pokrytý jazyk akým je angličtina.
Ale vždy môže prísť niekto kto rozpráva nárečím alebo slangom na ktoré tie modely natrénované nie sú, a program mu nebude rozumieť, tak ako by mu nerozumel ani bežný človek, a porozumie až sa to naučí.
00000101000635330844604609011786090120100901500109015796
kyberbubus
04.11.2022 - 20:53:30
, level: 2,
UP
NEW
Re[3]: deepspeech-sk
mňa by zaujímalo, ako si takéto modely vedia poradiť napr. s prízvukmi v rámci angličtiny, aj tých bežne používaných je viac
×÷ßßß$ˇ~[☼◙ş→☻ü84ó♀ÇüŮń§►♫☺♀♂ć☺<\ˇ
0000010100063533084460460901178609012010090150010901579609015887
mirex
05.11.2022 - 12:57:51
, level: 3,
UP
NEW
Re[4]: deepspeech-sk
No je to zasa tak isto. Ak ich trénuješ na tých prízvukoch, tak sú v tom lepšie. Ale tých dát na trénovanie je málo, lebo nie sú také bežné.
Takže úspešnosť rozoznania slov s prízvukom je trochu nižšia.
Ale keďže google má veľa peňazí, veľa dát atď. takže je dosť pravdepodobné že zahrnul nahrávky s prízvukmi do svojej testovacej sady a rozozná ich celkom dobre.
000001010006353308446046090117860901201009012167
Prospero
21.10.2022 - 12:18:06
, level: 1,
UP
NEW
Re[2]: deepspeech-sk
pokial vies ake slova mozes ocakavat tak mozes dosiahnut velmi velmi dobre vysledky za pouzitia specifickeho tzv. language modelu (nazyva sa aj "scorer") ktory pokryva danu slovnu zasobu
pokial nevies ake slova ocakavat tak je to trochu tazsie, tam potrebujes co najviac co najrozmanitejsich dat + nejaky ten vypocetny vykon na vytrenovanie modelu
ale toho vykonu nemusi byt ani vela ked vychadzas z modelov ktore uz existuju a robis tzv. "fine-tuning"