Re: deepspeech-sk :: Remember, remember, the velvet November


node:	Re: deepspeech-sk
template:	4
parent:	deepspeech-sk
owner:	DrZak
viewed by:
created:	20.10.2022 - 23:00:46

cwbe coordinatez:
101
63533
8446046
9011786
9012010

ABSOLUT
KYBERIA

permissions
you:	r,
system:	public
net:	yes

Co je potrebne, aby tieto tooly vedeli proste trafit 90+ % slov a fungovat ako presny-ish translator jazykov - aj takych komplikovanejsich? Je to iba o hrubej vypocetnej sile?

000001010006353308446046090117860901201009015001

Za Speech-to-text:
Hrubú silu + veľa pamäte na ktorej to bude bežať + veľmi veľa zozbieraných dát (audio + textový prepis) na ktorých vytrénuješ ten jazykový model + každý rok vychádzajú vylepšené software ktoré vedia lepšie používať a rozoznávať jazyky.

90+ % už existuje, má ho google, pokiaľ viem má teraz 94% pre dobre pokrytý jazyk akým je angličtina.

Ale vždy môže prísť niekto kto rozpráva nárečím alebo slangom na ktoré tie modely natrénované nie sú, a program mu nebude rozumieť, tak ako by mu nerozumel ani bežný človek, a porozumie až sa to naučí.

00000101000635330844604609011786090120100901500109015796

mňa by zaujímalo, ako si takéto modely vedia poradiť napr. s prízvukmi v rámci angličtiny, aj tých bežne používaných je viac

×÷ßßß$ˇ~[☼◙ş→☻ü84ó♀ÇüŮń§►♫☺♀♂ć☺<\ˇ

0000010100063533084460460901178609012010090150010901579609015887

No je to zasa tak isto. Ak ich trénuješ na tých prízvukoch, tak sú v tom lepšie. Ale tých dát na trénovanie je málo, lebo nie sú také bežné.
Takže úspešnosť rozoznania slov s prízvukom je trochu nižšia.

Ale keďže google má veľa peňazí, veľa dát atď. takže je dosť pravdepodobné že zahrnul nahrávky s prízvukmi do svojej testovacej sady a rozozná ich celkom dobre.

000001010006353308446046090117860901201009012167

pokial vies ake slova mozes ocakavat tak mozes dosiahnut velmi velmi dobre vysledky za pouzitia specifickeho tzv. language modelu (nazyva sa aj "scorer") ktory pokryva danu slovnu zasobu

pokial nevies ake slova ocakavat tak je to trochu tazsie, tam potrebujes co najviac co najrozmanitejsich dat + nejaky ten vypocetny vykon na vytrenovanie modelu

ale toho vykonu nemusi byt ani vela ked vychadzas z modelov ktore uz existuju a robis tzv. "fine-tuning"