Automatická identifikace jazyka

29. prosinec 2005
Trendy

Brněnská vědecká skupina Speech@FIT získala na mezinárodní soutěži ve Spojených státech významné ocenění. Se systémem pro automatickou identifikaci jazyka byla skupina nejlepší ve dvou ze tří kategorií. Soutěže se zúčastnilo celkem 12 průmyslových i akademických labaratoří z celého světa. Od Pavla Matějky, autorem systému jsme se dověděli další informace.

Matějka: Naše skupina je aktivní zhruba 5 let, postupně jsme získávali informace a zkušenosti, nyní začínáme být aktivní v identifikaci jazyků, odchytávání neznámých slov, přepisu řeči do textu, zatím v angličtinu, ale také jsme už začali s češtinou.

Říká Pavel Matějka, člen skupiny Speach@FIT. V minulých týdnech dosáhla tato skupina brněnských vědců významného úspěchu v mezinárodní soutěži ve Spojených státech.

Matějka: Tato soutěž je o identifikaci jazyků, kde máme z daného řečového segmentu určit o jaký jazyk jde. Měli jsme rozhodovat mezi 7 jazyky, přičemž jsme byli druzí v primárním úkolu, to byly 30 sekundové úseky řeči a první v úsecích 10 a 3 sekundových.

Během dvou týdnů museli brněnští vědci analyzovat celkem 12 tisíc vzorků. Většinou šlo o telefonáty z pevné linky, mobilních telefonů či automatů na ulici.

Matějka: Na úsecích řeči dlouhých 30 sekund jsme dosáhli 95 procent úspěšnosti. Dá se říci, že od 3 sekund jsme schopní rozpoznávat s pravděpodobností 70 procent, ale čím je nahrávka delší, tím počet procent stoupá.

Tato technologie se dá využít v několika směrech, v komerční sféře například pro přepínání hovorů na operátory v call centrech, tísňová čísla a podobně. Hlavní využití je v bezpečnostní sféře.

autor: Saskia Mišová
Spustit audio

Více z pořadu