– Kodėl lietuvių kalba dirbtiniam intelektui yra gerokai sunkiau įkandama nei, pavyzdžiui, anglų?
– Tam yra dvi pagrindinės priežastys. Pirmiausia, pati lietuvių kalba yra sudėtingesnė ir archajiškesnė – turi daug galūnių, linksnių, formų. Antroji priežastis – lietuviškai kalba gerokai mažiau žmonių, todėl turime mažiau kalbinių išteklių, t. y., duomenų. Palyginus su anglų kalba, skirtumas milžiniškas – tiek kalbėtojų skaičiumi, tiek surinktų kalbos pavyzdžių kiekiu.
– Minite, kad trūksta apie tūkstančio valandų balso įrašų. Ką tai iš esmės pakeistų?
– Iš tikrųjų siekiame ne tūkstančio, o 10 tūkstančių valandų – tai būtų vadinamasis didysis lietuvių kalbos garsynas. Toks kiekis leistų lietuvių kalbai patekti į vidutiniškai gerai duomenimis aprūpintų Europos kalbų grupę. Su didžiosiomis kalbomis, tokiomis kaip anglų ar vokiečių, dar kurį laiką konkuruoti negalėsime, tačiau kokybinis šuolis būtų labai reikšmingas.
Visas LNK reportažas – vaizdo įraše:
– Kas sudaro tuos balso įrašus – ar tai dialogai, ar skaitomas tekstas?
– Garsyną sudaro įvairūs įrašai. Yra skaitomo teksto įrašai, taip pat spontaninė šneka, pavyzdžiui, radijo ar televizijos laidos. Garsyną galima palyginti su žodynu: žodynas kaupia žodžius, o garsynas – garsus. Tačiau svarbu ne tik įrašyti garsą, bet ir jį suanotuoti, t. y., tiksliai susieti garsą su tekstu laiko skalėje.
– Kam reikalinga ta anotacija?
– Ji leidžia dirbtiniam intelektui suprasti ryšį tarp garso ir teksto. Tuomet sistema gali ir paversti garsą tekstu, ir tekstą garsu. Be šio susiejimo kalbos technologijos tiesiog neveiktų.
– Kokių balsų šiuo metu trūksta labiausiai?
– Šiuo metu labiausiai trūksta trijų grupių balsų: berniukų iki 14 metų, vyrų nuo 55 metų ir vyresnių bei moterų nuo 75 metų. Garsynas turi būti subalansuotas, kad dirbtinis intelektas galėtų atpažinti skirtingo amžiaus žmonių kalbą.
Jei kalbos technologijos nebus prieinamos visiems, jos neturės ilgalaikės vertės.
– Kaip žmonės gali prisidėti prie garsyno kūrimo?
– Prisidėti labai paprasta – tereikia apsilankyti svetainėje kurkgarsyna.lt ir įrašyti savo balsą. Įrašai daromi trumpais segmentais, todėl nereikia skirti daug laiko iš karto.
– Kas galėtų motyvuoti žmones dalyvauti ir kaip užtikrinamas anonimiškumas?
– Svarbiausia motyvacija – skaitmeninė įtrauktis. Jei kalbos technologijos nebus prieinamos visiems, jos neturės ilgalaikės vertės. Balsai naudojami tik technologijų mokymui, jie nėra skirti asmenų atpažinimui. Duomenys tvarkomi taip, kad būtų užtikrintas privatumas.
– Kiek laiko reikia skirti įrašams ir ar būtina speciali įranga?
– Specialios įrangos nereikia – pakanka telefono. Svarbu tik pasirinkti ramią aplinką. Įrašinėti galima tada, kai patogu: po vakarienės, namuose, net kartu su šeimos nariais. Tai paprasta ir lengvai prieinama savanorystės forma.
Naujausi komentarai