Osnovni cilj AlfaNum tima je da učvrsti lidersku poziciju u razvoju kvalitetnih govornih tehnologija za većinu južnoslovenskih jezika i njihovih primena na Balkanu. Glavne aktivnosti AlfaNum-a su:
• Razvoj visoko kvalitetnog i još naprednijeg sintetizatora govora na osnovu teksta (TTS)
• Razvoj automatskog prepoznavanja govora (ASR) na velikim rečnicima
• Razvoj sistema za identifikaciju i verifikaciju govornika
• Istraživanje i razvoj prepoznavanja emocija u govoru
• Razvoj modula za obradu prirodnog jezika uključujući i upravljanje dijalogom
• Primene razvijenih govornih tehnologija u zemljama zapadnog Balkana:
• u multimodalnim sistemima za dijalog čovek-mašina (interaktivni govorni sistemi, pametni telefoni, pametne kuće,...)
• u aplikacijama kao što su: čitanje teksta, diktiranje teksta, transkripcija govora
• kao asistivne tehnologije: pomagala za osobe sa oštećenjem vida, govora ili sluha
Prezime i ime | Matična institucija | |
---|---|---|
Delić Vlado | vdelic@uns.ac.rs | Fakultet tehničkih nauka u Novom Sadu |
• “AlfaNum” je već razvio ASR za male i srednje rečnike (AlfaNumASR), kao i veoma kvalitetan TTS za srpski,
hrvatski i makedonski (AlfaNumTTS).
• Vredni govorni i jezički resursi za srpski i srodne južnoslovenske jezike su kreirani u okviru nekoliko projekata
u poslednjoj deceniji. Pored tih resursa, određeni ekspertski sistemi i sistemi za mašinsko učenje, kao i
odgovarajući matematički modeli, razvijeni su i primenjeni u prvim proizvodima na bazi govornih tehnologija
u Srbiji, Hrvatskoj, Bosni i Hercegovini, Crnoj Gori i Makedoniji - to su države u kojima se dominantno govore
srodni južnoslovenski jezici. Na primer, prvi web sajtovi pomoću AlfaNumTTS sintetizatora govora iz teksta
omogućuju posetiocima da preko računara ili pametnog telefona preslušavaju napisane vesti (nekoliko javnih
medijskih servisa (RTS, RTV), eUprava, desetak opština). Slepi i slabovidi korisnici računara mogu da čuju bilo
koji tekst prikazan na ekranu pomoću anReadera (AlfaNumTTS). AlfaNumASR i AlfaNumTTS komponente
omogućile su i na pametnim telefonima korišćenje osnovnih funkcionalnosti sintetizovanja (generisanja)
govora i prepoznavanja (razumevanja) govora na srpskom.
• Dalji razvoj prepoznavanja kontinualnog govora iz velikih rečnika, kao i naprednijeg i fleksibilnijeg sintetizatora
govora, bazira se na pomenutim govornim i jezičkim resursima. Unapređene govorne tehnologije omogućiće
znatno širu primenu kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije – između
čoveka i mašina.
Naziv projekta | Tip projekta |
---|---|
COST Action 2102 – “Cross-Modal Analysis of Verbal and Non-Verbal Communication” | Međunarodni |
COST Action IC1207 – “PARSEME: PARSing and Multi-word Expressions.” | Međunarodni |
EUREKA Σ!3864 – “ iTEMA: Intelligent Telephone E-mail Access” | Međunarodni |
EUREKA Σ!4965 – “TESTED: TExt-to-Speech Technology for Embedded Devices” | Međunarodni |
EUREKA Σ!8719 – “ S-VERIFY: Advanced Speaker Verification” | Međunarodni |
Naziv | Tip |
---|---|
ege | Koncept |
• Delić V, Sečujski M, Jakovljević N, Janev M, Obradović R, Pekar D. (2010) “Speech Technologies for Serbian and Kindred South Slavic Languages”, In Advances in Speech Recognition, N. Shabtai (Ed.), SCIYO, pp. 141-164.
• Popović B, Janev M, Pekar D, Jakovljević N, Gnjatović M, Sečujski M, Delić V. (2012) “A Novel Split-and-Merge Algorithm for Hierarchical Clustering of Gaussian Mixture Models”, Applied Intelligence, ISSN: 0924-669X, Springer-Verlag New York, Inc., Vol. 37, No. 3, pp. 377-389, DOI: 10.1007/s10489-011-0333-9
• Gnjatović M, Janev M, Delić V. (2012) “Focus Tree: Modeling Attentional Information in Task-Oriented Human-Machine Interaction”, Applied Intelligence, ISSN: 0924-669X, Springer-Verlag New York, Inc., Vol. 37, No. 3, pp. 305-320, DOI: 10.1007/s10489-011-0329-5
• Delić V, Bojanić M, Gnjatović M, Sečujski M, Jovičić S. (2012) “Discrimination Capability of Prosodic and Spectral Features for Emotional Speech Recognition”, Electronics and Electrical
Engineering, ISSN 1392-1215, Vol. 18, No. 9, pp. 51-54, DOI:10.5755/j01. eee.18.9.2806.
• Jakovljević N, Mišković D, Janev M, Sečujski M, Delić V. (2013) “Comparison of Linear Discriminant Analysis Approaches in Automatic Speech Recognition”, Electronics and Electrical Engineering, ISSN 1392-1215 (in press).