Katalog istraživačkog i inovativnog potencijala Univerziteta u Novom Sadu

AlfaNum (Istraživačka grupa)

Fakultet tehničkih nauka u Novom Sadu

www:

Home page

email:

vdelic@uns.ac.rs

Opis delatnosti
Osoblje
Rezultati
Projekti
Resursi
Dostignuća
Reference

Osnovni cilj AlfaNum tima je da učvrsti lidersku poziciju u razvoju kvalitetnih govornih tehnologija za većinu južnoslovenskih jezika i njihovih primena na Balkanu. Glavne aktivnosti AlfaNum-a su:
• Razvoj visoko kvalitetnog i još naprednijeg sintetizatora govora na osnovu teksta (TTS)
• Razvoj automatskog prepoznavanja govora (ASR) na velikim rečnicima
• Razvoj sistema za identifikaciju i verifikaciju govornika
• Istraživanje i razvoj prepoznavanja emocija u govoru
• Razvoj modula za obradu prirodnog jezika uključujući i upravljanje dijalogom
• Primene razvijenih govornih tehnologija u zemljama zapadnog Balkana:
• u multimodalnim sistemima za dijalog čovek-mašina (interaktivni govorni sistemi, pametni telefoni, pametne kuće,...)
• u aplikacijama kao što su: čitanje teksta, diktiranje teksta, transkripcija govora
• kao asistivne tehnologije: pomagala za osobe sa oštećenjem vida, govora ili sluha

Prezime i ime	email	Matična institucija
Delić Vlado	vdelic@uns.ac.rs	Fakultet tehničkih nauka u Novom Sadu

• “AlfaNum” je već razvio ASR za male i srednje rečnike (AlfaNumASR), kao i veoma kvalitetan TTS za srpski,
hrvatski i makedonski (AlfaNumTTS).
• Vredni govorni i jezički resursi za srpski i srodne južnoslovenske jezike su kreirani u okviru nekoliko projekata
u poslednjoj deceniji. Pored tih resursa, određeni ekspertski sistemi i sistemi za mašinsko učenje, kao i
odgovarajući matematički modeli, razvijeni su i primenjeni u prvim proizvodima na bazi govornih tehnologija
u Srbiji, Hrvatskoj, Bosni i Hercegovini, Crnoj Gori i Makedoniji - to su države u kojima se dominantno govore
srodni južnoslovenski jezici. Na primer, prvi web sajtovi pomoću AlfaNumTTS sintetizatora govora iz teksta
omogućuju posetiocima da preko računara ili pametnog telefona preslušavaju napisane vesti (nekoliko javnih
medijskih servisa (RTS, RTV), eUprava, desetak opština). Slepi i slabovidi korisnici računara mogu da čuju bilo
koji tekst prikazan na ekranu pomoću anReadera (AlfaNumTTS). AlfaNumASR i AlfaNumTTS komponente
omogućile su i na pametnim telefonima korišćenje osnovnih funkcionalnosti sintetizovanja (generisanja)
govora i prepoznavanja (razumevanja) govora na srpskom.
• Dalji razvoj prepoznavanja kontinualnog govora iz velikih rečnika, kao i naprednijeg i fleksibilnijeg sintetizatora
govora, bazira se na pomenutim govornim i jezičkim resursima. Unapređene govorne tehnologije omogućiće
znatno širu primenu kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije – između
čoveka i mašina.

Naziv projekta	Tip projekta
COST Action 2102 – “Cross-Modal Analysis of Verbal and Non-Verbal Communication”	Međunarodni
COST Action IC1207 – “PARSEME: PARSing and Multi-word Expressions.”	Međunarodni
EUREKA Σ!3864 – “ iTEMA: Intelligent Telephone E-mail Access”	Međunarodni
EUREKA Σ!4965 – “TESTED: TExt-to-Speech Technology for Embedded Devices”	Međunarodni
EUREKA Σ!8719 – “ S-VERIFY: Advanced Speaker Verification”	Međunarodni

Naziv resursa	Tip
AlfaNumASR – prepoznavanje govora iz manjih i srednjih rečnika na srpskom i srodnim južnoslovenskim jezicima	Diğer
AlfaNumTTS – visoko kvalitetna sinteza govora na osnovu teksta na srpskom, hrvatskom i makedonskom	Specijalizovani softver

Naziv	Tip
ege	Koncept

• Delić V, Sečujski M, Jakovljević N, Janev M, Obradović R, Pekar D. (2010) “Speech Technologies for Serbian and Kindred South Slavic Languages”, In Advances in Speech Recognition, N. Shabtai (Ed.), SCIYO, pp. 141-164.
• Popović B, Janev M, Pekar D, Jakovljević N, Gnjatović M, Sečujski M, Delić V. (2012) “A Novel Split-and-Merge Algorithm for Hierarchical Clustering of Gaussian Mixture Models”, Applied Intelligence, ISSN: 0924-669X, Springer-Verlag New York, Inc., Vol. 37, No. 3, pp. 377-389, DOI: 10.1007/s10489-011-0333-9
• Gnjatović M, Janev M, Delić V. (2012) “Focus Tree: Modeling Attentional Information in Task-Oriented Human-Machine Interaction”, Applied Intelligence, ISSN: 0924-669X, Springer-Verlag New York, Inc., Vol. 37, No. 3, pp. 305-320, DOI: 10.1007/s10489-011-0329-5
• Delić V, Bojanić M, Gnjatović M, Sečujski M, Jovičić S. (2012) “Discrimination Capability of Prosodic and Spectral Features for Emotional Speech Recognition”, Electronics and Electrical
Engineering, ISSN 1392-1215, Vol. 18, No. 9, pp. 51-54, DOI:10.5755/j01. eee.18.9.2806.
• Jakovljević N, Mišković D, Janev M, Sečujski M, Delić V. (2013) “Comparison of Linear Discriminant Analysis Approaches in Automatic Speech Recognition”, Electronics and Electrical Engineering, ISSN 1392-1215 (in press).

Kontakt osoba

Delić Vlado

email:

vdelic@uns.ac.rs

www:

visit page

Adresa:

Trg Dositeja Obradovića 6, 21000 Novi Sad, Srbija

Tel:

+381 21 48 52 533

(FOS2) Engineering and technology

Electrical engineering, electronic engineering, information engineering

Katalog istraživačkog i inovativnog potencijala Univerziteta u Novom Sadu

Kancelarija za poslovnu podršku Univerziteta u Novom Sadu

Katalog istraživačkog i inovativnog potencijala
Univerziteta u Novom Sadu