АКУСТИКО-ФОНЕТИЧНІ АСПЕКТИ МОДЕЛЮВАННЯ КОМУНІКАЦІЇ ЛЮДИНИ Й КОМП’ЮТЕРА

Ірина Біскуб

Автор(и)

Ірина Біскуб

Ключові слова:

мовлення, автоматичний синтез мовлення, розпізнавання мовлення, комунікація, фонетика, діалог

Анотація

Проаналізовано основні підходи до моделювання мовленнєвої комунікації людини й комп’ютера шляхом інтегрування технологій синтезу та розпізнавання мовлення в інтерфейси програмного забезпечення. Розглянуто особливості сучасних автоматичних діалогових систем, які поєднують у собі функції синтезу та розпізнавання мовлення, а також містять моделі знань, необхідні для розгортання релевантного діалогу між людиною й комп’ютером. Систематизовано чинники, що спричиняють додаткові складнощі під час автоматичного синтезу та аналізу мовлення. Запропоновано концептуальну схему акустико-фонетичного аналізу зв’язного мовлення, що інтегрується у загальну систему автоматичного розпізнавання. Проаналізовано компоненти типової діалогової система, що складається з таких частин: фонетичного аналізатора, детектора фонетичних слів, детектора акустичних слів, синтаксичного аналізатора, інтерпретатора аналізу, програми просодичної сегментації, програми фонетико-орфографічної транскрипції, генератора мовлення, діалогового автомату. Окреслено способи підвищення ефективності автоматичного розпізнавання мовлення шляхом використання досягнень сучасної сигнальної фонетики, яка намагається встановити та описати зв’язки між одиницями мовлення й певними класами матеріальних реалізацій у формі сигналів, що можуть бути акустично виміряні.

Посилання

Біскуб І. П. Англомовний дискурс програмного забезпечення як модель мовленнєвої взаємодії людини й комп’ютера : монографія / І. П. Біскуб. – Луцьк : Волин. нац. ун-т ім. Лесі Українки, 2009. – 388 с.

Вейценбаум Дж. Возможности вычислительных машин и человеческий разум: от суждений к вычислениям / Дж. Вейценбаум. – М. : Радио и связь, 1982. – 368 с.

Потапова Р. К. Введение в лингвокибернетику / Р. К. Потапова. – М. : Изд-во Моск. гос. лингв. ун-та, 1990. – 140 с.

Beale R. NeuralNetworks and Pattern Recognition in Human-computer Interaction / R. Beale, J. Finlay. – N. Y. : Ellis Horwood, 1992. – 386 p.

Bennacef S. An Oral Dialogue Model Based on Speech Acts Categorization, Workshop on Spoken Dialogue Systems / S. Bennacef, F. Nйel, H. Bonneau-Maynard // ESCA Workshop on Spoken Dialogue Systems. – 1995. – P. 237–240.

Carpenter B. Human versus machine: psycholinguistics meets ASR / B. Carpenter // Proceedings of the IEEE Workshop on Automatic Speech Recognition and Understanding. – Keystone, CO., 1999. – P. 225–228.

Cutler A. Response time as a metric for comparison of speech recognition by humans and machines / A. Cutler, T. Robinson // Proceedings of ICSLP. – Banff, Canada, 1992. – P. 189–192.

Dusan S. On integrating insights from human speech recognition into automatic speech recognition / S. Dusan, L. R. Rabiner // Proceedings of Interspeech. – Lisabon, Portugal, 2005. – P. 1233–1236.

Fink J. Personalised hypermedia information through adaptive and adaptable system features: User modeling, privacy and security issues / J. Fink, A. Kobsa, J. Schreck // Intelligence in Services and Networks: Technology for Cooperative Competition / A. Mullery, M. Besson R. Campolargo, R. Reed (Eds.). – Berlin ; Heidelberg : Springer, 1997. – P. 459–467.

Holmes J. Speech synthesis and recognition / J. Holmes, W. Holmes. – London ; N. Y. : Taylor and Fransis, 2002. – 298 p.

Lippmann R. Speech recognition by machines and humans / R. Lippmann // Speech Communication. – 1997. – No 22 (1). – P. 1–15.

Maier V. Aninvestigation into a simulation of episodic memory for automatic speechrecognition / V. Maier, R. K. Moore // Proceedings ofInterspeech. – Lisbon, Portugal, 2005. – P. 1245–1248.

McGuire T. W. Groupand computer-mediated discussion effects in risk decision making / T. W. McGuire, S. Kiesler, J. Siegel // Journal of Personality and Social Psychology. – 1987. – No 52. – P. 917–930.

Minker W. Speech and Human-Machine Dialog / W. Minker, S. Bennasef. – N. Y. ; Boston ; Dordrecht ; London ; Moscow : Kluwer Academic Publishers, 2004. – 89 p.

Moore R. K. Constraints on theories of human vs. machine recognition of speech / R. K. Moore, A. Cutler // Proceedings of the Workshop on Speech Recognition as Pattern Classification / eds. by R. Smits, J. Kingston, T. M. Nearey, R. Zondervan. – Nijmegen : MPI for Psycholinguistics, 2001. – P. 145–150.

Nass C. Speech interfaces from an evolutionary perspective / C. Nass, L. Gong // Communications of the ACM. – 2000. – No 43 (9). – P. 36–43.

Shi R. Function words in early speech perception / R. Shi, J. Werker, A. Cutler // The proceedings of the 15th International Congress of Phonetic Sciences Casual Products. – Adelaide. – 2003. – [CD-ROM. – 3009–3012].

Weintraub M. Linguistic constraints in hidden Markov model based speech recognition / [M. Weintraub, H. Murveit, M. Cohen, P. Price, J. Bernstein, G. Baldwin, D. Bell ] // Proc. ICASSP_89. – Glasgow, Scotland, May 1989. – P. 699–702.

АКУСТИКО-ФОНЕТИЧНІ АСПЕКТИ МОДЕЛЮВАННЯ КОМУНІКАЦІЇ ЛЮДИНИ Й КОМП’ЮТЕРА

Автор(и)

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

Ліцензія

Статті цього автора (авторів), які найбільше читають

Мова