КУЛЬТУРНІ ВИКЛИКИ В УСНОМУ ПЕРЕКЛАДІ ІЗ ЗАСТОСУВАННЯМ ШТУЧНОГО ІНТЕЛЕКТУ
DOI:
https://doi.org/10.32782/2410-0927-2025-23-17Ключові слова:
усний переклад штучним інтелектом, S2ST (Speech-to-Speech Translation), культурні виміри, модель Хофстеде, прагматична корекція, прагматична еквівалентність, індекс дистанції влади (PDIScore), соціальна прийнятність, просодична адаптація, адаптивний каскадАнотація
Основна мета статті – розглянути обмеження сучасних систем штучного інтелекту для усного перекладу (S2S) у відображенні культурних та прагматичних нюансів. У статті підкреслюється, що перекладачі на основі штучного інтелекту часто не в змозі розпізнати тонкі емоційні сигнали, соціальну динаміку та культурний контекст, що призводить до непорозумінь, відчуження або сприйняття нещирості. Методологія передбачає аналіз існуючих архітектур та пропозицію вдосконаленої адаптивної каскадної архітектури, яка інтегрує такі модулі, як прагматична корекція (PCM) та контроль тону і стилю (TCS). Ці модулі тренуються за допомогою підкріплювального навчання з людським зворотним зв’язком, щоб забезпечити динамічну соціолінгвістичну адаптацію з урахуванням культурних вимірів, таких як модель Хофстеде, та соціальних параметрів, таких як індекс дистанції влади (PDI) та індивідуалізм/колективізм (IDV). Наукова новизна полягає в систематичному включенні соціолінгвістичних показників, таких як прагматична адекватність та соціальна прийнятність, що виходять за межі традиційної лексичної точності. Такий підхід акцентує увагу на моделюванні соціальних параметрів та розробці наборів даних з анотаціями культурних та емоційних метаданих для поліпшення якості усного перекладу. Автори наголошують, що для досягнення справді ефективного міжкультурного перекладу за допомогою штучного інтелекту необхідно вийти за межі статичних моделей і лексичних показників і перейти до динамічних, контекстно-орієнтованих систем, що враховують соціолінгвістичні особливості. У статті також висвітлюється потенціал цих систем для поліпшення дипломатичної комунікації та міжнародної співпраці шляхом зменшення непорозумінь. Дослідники акцентують на необхідності проведення міждисциплінарних досліджень, що поєднують лінгвістику, штучний інтелект і культурологію, для створення більш коректних і етично відповідальних інструментів перекладу. Наголошується на важливості реальних тестів в різних культурних середовищах для перевірки ефективності пропонованих моделей. Це може значно поліпшити глобальну комунікацію, сприяючи більшому взаєморозумінню та повазі між різними культурами. Інтеграція культурних аспектів в усниий переклад за допомогою штучного інтелекту може допомогти запобігти культурній нечутливості та сприяти міжкультурному обміну.
Посилання
Al-Rubaie A., Ahmad S. The Impact of Hofstede’s Cultural Dimensions on UX/UI Design for Global AI Applications: A Review of Emerging Trends. International Journal of Human-Computer Studies. 2024. Vol. 181. Article 103045.
Austin J. L. How to Do Things with Words. 2nd ed. Harvard University Press, 1975. 168 p.
Chen M., Chen Z., Chen J. Scaling Speech-to-Speech Translation to Large Language Models: A Unified Framework for Multimodal Pragmatic Adaptation. Transactions on Audio, Speech, and Language Processing. 2024. Vol. 33. P. 150–165.
Cui L., Hu J. Reinforcement Learning for Dialogue Management: A Reward Model Based on User Satisfaction and Trust. IEEE Transactions on Audio, Speech, and Language Processing. 2024. Vol. 32. P. 1200–1215.
Gao S., Li Y., Liu Z. Addressing Social Bias and Stereotypes in Neural Machine Translation via Reinforcement Learning with Human Feedback (RLHF) for Politeness. Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL). Toronto: ACL, 2023. P. 7821–7835.
Graham Y. A Cursory Analysis of the Curation of the BLEU Metric. Proceedings of the 10th Workshop on Statistical Machine Translation (WMT). Lisbon: ACL, 2015. P. 280–288.
Hall E. T. Beyond Culture. Anchor Books, 1976. 298 p.
Hofstede G. Culture’s Consequences: Comparing Values, Behaviors, Institutions and Organizations Across Nations. 2nd ed. SAGE Publications, 2001. 616 p.
Kripalani A., Zhang W. Mitigating Sociocultural Bias in Large Language Models through Cross-Cultural Prompting. Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL). Toronto: ACL, 2023. P. 4421–4435.
Lee H. G., Kim D. Y. A model for the cultural adaptation of interface design: The case of the Korean Web. Interacting with Computers. 2000. Vol. 12, no. 5. P. 459–475.
Lee K., Nagao M. Modeling Politeness and Social Status in Neural Machine Translation: A Korean-Japanese Case Study. Computational Linguistics. 2018. Vol. 44, no. 4. P. 857–883.
Ponti E. M., Liska R., Waseem Z. On the Inadequacy of Current Evaluation Metrics for Cross-Lingual Pragmatic Tasks. Computational Linguistics. 2023. Vol. 49, no. 2. P. 301–320.
Rubin P., Cappe S. Prosody and Perception: Cultural Variation in the Expression and Interpretation of Emotion in Speech Synthesis. Speech Communication. 2020. Vol. 125. P. 1–11.
Seleskovitch D. Interpréter pour traduire. Didier Érudition, 1984. 308 p.
Searle J. R. Expression and Meaning: Studies in the Theory of Speech Acts. Cambridge University Press, 1979. 187 p.
Watanabe H., Shindo H. Cross-Cultural Communication in S2ST: Bridging the Gap between Prosody and Illocutionary Act. Interspeech 2022, Proceedings of the 23rd Annual Conference of the International Speech Communication Association. Interspeech, 2022. P. 1980–1984.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.





