Найдено интересное применение для нецензурной лексики в ИИ

Учёные из Института искусственного интеллекта AIRI, Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ) и Университета Иннополис открыли парадоксальный лингвистический механизм для оптимизации работы нейросетей. В ходе исследования им удалось обучить искусственный интеллект радикально сокращать текстовые данные, заменяя пространные выражения ёмкими эмоциональными аналогами из разряда грубой лексики, при этом корректно сохраняя первоначальную семантику.

Научная работа началась с анализа обработки языковыми моделями разнородного контента. Исследователи обратили внимание на феномен естественной коммуникации: в живой речи одно резкое, экспрессивное слово зачастую способно передать смысловой оттенок целой фразы или даже предложения. Это наблюдение натолкнуло на вопрос: можно ли адаптировать данный принцип для снижения вычислительной нагрузки на ИИ?

Для проверки гипотезы был создан специализированный словарь, устанавливающий соответствия между нейтральными формулировками и их сильносокращёнными, эмоционально окрашенными эквивалентами. Нейросетевую модель затем обучили на этих парах, целенаправленно развивая её способность к сверхплотному семантическому сжатию.

Важный акцент, отмеченный в пресс-релизе, заключается в том, что конечной целью проекта не являлось обучение ИИ использованию ненормативной лексики как таковой. Разработанная рабочая версия модели не применяет подобные выражения при обработке стандартных или публичных текстов. Её задача — демонстрация принципиальной возможности экстремальной лингвистической компрессии.

Следующим шагом команды станет работа над улучшением точности и контекстной осознанности системы. Планируется сбор более обширных и тонко размеченных данных, чтобы ИИ мог точнее распознавать ситуации, где подобное агрессивное сжатие семантически допустимо, исключая его применение в неподходящих коммуникативных условиях. Это открывает перспективы для создания более эффективных алгоритмов обработки естественного языка, вдохновлённых особенностями человеческой речи.

Сделай Чеснок своим источником новостей в Дзен и Google News. Подписывайся на наш телеграмм. Только самые важные новости!

Back to top button