Нидерландские исследователи создали ИИ-детектор сарказма
- Исследователи из Гронингенского университета создали ИИ-алгоритм, способный распознавать сарказм.
- Для его обучения разработчики использовали датасет с отрывками из американских ситкомов, включая «Друзья» и «Теория большого взрыва».
- После тренировки точность модели составила 75%.
Исследователи из Гронингенского университета разработали мультимодальный ИИ-алгоритм для обнаружения сарказма. Работу представили на совместном заседании Американского акустического общества и Канадской акустической ассоциации, пишет The Guardian .
«Мы способны надежно распознавать сарказм и стремимся развивать эту технологию. Мы хотим посмотреть, как далеко можем зайти», — заявил один из разработчиков модели Мэтт Колер.
По его словам, сарказм пронизывает человеческий дискурс больше, чем люди способны представить. Его понимание имеет решающее значение для беспрепятственного общения людей и машин, добавил Колер.
При создании детектора исследователи обнаружили, что ИИ нужны многочисленные сигналы, позволяющие отличить сарказм от искренности.
Специалисты обучили нейросеть на мультимодальных данных ― аудиоклипах, тексте и аннотированном эмоциональном контенте. Они использовали отрывки из американских ситкомов, включая «Друзья» и «Теория большого взрыва». Их взяли из размеченного датасета MUStARD .
Одной из сцен, на которой тренировался ИИ, была попытка Леонарда сбежать из запертого помещения в сериале «Теории большого взрыва». Другая изображала Росса из «Друзей», предлагающего Рэйчел помочь Джоуи и Чендлеру собрать мебель.
Исследователи извлекли из речи акустические параметры, включая высоту тона, скорость и энергию. Затем с помощью автоматического распознавания сказанного они перевели ее в текст для анализа настроений.
«Мы присвоили каждому сегменту речи смайлы, отражающие его эмоциональное содержание. Интегрируя эти мультимодальные сигналы в алгоритм машинного обучения, наш подход использует совокупные преимущества слуховой и текстовой информации вместе со смайликами для всестороннего анализа», ― объяснили специалисты.
После тренировки ИИ научился обнаруживать сарказм в немаркированных репликах из ситкомов почти в 75% случаев. Затем разработчики использовали синтетические данные для повышения точности модели, но это исследование еще не опубликовано.
По словам авторов, алгоритм можно улучшить за счет добавления в датасет визуальных подсказок вроде движения бровей и ухмылок.
«Получится ли у нас на 100% точная система? Этого не могут достичь даже люди», ― отметил один из исследователей.
Напомним, недавно OpenAI представила ИИ-модель GPT-4o, способную выражать эмоции.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Флеш-понедельник: покупайте криптовалюту с помощью кредитной/дебетовой карты без комиссии
Каждый понедельник при использовании местной фиатной валюты и оплатой кредитной или дебетовой картой (Visa, Mastercard, Google Pay и Apple Pay) комиссия отсутствует! Купить криптовалюту Период проведения акции: каждый понедельник с 15:00 до вторника 15:00 (мск) Правила акции Зарегистрируйтесь на Bi
Президент The ETF Store: ETF Solana, скорее всего, будет одобрен к концу следующего года
Неделя в мире мемкоинов: PNUT и GOAT несут потери, BONK вырывается в лидеры