Цифровизация

22 Марта 2022 13:18 22 Мар 2022 13:18 |

MTS AI и «Сколтех» разработали ИИ-редактора ненормативной лексики в чатах

MTS AI совместно со «Сколтехом» создала детоксификатор языка — ИИ-решение, которое распознает токсичные слова и выражения, а затем удаляет их либо заменяет близкой по смыслу, но не оскорбительной лексикой. Это решение позволяет сохранить смысл фразы и снизить градус агрессии в общении. Детоксификатор можно использовать не только в социальных сетях, но и в общении с голосовыми помощниками, чат- и войс-ботами. Об этом CNews сообщили представители MTS AI.

«Интернет – уникальный источник информации, не только самый большой и доступный, но и стихийно развивающийся. Контент создают сами пользователи, поэтому проблема безопасного и нетоксичного общения всегда актуальна. Споры в комментариях часто перерастают в оскорбления, пользователи "на эмоциях" выражают свое мнение в грубой форме, ведь написать и отправить текст — дело нескольких секунд. Скорость генерации контента настолько высока, что невозможно качественно фильтровать его вручную. Часто социальные сети просто блокируют оскорбительные высказывания. Наше решение позволяет не просто удалять сообщения или банить пользователей, а предлагать замену текста на более нейтральный, при этом не теряя сути сообщения», — сказала Ирина Кротова, старший разработчик в группе NLP MTS AI.

Разработка MTS AI и «Сколтеха» уникальна для российского рынка, поскольку большинство подобных решений предназначены для английского языка. Для русскоязычных пользователей подобных сервисов практически нет, а разработанные ранее решения оказались неэффективными.

MTS AI и «Сколтех» предложили два типа моделей для создания ботов и приложений, которые убирают негативную лексику из речи. Первый подход использует языковую модель BERT, основанную на нейросетевой архитектуре «Трансформер». Модель осуществляет точечное редактирование текста – находит в нем негативные слова и выражения, заменяет их на нейтральные синонимы или вовсе удаляет.

Второй подход также основан на архитектуре «Трансформер», однако он решает другую задачу – условную генерацию текста по входному запросу. То есть языковая модель создает нейтральную версию токсичной фразы. Для академического соревнования в рамках конференции «Диалог», была подготовлена модель детоксификации на основе языковой модели ruT5.

«В рамках данного проекта, совместно с коллегами из МТS AI удалось создать ряд технологий для детектирования и переписывания токсичного контента. Предложенные методы и модели могут быть использованы для предотвращения репутационных рисков компании (чат-бот, обученный на текстах из сети, может ответить токсично). Возможны и другие применения. Например, до отправления комментария пользователю может быть предложена менее токсичная формулировка его сообщения. В подобном сценарии использования, свобода выражения не страдает, но количество эмоционально написанных негативных комментариев может быть значительно сокращено. В результате данного сотрудничества кроме методов, моделей и наборов данных появилось немало научных статей, опубликованных совместным коллективом исследователей, инженеров и студентов из “Сколтеха” и МТС, в том числе на ведущих международных конференциях в области ИИ, таких как ACL и EMNLP», — сказал Александр Панченко, PhD, старший преподаватель «Сколтеха» и руководитель совместной лаборатории МТС-Сколтех.

«Диасофт» автоматизирует учет ЦФА для финансовых организаций: решение уже работает в 10 банках

ИТ в банках

***

MTS AI – это дочерняя компания МТС и Центр компетенций в области искусственного интеллекта. Создает продукты и оптимизирует процессы как внутри МТС, так и на внешнем рынке. В портфеле компании – решения в области компьютерного зрения, обработки естественного языка и граничных вычислений.

Подобрать тариф на аварийное восстановление DRaaS на ИТ-маркетплейсе CNewsMarket

Подписаться на новости

Короткая ссылка

MTS AI и «Сколтех» разработали ИИ-редактора ненормативной лексики в чатах

Другие материалы рубрики

Конференции

CNews FORUM 2025: Информационные технологии завтра

CNews Awards 2025

Толк Шоу

CNewsMarket

CRM

Dedicated

VDI

DBaaS

Техника

Лучшие умные очистители воздуха в 2025 году: выбор ZOOM

Обзор HUAWEI FreeBuds 7i: качественный звук и отличное шумоподавление

Обзор Dreame L50 Ultra: моющий робот-пылесос нового уровня

Наука

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

Космические «замочные скважины» — отсроченная катастрофа, через них астероиды могут вернуться на Землю

С новым кодом:
как будет работать
универсальный QR-код для оплаты

Первая карта заводов компьютерной техники в России

Обзор: Платформы виртуализации 2025

Российским ритейлерам
стоило бы поучиться у коллег из Китая

Первая карта заводов компьютерной техники в России

С новым кодом:
как будет работать
универсальный QR-код для оплаты

MTS AI и «Сколтех» разработали ИИ-редактора ненормативной лексики в чатах

Другие материалы рубрики

Конференции

CNews FORUM 2025: Информационные технологии завтра

CNews Awards 2025

Толк Шоу

CNewsMarket

CRM

Dedicated

VDI

DBaaS

Техника

Лучшие умные очистители воздуха в 2025 году: выбор ZOOM

Обзор HUAWEI FreeBuds 7i: качественный звук и отличное шумоподавление

Обзор Dreame L50 Ultra: моющий робот-пылесос нового уровня

Наука

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

Космические «замочные скважины» — отсроченная катастрофа, через них астероиды могут вернуться на Землю

С новым кодом: как будет работать универсальный QR-код для оплаты

Первая карта заводов компьютерной техники в России

Обзор: Платформы виртуализации 2025

Российским ритейлерамстоило бы поучиться у коллег из Китая

Первая карта заводов компьютерной техники в России

С новым кодом: как будет работать универсальный QR-код для оплаты

С новым кодом:
как будет работать
универсальный QR-код для оплаты

Российским ритейлерам
стоило бы поучиться у коллег из Китая

С новым кодом:
как будет работать
универсальный QR-код для оплаты