Разделы

Интернет Веб-сервисы

«Антиплагиат» выявляет текст, созданный ChatGPT

В системе обнаружения текстовых заимствований «Антиплагиат» появился новый функционал – автоматическое выявление машинно-сгенерированных текстов. Новый функционал будет доступен всем пользователям платных версий системы с мая 2023 г. Об этом CNews сообщили представители сервиса «Антиплагиат».

Алгоритм, позволяющий автоматически выявлять и маркировать сгенерированные машиной фрагменты текста, является собственной разработкой компании «Антиплагиат», созданной на основе многолетних исследований по обработке естественного языка (Natural language processing, NLP).

Новый функционал включен в стандартную лицензию проверки текстов на обнаружение заимствований. Система проверки анализирует текст на наличие фрагментов, предположительно созданных при использовании моделей глубокого обучения GPT2, GPT-3, ChatGPT. Детектор машинно-сгенерированных текстов обучен и протестирован на большом наборе данных, что минимизирует риск ложного срабатывания.

Теперь, если в проверяемом документе обнаружены сгенерированные фрагменты, система «Антиплагиат» выделяет их, а сам документ маркируется как «Подозрительный». Данные об обнаруженных фрагментах доступны в полном отчете о проверке документа, к ним легко перейти для ознакомления.

«Нейронная сеть, создающая текст, всегда оставляет свои следы. В работе над определением сгенерированного текста разработчики компании «Антиплагиат» также использует алгоритмы искусственного интеллекта, естественно, обученные на задачи детектирования. Несмотря на все успехи ChatGPT или Jasper, их тексты все еще отличаются от написанных человеком», – сказал исполнительный директор компании «Антиплагиат» Юрий Чехович.

Дмитрий Балдин, «РусГидро»: Вынужденный переход на open source приводит к увеличению поверхности кибератак
безопасность

***

Компания «Антиплагиат» более 17 лет работает в области обработки естественного языка и определению заимствований в текстах учебных и научных работ. Российский разработчик ИТ-технологий. Среди последних разработок – создание алгоритма по обнаружению фрагментов текстов, созданных при помощи искусственного интеллекта, поиск заимствованных изображений, а также механизм обнаружения плагиата в переводных текстах.