«Яндекс» обучил нейросеть YandexGPT понимать казахский язык
«Яндекс» в 2024 г. запустит языковую модель YandexGPT, которая умеет писать и перерабатывать тексты на казахском языке, запоминать ход беседы и отвечать на уточняющие вопросы пользователя. YandexGPT станет первой публичной генеративной нейросетью, специально обученной понимать и говорить на казахском языке. Об этом CNews сообщили представители «Яндекса».
Нейросеть будет доступна пользователям через виртуального ассистента в приложении «Яндекс», а также в «Поиске» и «Яндекс Браузере» в Казахстане. Пользователи смогут общаться с нейросетью, как с живым собеседником. Например, она сможет дать совет, объяснить ребенку сложную тему простыми словами, придумать идею для рекламы или написать пост для соцсетей.
Также на облачной платформе Yandex Cloud планируется запуск коммерческой версии YandexGPT на казахском для бизнеса. Она позволит казахстанским компаниям и разработчикам развивать продукты и сервисы на основе генеративных нейросетей. Например, с помощью YandexGPT они смогут анализировать отзывы пользователей, создавать тексты по шаблонам для рассылок и запускать чат-ботов для службы поддержки.
За основу была взята базовая модель YandexGPT. Для ее дообучения на первом этапе были подготовлены сотни тысяч запросов и ответов на казахском языке, охватывающих различные темы и контексты бесед. Это обеспечивает модели необходимую основу для понимания языка и культурного кода.
В обучении нейросети участвуют ИИ-тренеры «Яндекс Казахстан». Они оценивают ответы нейросети — точность, полноту, фактическую правильность, грамматику и стиль — и пишут эталонные запросы и ответы на казахском языке. Затем на них обучают нейросеть и таким образом повышают точность ее ответов.
***
«Яндекс Казахстан» — технологическая компания, которая создает продукты и сервисы на основе машинного обучения и нейросетей. Компания занимается разработкой и внедрением технологий, направленных на улучшение жизни пользователей и развитие цифровой среды в Казахстане. В стране уже работают поисковые, городские, облачные и развлекательные сервисы, также компания развивает образовательные и социальные проекты.