Нейросетевой помощник GigaChat 2.0 теперь доступен всем пользователям
GigaChat 2.0 Сбербанка стал доступен каждому пользователю. Благодаря новому подходу к обучению повысился уровень всех навыков модели. Искусственный интеллект научился распознавать голосовые аудиофайлы, глубже анализировать запросы пользователя, обрабатывать больший объем текста и распознавать изображения. Все возможности GigaChat доступны в одном продукте и на любой поверхности — таким образом пользователю не нужно переключаться между разными сервисами. Об этом CNews сообщили представители Сбербанка.
В модельный ряд вошли две версии на выбор пользователя — GigaChat 2 Pro и GigaChat 2 Max. Max — это самая продвинутая модель для решения сложных и профессиональных задач, а Pro подойдет для решения повседневных задач, от получения ответов на различные вопросы до создания и редактирование текстов.
Работа с актуальной информацией в режиме реального времени
GigaChat 2.0 теперь умеет работать с актуальными данными из интернета, сервис глубже анализирует запросы, выдавая лаконичные ответы с ссылками на источники. Искусственный интеллект найдет информацию за человека, отфильтрует главное и подкрепит свои выводы ссылками — по ним можно будет перейти, если пользователю понадобится дополнительная информация. Например, у модели можно спросить: «Куда сходить в Питере с детьми 7 и 12 лет на этих выходных»; «Сколько стоит отремонтировать стандартную однушку в Москве».
Поддержка текстовых файлов
Теперь в одном диалоге доступна работа с несколькими файлами. В чат можно загрузить документ до 200 страниц текста А4. Пример запроса: «На что мне обратить внимание в договоре аренды? Ориентируйся на законы России». Также нужно приложить сам договор.
Анализ аудиофайлов и голосовых сообщений
GigaChat 2.0 обрабатывает аудиофайлы на принципиально новом уровне — модель воспринимает звуковые данные напрямую, без промежуточного преобразования в текст. Это позволяет ей точнее выделять главное и отвечать на вопросы по содержанию – достаточно приложить запись и сформулировать запрос. Поддерживает файлы длительностью до 60 минут и 30 МБ. А если печатать неудобно или нет возможности, можно записать голосовое сообщение. GigaChat 2.0 умеет общаться на разных языках, лучше понимает сложные термины, качественнее распознает устную речь и акцент, а также посторонние звуки и музыку.
Примеры запросов: «Послушай аудиозапись и скажи, что в моих словах могло не понравиться коллеге»; «Выпиши список лекарств и рекомендаций из голосового от моего врача»; «Послушай запись видеозвонка и выпиши все, что говорилось о наружной рекламе»; «Помоги структурировать мою речь для презентации проекта. [Текст речи]».
Анализ ссылок
Теперь достаточно загрузить ссылки на нужные материалы — и GigaChat извлечет важную информацию. Модель создает краткие обзоры по материалам сайтов, сравнивает статьи на одну тему, одновременно работает с несколькими ссылками и распознает картинки с сайтов. Пример запроса: «Помоги подготовиться к собеседованию на эту вакансию».
Суммаризация и ответы на вопросы по видео
GigaChat 2.0 способен также обрабатывать видео по ссылке. За счет понимания аудиодорожки модель может рассказать основную суть видеоэссе или ответить на вопросы по лекции (работает также с английским и другими языками). Пример запроса: «О чем видео? ссылка».
Создание музыкальной композиции
Функция генерации музыки и песен по текстовому запросу с помощью GigaChat вышла на новый уровень. Теперь максимальная длительность трека достигает трех минут, при этом генерация занимает столько же времени (около 1 минуты). Команда повысила соответствие конечной генерации запросу, качество звука, а также улучшила генерацию песен на китайском языке.
Пример запроса: Нажмите кнопку «Создать песню», введите текст или тему для генерации, выберите жанр или опишите свой, например: «Трек в стиле современной молодежной поп-музыки. Используй пульсирующий бас, яркие синтезаторы и плотный бит».
Распознавание изображений
Модель может проанализировать и извлечь из картинки больше полезной информации и дает более точные ответы по ее содержанию. Например, может посоветовать, какой стиль одежды выбрать для конкретного случая, поможет решить уравнение из учебника или расшифровать медицинские анализы. Пример запроса: «Мне пришла квитанция ЖКХ. Объясни, за что я плачу?
GigaChat 2.0 в умных колонках Sber
Впервые в России умные колонки полностью переведены на большую языковую модель, благодаря чему их интеллектуальные возможности вышли на принципиально новый уровень. GigaChat ведет живой диалог с пользователем на понятном ему языке или в заданной роли, удерживая нить беседы до 10 раз дольше. Например, может объяснить ребенку теорию относительности простыми словами или рассказать прогноз погоды от лица ведущего кинопремии.
Теперь искусственный интеллект управляет не только диалогом, но и прикладными навыками, такими как музыка или напоминания. А еще несколько команд можно задавать сразу в одном обращении — колонка переключится между ними самостоятельно.
Также взаимодействие с ассистентом теперь подстраивается под пожелания пользователя — доступно 18 комбинаций настройки, включая стиль общения, голос ассистента, обращение на «ты» или на «вы».
Примеры запросов: «Салют, я нарисовал жирафа, но он выглядит скучно. Что можно добавить?»; «Салют, объясни теорию относительности семилетнему ребенку»; «Салют, поставь будильник на каждый день на 6 утра и включи музыку для тренировки».
GigaChat и MAX от VK
Одной из первых площадок, где появился GigaChat 2.0, стала российская цифровая платформа МАХ от VK. Это приложение со встроенным мессенджером, мини-аппами, конструкторами чат-ботов, системой онлайн-записи и платежным сервисом. С помощью нейросетевой модели Сбербанка пользователи МАХ могут создавать тексты и изображения, расшифровывать аудио, получать краткие пересказы видео, статей и ответы на многие вопросы. Чтобы оценить возможности GigaChat, нужно найти в поиске @gigachat и затем следовать инструкциям.