ПО Софт

02 Декабря 2025 13:59 02 Дек 2025 13:59 |

«Наносемантика» создала новую систему для голосового управления в робототехнике

Компания «Наносемантика», российский разработчик нейросетевых решений, завершила создание универсального программного комплекса, который позволяет управлять роботами с помощью естественной речи без требований к высокой мощности оборудования. В основе комплекса ‒ DialogOS: платформа обеспечивает голосовой интерфейс, распознает и синтезирует речь, интегрируется с внешними системами через API. Для внедрения достаточно устройства с микрофоном и динамиком.

Современные нейросети позволяют роботам воспринимать речь в том виде, в каком она звучит в обычном разговоре. Там, где раньше требовалось строгое соблюдение команд, система теперь корректно обрабатывает свободные формулировки, опираясь на смысл и интонации.

В комплекс включены собственные решения компании: диалоговая платформа DialogOS для создания голосовых и текстовых роботов, NLab Speech ASR для точного распознавания речи и NLab Speech TTS для её синтеза. Текущая версия DialogOS совместима с Gemini и отечественной генеративной моделью, при этом архитектура комплекса заранее рассчитана на подключение любых других LLM. «Наносемантика» протестировала все крупные LLM от ведущих разработчиков, и в зависимости от специфики задачи в комплекс может быть подключена наиболее актуальная модель.

Егор Кириллов, бизнес-аналитик компании «Лаборатория Наносемантика», сказал: «Ключевой задачей при разработке этого комплекса была модульность и независимость от аппаратной платформы. Мы реализовали клиент-серверную архитектуру, где на конечном устройстве ‒ будь то робот-собака или промышленный манипулятор ‒ запускается лишь ультралегкий клиент. Вся сложная обработка, включая KWS, VAD и интеграцию с LLM через DialogOS, происходит на сервере. Такой подход позволяет нам гарантировать высокую производительность и качество распознавания независимо от вычислительных мощностей самого робота, а также централизованно обновлять и масштабировать «мозг» всей системы».

Комплекс уже прошёл испытания на роботе-собаке. Она умеет поддерживать диалог, выполняет голосовые команды и откликается на своё имя ‒ «Квант». Для этого была настроена комбинация KWS и VAD, позволяющая роботу отслеживать обращение в реальном времени. «Квант» говорит синтезированным голосом «Лео» из библиотеки компании, хотя при необходимости можно подключить и сторонние варианты.

Алексей Коровин, NDBC: Порядок рождается из управляемости, а не из наличия программы

Цифровизация

Сабина Спирина, генеральный директор компании «Лаборатория Наносемантика», отметила: «Мы видим устойчивый спрос на решения, которые позволяют компаниям быстрее внедрять роботизированные системы и снижать стоимость их интеграции. Новый комплекс делает голосовое управление стандартной функцией, а не дорогостоящей кастомной разработкой. Это открывает путь к масштабным внедрениям ‒ от логистики до сервисной робототехники ‒ и значительно ускоряет цифровую трансформацию наших клиентов».

Опробовать технологии можно на сайте «Наносемантики» ‒ в роли собеседника выступает цифровой аватар Лили, демонстрирующий работу комплекса в реальном диалоге. Лили ‒ уникальный эксперт по вселенной «Наносемантики»: она свободно ориентируется во всех продуктах, услугах и историях успеха клиентов компании. Пообщаться с аватаром текстом или голосом можно на главной странице сайта «Наносемантики».

Подобрать тариф на аварийное восстановление DRaaS на ИТ-маркетплейсе CNewsMarket

Подписаться на новости

Короткая ссылка

«Наносемантика» создала новую систему для голосового управления в робототехнике

Другие материалы рубрики

Конференции

Современные контакт-центры 2025

Миграция в облако

Business Process Management 2026

CNewsMarket

VPS

ERP

BPM

CRM

Техника

Лучшие умные колонки в 2025 году: выбор ZOOM

Битва голосовых помощников: Алиса, Маруся и Салют

Лучшая техника Dreame по уходу за волосами: выбор ZOOM

Наука

OLED объединили с метаповерхностями: голографические гаджеты из фантастики — уже реальность

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

В некоторых областях уровень внедрения ИИ у нас сильно выше, чем в других странах

Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

В некоторых областях уровень внедрения ИИ у нас сильно выше, чем в других странах

Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

«Наносемантика» создала новую систему для голосового управления в робототехнике

Другие материалы рубрики

Конференции

Современные контакт-центры 2025

Миграция в облако

Business Process Management 2026

CNewsMarket

VPS

ERP

BPM

CRM

Техника

Лучшие умные колонки в 2025 году: выбор ZOOM

Битва голосовых помощников: Алиса, Маруся и Салют

Лучшая техника Dreame по уходу за волосами: выбор ZOOM

Наука

OLED объединили с метаповерхностями: голографические гаджеты из фантастики — уже реальность

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

В некоторых областях уровень внедрения ИИ у нас сильно выше, чем в других странах

Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

В некоторых областях уровень внедрения ИИ у нас сильно выше, чем в других странах

Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

Импортозамещение4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока общего рынка

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка