ПО

21 Ноября 2025 14:42 21 Ноя 2025 14:42 |

Ученые «Сбера» создали бенчмарк для повышения качества медицинских консультаций

Учёные из центра практического искусственного интеллекта «Сбера» разработали медицинский бенчмарк 3MDBench, который моделирует консультации между врачом и пациентом на основе жалоб, снимков и характера пациента, с автоматической оценкой качества.

В этой системе взаимодействуют два виртуальных агента, каждый из которых управляется большой языковой или мультимодальной моделью искусственного интеллекта (ИИ). Один агент действует как врач, а другой — как пациент. Смысл в том, чтобы оценить, насколько эффективно современные ИИ-модели решают задачи врача, который консультирует пациентов дистанционно. Система проверяет их способность распознавать симптомы, формулировать диагноз и поддерживать естественный, понятный и эмпатичный диалог с пациентом. Такая симуляция позволяет изучить, как темперамент пациента и выбранная стратегия общения влияют на точность диагностики и общее качество взаимодействия. «Сбер» опубликовал научную статью под названием 3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark.

Актуальность исследования обусловлена стремительным развитием телемедицины и растущей ролью языковых моделей в здравоохранении. Существующие медицинские бенчмарки часто включают лишь тесты с выбором ответа или короткие текстовые задачи, не моделируют полноценное общение между врачом и пациентом, не учитывают темперамент и эмоциональную реакцию человека. К тому же большинство из них берут в расчёт качество коммуникации и визуальные данные — например, фотографии симптомов, которые важны для постановки диагноза.

Как выбрать онлайн-доску для бизнеса и не ошибиться: 5 критериев, о которых часто забывают

Веб-сервисы

Бенчмарк 3MDBench включает почти 3 тыс. случаев с 34 диагнозами, которые основаны на реальных мультимодальных телемедицинских данных (текст + изображение). Исследование учёных «Сбера» показало, что использование диалога и мультимодальной информации существенно повышает точность диагностики. Добавление диалогов, по оценкам ученых «Сбера», увеличивает F1-меру на 6,5%, а включение информации от специально обученной свёрточной нейросети для классификации медицинских изображений — до 20%. Также подтверждено, что мультиагентная симуляция с персонализированными пациентами обеспечивает более реалистичную и содержательную оценку моделей.

Компании, которые разрабатывают медицинские ИИ-системы и телемедицинские платформы, могут бесплатно использовать 3MDBench для оценки и улучшения диагностических возможностей своих нейросетей в реалистичных условиях. Интеграция мультимодальных данных и улучшение диалоговых стратегий помогут компаниям-разработчикам, телемедицинским провайдерам, страховым компаниям и производителям медицинского ПО повысить качество удалённых консультаций.

Подобрать оптимальный тариф на IaaS на ИТ-маркетплейсе CNewsMarket среди десятков поставщиков

Подписаться на новости

Короткая ссылка

Ученые «Сбера» создали бенчмарк для повышения качества медицинских консультаций

Другие материалы рубрики

Конференции

Современный цифровой офис 2025

Современные контакт-центры 2025

Цифровизация ритейла и электронная торговля

CNewsMarket

IP-телефония

CRM

BaaS

DRaaS

Техника

Обзор смартфона iQOO Z10R: достойное решение в среднеценовом сегменте

Обзор телевизора HARPER 55Q970TS с AI-караоке и матрицей QD Mini-LED

Обзор смартфона HUAWEI nova 14i: суперавтономность и огромный экран

Наука

OLED объединили с метаповерхностями: голографические гаджеты из фантастики — уже реальность

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Первая карта заводов компьютерной техники в России

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Российским ритейлерам
стоило бы поучиться у коллег из Китая

Ученые «Сбера» создали бенчмарк для повышения качества медицинских консультаций

Другие материалы рубрики

Конференции

Современный цифровой офис 2025

Современные контакт-центры 2025

Цифровизация ритейла и электронная торговля

CNewsMarket

IP-телефония

CRM

BaaS

DRaaS

Техника

Обзор смартфона iQOO Z10R: достойное решение в среднеценовом сегменте

Обзор телевизора HARPER 55Q970TS с AI-караоке и матрицей QD Mini-LED

Обзор смартфона HUAWEI nova 14i: суперавтономность и огромный экран

Наука

OLED объединили с метаповерхностями: голографические гаджеты из фантастики — уже реальность

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока общего рынка

Импортозамещение4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Импортозамещение4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Первая карта заводов компьютерной техники в России

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока общего рынка

Российским ритейлерамстоило бы поучиться у коллег из Китая

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Российским ритейлерам
стоило бы поучиться у коллег из Китая