Разделы

Бизнес Цифровизация

Causal AI: как научить нейросети объяснять свои решения

Рынок Causal AI растет большими скачками: в 2025 году его объем составляет $63 миллиона, а к 2035 году достигнет $1,6 миллиарда — прогнозируется 38% ежегодного роста (согласно отчету Roots Analysis, октябрь 2025). Иван Китов, Senior Data Scientist в Wolt, активно исследует эту область: он изучает причинно-следственные связи в AI. В 2025 году Иван провел вебинар по Causal Inference, опубликовал три научные статьи в международных журналах, его достижения включают разработку платформы экспериментов в Wolt и системы А/Б-тестирования в Prisma Labs. CNews поговорил с Иваном о том, что такое Causal AI, почему нейросети остаются «черными ящиками», как причинно-следственные связи меняют экспериментирование и можно ли предсказывать результаты тестов заранее.

CNews: Иван, вы сейчас активно исследуете Causal AI и Causal Inference — причинно-следственные связи в искусственном интеллекте. Что это такое и почему эта область сейчас набирает популярность?

Иван Китов: Если максимально просто, классический AI и нейросети — это машины для поиска закономерностей. Чтобы обучить модель, нужно подать ей много примеров, тогда она замечает, что с чем связано, и на основе этой статистики делает прогноз.

Проблема в том, что такая модель часто остаётся «чёрным ящиком»: она выдаёт результат, но мы не понимаем, почему он именно такой и какие факторы на самом деле повлияли.

Causal AI пытается решить как раз эту задачу — научить алгоритмы понимать, что что-то вызывает. Это переход от наблюдения к причинам.

Чтобы почувствовать разницу, представьте простой бытовой пример. Люди, которые ходят в спортзал, чаще покупают протеин. Между этими событиями есть связь, но это не значит, что если завтра мы начнем раздавать всем протеин, они внезапно станут спортивнее. Корреляция есть, причинной связи — нет.

Иван Китов, Wolt: Сегодня Causal AI — это, по сути, привилегия для тех, у кого есть ресурсы и экспертиза, а через 5–10 лет это станет базовой практикой

Сейчас сфера Causal A растет по нескольким причинам:

Во-первых, бизнесу нужны не просто прогнозы, а рычаги управления. Предсказание «мы вырастем на 5%» само по себе мало что дает. Следующий вопрос всегда: «А почему? И что нам нужно сделать, чтобы вырасти на 10%?». Causal-подходы дают именно такие ответы.

Во-вторых, идеальный мир с постоянными A/B-тестами существует только в презентациях. В реальности эксперименты — это дорого, долго и чаще всего невозможно. Causal-подходы как раз помогают извлекать максимум из тех данных, которые у нас уже есть, и приближаться к тому, что дало бы экспериментальное доказательство.

И третье — рост влияния AI на критичные сферы. Когда алгоритм влияет на кредиты, медицину или доходы людей, аргумента «просто модель решила так» уже недостаточно. Нужна прозрачность: почему система приняла решение и что изменится, если мы поменяем правило. Тут причинно-следственные методы становятся буквально обязательными.

CNews: Приведите пример из практики: когда непрозрачность AI-модели создала проблему для бизнеса. Сталкивались ли вы с такими ситуациями в Wolt, Drops или других компаниях?

Иван Китов: Да, в Drops был очень показательный случай. Мы использовали модель, которая решала, какие упражнения показывать пользователю, чтобы он оставался в приложении дольше. И на первый взгляд всё работало идеально: краткосрочный engagement рос, люди меньше пропускали задания, метрики выглядели замечательно.

Но у модели был скрытый побочный эффект. Поскольку она оптимизировала только моментальные реакции пользователей, она постепенно вытесняла более сложные упражнения — те, что полезны для реального прогресса в изучении языка, но требуют чуть большего усилия.

Алгоритм действовал логично: раз простые задания реже пропускают, значит их и стоит показывать чаще. Но с точки зрения продукта происходило обратное — мы бессознательно замедляли развитие пользователей.

И вот тут как раз проявилась проблема непрозрачности. Аргументировать что-то против модели, которая приносит рост по ключевым метрикам, сложно. На графиках всё красиво, а внутри — дисбаланс, который долгосрочно вредил цели обучения.

В итоге нам пришлось переопределять целевую функцию, добавить причинные и долгосрочные метрики, чтобы алгоритм учитывал, что ведёт к устойчивому прогрессу.

Если обобщить, то из-за непрозрачности модели бизнес часто сталкивается с тремя типами проблем: недоверием, трудностями в управлении рисками и ограничениями в развитии продукта. Всё, что требует понимания внутренней логики, начинает страдать, если она скрыта.

CNews: Вы занимаетесь выявлением эффектов без непосредственного экспериментирования. Можете ли вы объяснить причину и следствие, не проводя классический АБ-тест? Как это связано с Causal AI?

Иван Китов: Если коротко — да, можем. Но, как обычно, есть важные нюансы.

Объяснять причинно-следственные связи без классического A/B-теста действительно возможно, если мы соблюдаем три условия:

Во-первых, честно проговариваем все допущения. Без этого любая причинная оценка превращается в гадание. Нужно явно понимать, что мы считаем вмешательством, какие факторы контролируем, какие — нет.

Самый известный пример — корреляция между продажами мороженого и нападениями акул.

График выглядит убедительно, но мы понимаем, что запретив мороженое, мы никак не снизим опасность на побережье. Просто оба события растут из-за третьего фактора — жары.

Во-вторых, используем правильную структуру данных. Это могут быть естественные эксперименты, поэтапные запуски фичи, гео-разбиения, ситуации, где изменения происходят не одновременно у всех пользователей. Такие паттерны позволяют почти «симулировать» эксперимент, даже если мы его не ставили намеренно.

И, в-третьих, проверяем выводы там, где эксперимент всё-таки возможен. A/B-тесты никуда не исчезают — они остаются золотым стандартом. Но causal-подходы позволяют сильно расширить пространство вопросов, которые мы можем изучать.

Это как раз и выводит нас к роли Causal AI. Здесь две части работают в паре:

  • AI-слой строит точные предсказания и контрфакты — помогает понять, что могло бы произойти без изменения.
  • Causal-слой задаёт правила игры, определяет вмешательства, фиксирует допущения и ограничивает сравнения, которые могут привести к ошибочным выводам.

Вместе они позволяют получать корректные причинные эффекты даже там, где классический эксперимент провести нельзя.

CNews: Как методы Causal Inference можно применить в реальных бизнес-задачах? Например, в системе компенсации курьеров или в монетизации образовательных приложений?

Иван Китов: Эти методы гораздо шире, чем кажется — и отлично работают в ситуациях, где классический эксперимент либо невозможен, либо обходится слишком дорого.

В доставке, например, почти невозможно запустить чистый A/B-тест: любое изменение мгновенно влияет на весь регион, а система сама по себе сильно взаимосвязана. Causal Inference позволяет работать с такими «грязными» данными и всё равно получать осмысленные причинные эффекты.

CNews: В Prisma Labs вы построили систему предсказания LTV для маркетингового трафика, а в Drops — систему АБ-тестирования. Как Causal AI мог бы улучшить эти системы? Какие новые возможности он открывает?

Иван Китов: В Prisma Labs я отвечал за систему прогнозирования LTV для маркетингового трафика. Классическая модель, которую я тогда построил, хорошо решала задачу раннего прогноза выручки, но у неё было фундаментальное ограничение: она не различала, сколько пользователь «принёс бы» сам по себе и сколько благодаря нашему маркетинговому воздействию. Это была модель, основанная на градиентном бустинге, что являлось отличным baseline решением в то время и оно решало главную проблему отсечения плохих каналов привлечения.

Если смотреть на эту же систему через призму Causal AI, я бы поверх существующей модели добавил слой причинности и перешёл бы к инкрементальному LTV. На практике это означало бы, что я бы сначала формализовал бы каузальный граф (рекламу, ведущую к активации, далее к платежам). И всё это с учётом органики, ретаргетинга и других каналов.

Также я бы спроектировал и запустил серию контролируемых экспериментов / geo-тестов, чтобы откалибровать uplift или ITE-модели. И дальше интегрировал бы метрику инкрементального LTV прямо в пайплайн закупки трафика.

По сути, тут можно перевести задачу из построения сырых предсказаний в задачу оценки эффекта вмешательства и встроить это в продуктовые и маркетинговые решения: какие кампании масштабировать, какие отключать, какие сегменты трогать минимально, потому что они и так хорошо растут органически.

В Drops я строил платформу A/B-тестирования, которая уже тогда сократила время экспериментов за счёт более грамотного дизайна и автоматизации анализа. Там я руководил реализацией CUPED, стратификации и автоматизации подведения итогов и самого начального этапа: дизайна и постановки гипотез. Это был end-to-end проект, в котором нужно было сделать все шаги обработки данных и принятия решения.

Теперь же, если добавить более глубокий слой анализа, то я мог бы добавить слой каузального анализа гетерогенных эффектов, чтобы была большая гранулярность в итогах. Также, стоило бы систематически использовать ковариаты на уровне пользователя (история поведения, платежи, устройство и т.п.) для снижения дисперсии оценок эффекта и ещё большего сокращения длины экспериментов. И, как следующий уровень зрелости, встроить off-policy / counterfactual оценку, когда часть решений по продукту можно принимать через каузальные модели, обученные на истории экспериментов.

CNews: Традиционные АБ-тесты требуют времени, трафика и ресурсов. Может ли Causal Inference заменить часть экспериментов или сделать их более быстрыми и дешевыми?

Иван Китов: Если говорить честно, в иерархии методов исследований A/B-тесты остаются надежным инструментом. Выше только мета-анализы, которые объединяют результаты множества экспериментов.

Но есть важный нюанс: в реальном мире бывают вопросы, на которые A/B-тест просто невозможно поставить. И именно здесь causal-методы дают огромную ценность.

Хороший пример — Нобелевская премия по экономике 2021 года. Лауреаты разработали методы, позволяющие выявлять причинные эффекты без экспериментов на данных реального мира.

Один из их результатов показал, что дополнительный год образования увеличивает зарплату примерно на 9%. И это тот случай, где A/B-тест даже теоретически невозможен. Никто не будет запрещать половине учеников учиться «для чистоты эксперимента».

CNews: Какие технические сложности возникают при внедрении методов Causal Inference в продакшен? Почему компании не используют эти методы массово, если они так эффективны?

Иван Китов: Самая неожиданная сложность — даже не в алгоритмах, а в данных. В причинных методах особенно важно, чтобы в системе был порядок, всё должно быть четко залогировано, каждая фича — задокументирована, а момент и контекст изменений — известны.

Если входные данные хаотичны, результат тоже будет хаотичным. Классическое правило «garbage in — garbage out» здесь работает на 200%.

Из-за этого появляется риск бюрократии: чтобы causal-подходы работали, команде нужно дисциплинированно фиксировать всё, что может повлиять на модель. И это вызывает сопротивление — не все готовы вкладываться в такую «культуру данных».

Вторая причина — кадровый голод. Это работа на стыке ML, аналитики, экономики и продуктового мышления. Таких специалистов мало, и большинство из них приходят из академической среды, где на освоение инструментов и логики причинных исследований уходит много лет.

И наконец, не всем это нужно. Если продукт простой, метрики прямолинейные, а изменений мало, то глубокие causal-подходы могут быть просто избыточны. Во многих случаях классических A/B-тестов и хорошей аналитики вполне достаточно.

CNews: Вы работали в разных индустриях: от маркетинга и EdTech до доставки еды и геосервисов. В каких из них методы Causal AI наиболее востребованы? Где они могут дать наибольший эффект?

Иван Китов: Лучше всего Causal AI работает там, где изменения в одной части системы сразу отражаются на других, и нужно точно разбирать, что на что влияет.

  • Сервисы доставки — это классический трёхсторонний маркетплейс: курьеры, рестораны, пользователи. Любое изменение в одной части цепочки тянет за собой остальные.
  • В EdTech похожая история. Изменения в образовательных программах дают эффект не за день и даже не за неделю — их нужно проверять долго. Экспериментировать на каждом шаге практически невозможно, поэтому причинно-следственный анализ становится частью разработки качественного продукта.
  • Маркетинг — отдельная большая зона применения. Там causal-методы помогают ответить на главный вопрос: какой реальный вклад дал наш бюджет? Мы легко видим «как было» и «как стало», но совсем не видим «а что бы произошло, если бы мы ничего не делали». И именно это «альтернативное будущее» causal-подходы позволяют оценить точнее всего.

CNews: Вы выступали на World Data Summit в Амстердаме в 2025 году. Какие тренды в области Data Science и AI вы заметили на конференции? О чем больше всего говорили эксперты?

Иван Китов: Главное ощущение — рынок взрослеет. Компании перестают смотреть на AI как на магическую кнопку и начинают спрашивать: что нам это реально даёт?

Я как раз делал небольшой «стартовый пакет» по причинно-следственному анализу и проводил воркшоп. Разбирал самые показательные кейсы, где causal-методы помогают понять, что действительно влияет на результат, и какие эффекты бизнес может ожидать.

Второй заметный тренд — переход от отдельных моделей к полноценным системам принятия решений. То есть разговор уже не про «натренируйте нам модель», а про то, как встроить её в реальные процессы: ценообразование, логистику, маркетинг, продукт. И как сделать так, чтобы бизнес понимал, почему система действует именно так.

Понятно, что топовой темой был GenAI. Обсуждали инфраструктуру, как строить RAG, как оценивать качество ответов, как обеспечивать безопасность.

И огромный блок выступлений был про данные как продукт. Про качество, governance, observability — всё то, что делает всю систему надежной. Это очень инженерная история, но без неё ни AI, ни ML нормально не будут функционировать.

CNews: Какой совет вы бы дали компаниям, которые хотят начать использовать методы Causal Inference? С чего начать, какие первые шаги сделать?

Иван Китов: Прежде всего надо понимать, что Causal Inference — это не волшебная таблетка, а набор методов, которые помогают снизить уровень неопределенности при принятии решений.

Внедрять их лучше постепенно, поэтапно, не пытаясь построить идеальную систему сразу.

  1. Дисциплина в данных. Всё, что связано с изменениями, гипотезами и результатами, должно фиксироваться. Без этого теряется контекст и любая аналитика превратится в хаос. Хорошая точка старта — выстроить нормальную культуру A/B-тестов.
  2. Совместная «модель мира». Соберите data scientists, product managers и команды маркетинга/операций. Пропишите все факторы, которые влияют на результат, и их взаимосвязи. Causal Inference работает только если есть понимание того, что реально влияет на бизнес.
  3. Начинайте с малого. Не пытайтесь сразу строить идеальную систему со всеми «модными» методами. Выберите один-два конкретных вопроса, примените простые методы, оцените результат и двигайтесь итерационно.
  4. Назначьте ответственных. Лучше, чтобы causal-подходом занимался отдельный человек или команда. Иначе экспертиза размазывается, и разные отделы начинают работать с противоречащими гипотезами.
  5. Привязывайте выводы к решениям. Если изменения в бизнесе не происходят, все исследования превращаются в «описательную статистику». Связь между результатами и реальными действиями формирует доверие и привычку к структурированному подходу.

CNews: Какие ваши планы на ближайшее будущее в области исследования Causal AI?

Иван Китов: Сейчас я фокусируюсь на Causal AI именно в контексте продуктовой аналитики и маркетплейсов / on-demand логистики

Моя любимая и всё ещё не до конца решенная задача: выявление гетерогенных эффектов в результате экспериментов и решений, которые мы проводим в Wolt. Сейчас активно исследуются методы Double ML, один из главных плюсов которых как раз в том, что они отлично выявляют сегментированные эффекты. Таким образом можно будет получать выводы даже в тех случаях, когда средний эффект изменения незаметен.

Также я сейчас работаю над исследованием инкрементального LTV. Этот подход родственный маркетингу, но в контексте маркетплейсов и доставок он тоже интересен, т.к. есть явные пики вроде обеда и ужина, плюс сильная сезонность на уровне недели и года. В итоге выявление инкрементального LTV от изменений — это уже задача на стыке предсказания временных рядов и Causal AI.

У меня также в планах на следующий год есть выступления на конференциях: PyData Berlin, World Data Summit и EuroCIM. Первые две более индустриальные, там планирую рассказывать про то, как реализованы Causal подходы у нас в командах и какие методы работают лучше, а какие — хуже. EuroCIM же ориентирован на академическую среду и там тоже есть, чем поделиться с сообществом и ещё более ценно будет поделиться опытом и мыслями с людьми из университетов и исследовательских центров.

CNews: Как вы видите будущее анализа данных? Какую роль в нем будет играть Causal AI через 5–10 лет?

Иван Китов: Бизнесу нужны не только предсказания, но и понимание, что повлияет на результат, если мы действительно возьмём и изменим правила игры?

Уже сейчас крупные компании вроде Doordash, Uber и Amazon строят симуляции: системы, которые позволяют моделировать изменения, просчитывать последствия и принимать решения, которые потом проверяются экспериментами. Этот тренд будет усиливаться.

Сегодня Causal AI — это, по сути, привилегия для тех, у кого есть ресурсы и экспертиза. Через 5–10 лет это станет базовой практикой. Это будет частью инфраструктуры по умолчанию так же, как сейчас никого не удивляет A/B-тестирование или мониторинг.

Иван Петров