Призер премии ИИ в НКО 2025 года
номинация: ИИ в содержательной работе НКО
Многофакторный прогноз течения генетических и других редких заболеваний с помощью ИИ
Благотворительный фонд «БЭЛА. Дети-бабочки», Москва
На какую проблему/задачу откликается этот кейс
Проблема
Мы разработали интеллектуальную систему, которая помогает предоставлять персонализированную медицинскую и социальную помощь людям с неизлечимыми редкими генетическими кожными заболеваниями — например, врожденным буллезным эпидермолизом и ихтиозом.
Эти болезни отличаются сложностью, разнообразием проявлений и отсутствием специализированного лечения, а медицинская поддержка стоит очень дорого. Наш инструмент позволяет прогнозировать, как будет развиваться заболевание у человека, и определить, какая именно программа поддержки наиболее благоприятно повлияет на течение заболевания.

Под опекой фонда находится более 2 500 пациентов, и затруднительно сопровождать каждого индивидуально — ведь один сотрудник медицинской команды или социально-педагогического отдела в среднем курирует около 300 человек. На то чтобы выяснить, какая помощь нужна каждому из наших пациентов, уходит много времени и сил. Этот проект мы создали для того, чтобы упростить и ускорить работу команды, а главное — точнее прогнозировать потребности пациентов и эффективнее распределять бюджет фонда между разными программами помощи.
Какое решение было найдено/разработано, какое было участие ИИ
Решение
Разработка проекта велась с августа 2023 по февраль 2024 года. За это время была создана модель машинного обучения, которая помогает прогнозировать тяжесть состояния подопечных Фонда и подбирать для каждого человека наиболее подходящие программы помощи на текущий год.
Система также может предсказать, как участие в этих программах повлияет на состояние подопечного. Чтобы обучить модель, команда использовала накопленные с 2012 года данные о работе Фонда: ретроспективную информацию о программах помощи, социально-демографические характеристики подопечных, а также данные лабораторных, включая молекулярно-генетические, исследований, если они были.
Какие были этапы создания этого ИИ-решения?
  • Проанализировали базы данных подопечных
    Сначала мы комплексно изучили данные о более чем 2000 пациентах с буллезным эпидермолизом и ихтиозом. Мы посмотрели на разные аспекты: насколько тяжело протекает болезнь, имеются ли осложнения, какие сопутствующие болезни есть у человека, какие анализы и исследования проводились, физические характеристики, а также — его семейное и социальное положение
  • Проанализировали оказанные программ помощи
    Дальше мы изучили все программы помощи, которые фонд оказывал за последние 12 лет. Посмотрели, какие из них были полезными, какие уже устарели или дублируются. Мы все это пересобрали, убрали лишнее и сгруппировали по статьям затрат
  • Векторизация программ помощи
    Чтобы модель машинного обучения могла «понимать», что такое программа помощи, каждую из них перевели в формат численных параметров — то есть в вектор
  • Кластеризация программ
    Сначала все программы помощи разделили на группы по их финансовой структуре — то есть по тому, на что именно и сколько тратилось. Для этого использовали алгоритм KMeans из библиотеки scikit-learn (это одна из самых популярных библиотек Python для машинного обучения, содержащая готовые инструменты, в том числе для кластеризации, как KMeans) — он помогает находить общие черты в большом объеме данных. В качестве оптимального числа кластеров (групп) было определено шесть (с помощью так называемого силуэтного коэффициента), каждый — со своими особенностями расходов
  • Оценка эффективности программ
    Оценили, насколько каждая программа повлияла на тяжесть заболевания конкретного пациента. Для этого ввели числовые оценки — от 0.5 до 1. Чем больше число, тем заметнее программа повлияла на состояние человека. Изменения здоровья отслеживались в годовом отрезке времени, по специальным медицинским шкалам (BEBS/ISS), которые учитывают тяжесть симптомов
  • Подготовка обучающего набора данных
    Объединили данные из разных таблиц в один массив. Туда вошли: сведения о программах помощи и их оценки, социальные данные (например, возраст, семейное положение), лабораторные анализы и информация о болезни. Потом из всего массива выбрали ключевые признаки, которые влияют на прогноз: возраст, пол, семейный статус, патогенность мутации, тяжесть заболевания и т.д.
  • Обучение модели ранжирования
    Для построения модели мы использовали алгоритм CatboostRanker — это один из методов машинного обучения, который позволяет расставить варианты помощи по степени их полезности. В качестве функции потерь выбрали YetiRankPairwise — она помогает добиться наилучшего качества ранжирования
  • Настройка модели и проверка ее точности
    Читать далее
Как работает ИИ-решение?
В Регистр генетических и других редких заболеваний благотворительного фонда «Дети-Бабочки» был встроен специально созданный модуль «ИИ-прогноз». Он использует алгоритмы машинного обучения, чтобы строить прогнозы о том, какие программы помощи наиболее эффективны для каждого подопечного. Чем выше оценка программы, тем больше, согласно прогнозу, она подходит конкретному пациенту.
Насколько хорошо ИИ решает изначально поставленную задачу?
По нашим оценкам, поставленная задача решена на 70%. Основная причина — особенности структуры данных и неполнота информации о части подопечных, у которых нет клинико-лабораторных показателей. Таким пациентам тоже нужна помощь. Главный вызов — объем данных: чем их больше, тем точнее работают модели искусственного интеллекта. Подбор подходящего алгоритма машинного обучения в условиях ограниченного объема, как в нашем случае, оказался сложной задачей
Эффект: и что теперь, кому стало лучше и что изменится в работе, в мире
1
2
Разработанная модель ранжирования программ помощи работает как рекомендательный инструмент в цифровой системе Фонда. Она помогает подбирать оптимальные программы помощи для каждого подопечного, в том числе нового, — с учетом тяжести заболевания. Это позволяет точнее рассчитывать бюджет на сопровождение и убедительно доказывать необходимость финансирования благотворителям.
Тестирование модели на ретроспективных данных показало: программы Фонда действительно помогают удерживать стабильное состояние пациента, предотвращать ухудшение и определять тяжесть состояния пациента после получения программ помощи. Особенно это важно при таких сложных заболеваниях, как буллезный эпидермолиз и ихтиоз. Полученные результаты подтверждают важность регулярного мониторинга и индивидуального подхода к каждому пациенту
Докажите, что с ИИ ситуация стала лучше, чем без него – количественные и качественные параметры
Доказательства
Опишите экономику процесса: сколько потратили на ИИ решение, на что. Как это окупится?
Экономика
Проект реализован при поддержке гранта в размере 1  500 000 рублей.
Если учесть, что в процессе участвуют специалисты с разной квалификацией (врачи и сотрудники социально-педагогического отдела), стоимость 1,5 часов их работы можно усредненно оценить в 3000 рублей. Таким образом, экономия ресурсов составляет:
1500 человек × 3000 рублей = 4 500 000 рублей в год.
Самый важный показатель — это стабильное состояние подопечного.
Второй важный результат — снижение нагрузки на сотрудников фонда. Раньше, чтобы собрать информацию о потребностях, нужно было обзвонить до 300 подопечных за 1–2 недели. Это требовало огромных усилий и времени. А теперь сотрудники могут сосредоточиться и на других проектах, при этом риск профессионального выгорания снижается.
Где ИИ не справляется и не может заменить человека или работать без вмешательства и корректировки человека
ЭТИКА
Окончательное решение всегда за человеком. Даже если ИИ выдает точную рекомендацию, врач и специалист социально-педагогического отдела обязательно проверяют ее. Ведь есть важные нюансы, которые могут быть понятны только в личном общении с подопечным.
Если нет медицинских данных — нет прогноза. Если у пациента в Регистре нет свежих анализов и обследований, модель просто не сможет выдать обоснованный результат.
ИИ не способен учитывать психоэмоциональное состояние пациента, мотивацию, семейную динамику — это требует участия человека.

Данные нужно проверять вручную. Если в анкету случайно внесли ошибку — например, не тот возраст или диагноз — ИИ воспримет это как правду. Поэтому все данные проходят ручную проверку.
Модель нужно настраивать. Выбор алгоритма, параметров и оценка качества обучения — это задачи для специалистов.

На этапе обучения модели мы столкнулись с проблемой: объем доступных клинико-лабораторных данных оказался меньше, чем мы ожидали. Чтобы увеличить объем информации, мы искусственно расширили набор данных. Изначально в анализ включался один набор для каждого подопечного за один год. Однако у многих подопечных есть история наблюдений за несколько лет. Мы решили это использовать: если, например, пациент получал программы помощи и проходил обследования в течение пяти лет, то каждый год стал отдельной строкой в обучающем наборе. Таким образом данные этого подопечного превращались не в один, а в пять полноценных примеров для обучения модели.
Какие этические моменты важно было учесть в этом кейсе, как учли
  • Обработка персональных медицинских данных
    Использовались обезличенные данные, доступ к системе строго разграничен, соблюдаются требования ФЗ-152 «О персональных данных»
  • Недопустимость полной автоматизации решений
    Модель не принимает финальных решений, все рекомендации проходят экспертную проверку врачом и сотрудником социально-педагогического отдела фонда
  • Прозрачность и обоснованность рекомендаций
    Сотрудники фонда понимают, как формируются прогнозы, и могут объяснить пациенту, почему предложена та или иная программа
  • Недопущение дискриминации
    Модель не делает выводов на основе каких-либо социально чувствительных признаков вне медицинского контекста
  • Ограниченное применение
    Модель используется только внутри Фонда и только для принятия решений, направленных на улучшение состояния подопечных, — не используется для отказа в помощи
Каких-либо формальных этических документов не разрабатывалось, решения принимались в рамках внутреннего экспертного обсуждения.
Справочная информация
Чем этот кейс примечателен, чем выделяется среди других, отличается от других?
Яркое про кейс
Мы разработали уникальное решение, которому сегодня нет аналогов или их крайне мало. Хотя технологии искусственного интеллекта все активнее применяются в медицине, большинство подобных проектов сосредоточено на прогнозировании осложнений заболеваний на основе исключительно медицинских данных. Мы же пошли дальше и создали модель, которая учитывает не только диагноз и анализы, но и социальные условия жизни пациентов с редкими неизлечимыми болезнями. Теперь мы лучше понимаем, какие программы поддержки действительно улучшают самочувствие подопечных, помогают им адаптироваться в обществе и вовремя предотвращать ухудшение состояния
Какие фишки, результаты ИИ изумляют в вашем кейсе?
ИИ помогает не просто прогнозировать состояние пациента, но и заранее определить, какой спектр программ поддержки поможет избежать ухудшения. Это напрямую влияет на качество жизни подопечного: меньше осложнений, обострений — больше стабильности
Кроме того, модель мгновенно и достоверно рассчитывает, сколько средств нужно на помощь каждому человеку. Это упрощает планирование, снижает нагрузку на сотрудников и позволяет более точно привлекать финансовую поддержку от благотворителей.
Отзывы от команды, реализующей этот кейс, и от благополучателей – если есть
  • ИИ стал полноценным членом команды. Он не заменил нас, но освободил время для важной экспертной работы. Раньше обзвон 300 подопечных занимал недели, теперь достаточно 30 минут на проверку рекомендаций. Мы наконец-то можем сосредоточиться на качестве помощи, а не на рутине
    Сотрудник социально-педагогического отдела
Что бы авторы порекомендовали другим НКО, которые только присматриваются к ИИ или делают первые шаги?
  • Начинайте с конкретной задачи, а не с технологии. Не «внедрить ИИ», а решить задачу: например, ускорить отбор подопечных или предсказать потребности.
    Работайте в связке ИИ + эксперт. ИИ не заменяет человека, он усиливает его: готовит рекомендации, которые затем проверяет специалист.
    Думайте об этике с самого начала. Честность в использовании данных, прозрачность модели и контроль — обязательны.
    Просто начинайте и не откладывайте. Даже базовая автоматизация может освободить ресурсы команды и улучшить качество помощи