AI + НСИ

Нормализация НСИ с искусственным интеллектом

Проект сокращения сроков и затрат на наведение порядка в справочных данных. ИИ закрывает 70-80% объёма работ. Аналитик принимает 100% решений.

3-5 месяцев вместо 18-24 месяцев классического MDM-проекта. До 95% записей обработано автоматически. Точность дедупликации 99,9% — лучше ручной и в разы быстрее.

Обсудить проект Запросить discovery
Хаос в НСИ Айболит AI + HITL Эталонный реестр 3-5 мес вместо 18-24 95% автоматически

Хаос в НСИ крупной организации

Типовая картина в организациях, чей IT-ландшафт развивался десятилетиями

Десятки систем

Каждая со своей моделью данных и своим набором справочников. Контрагенты, материалы, договоры — разные коды, разные форматы.

Расходящиеся справочники

Каждая новая связка систем превращается в проект по сопоставлению. Дубли и противоречия копятся годами.

Часы аналитиков

Часы аналитиков на каждую сводку из нескольких систем. Отчёты по одним и тем же объектам не сходятся.

Экспоненциальная стоимость

Каждый новый интеграционный проект дорожает экспоненциально. Невозможна сквозная автоматизация процессов.

Классический MDM-проект: 2-3 года

Что предлагает индустрия — последовательность из 6 крупных этапов. Самое долгое — не технологии, а ручная работа с данными.

01Развёртывание MDM — вендор, инфраструктура, метамодель (3-6 мес)
02Локальная нормализация — чистка справочников (6-12 мес)
03Коннекторы синхронизации — двусторонняя интеграция (3-9 мес)
04Глобальная нормализация — сопоставление и дедупликация (6-12 мес)
05Автоматизированные проверки — правила контроля качества (3-6 мес)
06Перевод в режим источник/подписчик (6-12 мес)

Где этот сценарий ломается

Самая ресурсоёмкая часть — ручная работа аналитиков с данными:

  • Ручной анализ каждого справочника — недели на одну сущность
  • Маппинги через интервью с владельцами
  • Дедупликация миллионов записей «глазами»
  • Бюджет заканчивается на этапах 2-4
  • Качество зависит от усталости аналитиков

Аналитик с ИИ-ассистентом делает за дни вместо месяцев

ИИ снимает рутину чтения, сопоставления и скриптования. Аналитик принимает решения и валидирует.

Задача Без ИИ С ИИ-ассистентом
Профилирование справочника1-2 недели на справочник1-2 дня, карта полей с гипотезами
Сопоставление полейИнтервью, ручные таблицыСемантическое сопоставление, аналитик валидирует
Поиск дубликатовFuzzy match + ручная разборкаГраф-матчинг + LLM-судья с обоснованием
Нормализация атрибутовRegex + ручная доработкаLLM извлекает, нормализует, проверяет
Разработка правил проверкиПрограммист по ТЗ аналитикаАналитик описывает словами, ИИ генерирует код
Модель взаимосвязейМесяцы интервью с экспертамиИИ предлагает модель, аналитик согласует

Кто за что отвечает

Подход усиливает аналитика, а не заменяет его. Качество решений — за человеком.

ИИ-агент

  • Строит карту полей источника, выявляет аномалии
  • Предлагает гипотезы соответствий между справочниками
  • Находит кандидатов на слияние, ранжирует по уверенности
  • Формализует словесные правила в исполняемый код
  • Предлагает структуру эталонной модели

Аналитик

  • Задаёт фокус и приоритеты по доменам
  • Подтверждает или корректирует маппинги
  • Разбирает спорные случаи дедупликации (HITL)
  • Тестирует правила на исторических данных
  • Согласует эталонную модель со спецификой заказчика

Ориентир по сокращению сроков и затрат

Точные цифры под ваш ландшафт фиксируем на discovery

3-5
месяцев вместо 18-24 мес классического подхода
90-95%
доля записей, обработанных автоматически
Дни
подключение новой системы-источника вместо недель
99,9%
точность дедупликации, лучше ручной

Айболит — операционная среда для работы с НСИ

Айболит используется нашими аналитиками для обработки данных. Не покупается заказчиком, не остаётся в контуре после проекта (опционально — может остаться).

  • ИИ-агенты под задачи НСИ — профилирование, матчинг, генерация правил, извлечение атрибутов
  • HITL-формы аналитика — спорные случаи разбираются человеком через структурированный интерфейс
  • Каталог шагов и правил — все операции версионируются, переиспользуются, документируются
  • Аудит каждого решения — каждое предложение ИИ сохраняется с контекстом и версией

Что получает заказчик: эталонный реестр, правила проверки, документация, скрипты.

Данные не покидают периметр

Все ИИ-операции — внутри защищённого контура. Никаких публичных облаков.

  • Айболит ставится в контур заказчика на время проекта
  • Локальные модели LLM в стране заказчика
  • Опционально — полностью offline-инференс на open-source моделях
  • Полная трассируемость каждого решения ИИ

Этапы проекта

Адаптированный под ИИ-ускорение workflow. Команда: руководитель-аналитик + 2-3 дата-аналитика + ИИ-инженер.

01

Discovery

3-4 недели

Обследование справочников, профилирование, карта расхождений

02

Нормализация по доменам

2-4 месяца

Итеративно по приоритетам. Эталонные модели, маппинги, реестры.

03

Автопроверки

2-3 недели

Формализация правил в код, тестирование на исторических данных.

04

Передача в эксплуатацию

1-2 месяца

Документация, обучение аналитиков заказчика, передача артефактов.

Айболит может остаться после проекта

После закрытия проекта Айболит может остаться в контуре заказчика как операционный инструмент НСИ. Самостоятельное подключение новых систем, модификация модели НСИ, workflow обработки на потоке, ИИ-агенты дежурят 24/7.

Опциональный второй этап. Решение — после результатов основного проекта.

Следующий шаг — discovery-анализ

Фиксированная цена, 3-4 недели, точная оценка основного проекта на выходе