Что умеет ИИ в прогнозировании — и чего нет

Содержание
Содержание

В одном из последних материалов мы рассказывали о том, что к нейросетям в управлении запасами следует относиться с осторожностью. Давайте разберем эту тему подробнее.

В последние годы мы регулярно получаем запросы от компаний, связанные с ИИ. И в большинстве своем они достаточно абстрактны. Часто запросы сформулированы так: «Мы сейчас считаем всё в Excel. Нам нужно к нему прикрутить ИИ, чтобы всё стало хорошо» или «Нам нужна система прогнозирования на основе ML/AI».

Однако за подобными ожиданиями редко стоит понимание того, как именно используются нейронные сети и с какими ограничениями и сложностями приходится сталкиваться на практике.

Итак, давайте разбираться, какие нейросети сейчас существуют и каких результатов можно от них ожидать.

нейронные сети для прогнозирования спроса

Первое, о чем нужно знать, это разновидности нейронных сетей. Обычно, когда люди говорят про ИИ, то подразумевают LLМ (Large Language Models или большие языковые модели), такие как ChatGPT, Claude, DeepSeek и другие. Эти модели на момент написания статьи очень активно развиваются. И подавляющее большинство новостей, которые мы видим, про большие языковые модели.

Кроме того, существуют специализированные нейросетевые модели и архитектуры для прогнозирования временных рядов. В частности, появилось новое поколение foundation-моделей, таких как Chronos (Amazon), TimesFM (Google), Moirai (Salesforce) и TimeGPT (Nixtla). Помимо них используются различные нейросетевые подходы — от RNN/LSTM (например, DeepAR) до трансформеров и их модификаций (например, Temporal Fusion Transformer и PatchTST), применяемые в задачах прогнозирования спроса.

Ключевая особенность современных моделей прогнозирования — переход от точечного прогноза к оценке неопределенности: квантилям, интервалам и вероятностным распределениям.

Важно не смешивать LLM и специализированные модели прогнозирования, так как они решают разные задачи.

LLM хорошо подходят для работы с текстами: поиска и анализа информации, объяснений и помощи пользователям. Однако в задачах прямого прогнозирования спроса они обычно не являются основным и наиболее надежным инструментом. Для этого чаще применяют специализированные статистические или ML-модели. Это можно сравнить с использованием легкового автомобиля для перевозки строительных материалов: в принципе возможно, но неэффективно. Для таких задач лучше использовать специализированный транспорт.

За последние годы LLM значительно продвинулись вперед: улучшились качество генерации, следование инструкциям и устойчивость моделей,в том числе снизилось количество галлюцинаций и повысилась стабильность на сложных запросах.

Значительный вклад в развитие LLM внесли не только увеличение объемов данных и размеров моделей, но и появление новых подходов к их дообучению и использованию. В частности, post-training методы (такие как RLHF и instruction tuning) позволили моделям лучше понимать запросы пользователей и давать более полезные, корректные и уместные ответы.

Параллельно развилось инструментальное использование моделей: они научились обращаться к внешним источникам информации, например к поиску и базам данных, а также к инструментам — выполнять вычисления или вызывать API. Это сделало их ответы более точными и актуальными. Кроме того, появились методы повышения надежности — например, когда модель «размышляет пошагово», проверяет свои ответы или генерирует несколько вариантов и выбирает наиболее согласованный.

Всё это вместе существенно снизило количество ошибок и сделало поведение моделей более стабильным и предсказуемым.

Специализированные модели временных рядов развиваются по другой траектории и решают более узкий класс задач. Их качество сильнее зависит от структуры данных, объема истории, наличия внешних признаков и характера спроса; при разреженных продажах и нестабильных паттернах прогноз может быть менее устойчивым. Проще говоря, в таких условиях модели могут давать менее надежные прогнозы.

Когда нейросетевые модели прогнозирования работают хорошо?

Основной камень преткновения для таких моделей — данные. Поэтому для эффективной работы данных должно быть достаточно много, они должны быть хорошо структурированы по всем SKU без исключения и охватывать длительный период. А этим обычно могут похвастаться только очень крупные компании с высоким уровнем цифровой зрелости и хорошо оцифрованными бизнес-процессами.

Здесь также нужно понимать, что нейросетевая модель в таких случаях не работает как единственный алгоритм прогнозирования, а используетсякак одна модель из большого множества, среди которых статистические, вероятностные и другие модели.

Кроме того, для работоспособности таких моделей требуются квалифицированные специалисты, мониторинг качества и ресурсы на сопровождение, а также желательны зрелые процессы MLOps. То есть модель нельзя просто «поставить и забыть» — за ней нужно регулярно следить, проверять качество её прогнозов и при необходимости переобучать. По сравнению с классическими математическими методами такие решения часто сложнее в реализации и поддержке. Следовательно, содержать такую систему обходится достаточно дорого. И это не лучший вариант для тех, кто хочет сэкономить.

Для малого и среднего бизнеса, а также для значительной части крупных компаний, нейросетевые модели прогнозирования на практике чаще всего не дают существенного преимущества. Даже при наличии готовых решений их эффективность сильно зависит от качества данных и специфики задач, а выигрыш по сравнению с более простыми методами во многих случаях оказывается минимальным. При этом такие подходы требуют более сложной настройки, контроля и дополнительных ресурсов, что делает их применение оправданным лишь в ограниченном числе сценариев

Насколько эффективны могут быть прогнозные нейросетевые модели для российских торговых компаний?

Давайте рассмотрим реальные запросы от компаний. Это обычно ритейлер или дистрибьютор, который управляет запасами в полуручном режиме с помощью Excel. Иногда это может быть отдельно купленная или самостоятельно разработанная модель для 1С.

Компания хочет улучшить свои показатели. Иногда запрос может быть сформулирован как «Нам нужен прогноз на основе ИИ/ML» или более абстрактно «Нужна автоматизация с помощью ИИ для Excel, чтобы всё хорошо считалось».

Мы уже разобрались, что LLМ для прогнозирования нам не подойдут. Значит у нас есть два варианта:

  • Разработать нейросетевую модель под себя;
  • Использовать готовую нейросетевую модель для прогнозирования.

Разработка модели под себя

Первая проблема, с которой мы столкнемся, — это сложность самой ИИ-модели. Даже если для пользователя снаружи она кажется очень простой, то внутри дело обстоит иначе.

Так как модель сложная, то она требует на вход качественные данные. Чем сложнее модель, тем более она будет требовательна к данным. Иначе мы получим классическую ситуацию: мусор на входе ведет к мусору на выходе.

Мы на протяжении 15 лет работаем с торговыми компаниями и постоянно видим, в каком состоянии находятся данные. Часто в истории продаж и остатков есть провалы, отсутствуют данные по промо, страдает качество интерпретации данных и т. д. Наличие обработанной структурированной истории продаж хотя бы за 1–2 года — это скорее исключение, чем правило. И это все может оказаться очень критичным для нейросети.

Даже если в обозримой перспективе появится совершенная нейросетевая модель, которая сможет выдавать очень высокое качество прогнозов, мы упремся в данные.

Если порассуждать, как можно решить данную задачу, то можно добавить еще одну нейросеть. Она будет критически интерпретировать и оценивать исходные данные, а затем обрабатывать и очищать эти данные для прогнозной нейросети. Но таким образом мы сильно усложняем нашу модель. И даже небольшие ошибки рискуют вылиться в большие финансовые потери.

С другой стороны, если мы используем статистические методы для очистки истории продаж, то сохраняем устойчивость модели. В случае с дополнительной нейросетью мы, наоборот, умножаем неустойчивость в два раза, потому что у нас теперь два «черных ящика» вместо одного. Один из них дает на вход данные другому, и на выходе мы получаем результат, который очень сложно проверить.

Но главный вопрос — сложность реализации такой схемы. Для этого потребуются отдельные специалисты, которые хорошо понимают, как работают нейросети и как их можно адаптировать под конкретные задачи. И эти специалисты сейчас востребованы во всех отраслях.К сожалению, область управления запасами и закупками — это не приоритетное направление.

Также нужно понимать, что специалисты по нейросетям стоят дорого. Поэтому, сэкономить здесь не получится. И вероятнее всего финальная цена будет сопоставима с внедрением софта, построенного на математических и статистических моделях, или даже выше.

Реализовать эффективную модель прогнозирования на основе нейросетей без экспертизы хорошего специалиста не получится. В материале "Почему мы отказались от нейронных сетей в пользу вероятностных алгоритмов" мы подробно описываем, с какими проблема сталкивались при реализации.

Использование готовой модели для прогнозирования

Другой вариант реализации — взять специализированную модель, например Chronos от Amazon. Но надо понимать, что это просто модель прогнозирования. А все остальное придется разрабатывать самим. Это огромный пласт продукта: расчет заказов, моделирование остатков, учет ограничений и факторов неопределенности. Эту систему нужно ещё разработать.

Здесь задача становится немного проще, потому что модель не нужно разрабатывать. Но остаются вопросы с качеством данных и поиском специалистов, которые могут в этих моделях разобраться и внедрить их.

Помимо этого, еще острее встает вопрос ответственности. Если вы используете тот же Chronos, то можно скачать исходники и запускать его локально. Но это придется делать на свой страх и риск, не понимая, как он работает и почему выдает такой результат.

Инвестиции в ИИ в качестве прогнозных моделей будут оправданы только тогда, когда у компании уже налажен сбор данных, есть хранилище со структурированными и очищенными данными, которое постоянно пополняется.

Также один из факторов, про который обычно забывают, — это готовность самой компании применять инновации. В консервативной области, такой как прогнозирование спроса и управление запасами, где люди привыкли перепроверять результаты работы систем, уровень сопротивления может быть гораздо выше.

Резюмируя сказанное, можно отметить, что, несмотря на высокий интерес к нейросетям, на практике они часто не дают ожидаемого улучшения качества в задачах прогнозирования и планирования запасов, особенно в условиях неполных или слабо структурированных данных, и не могут рассматриваться как универсальная замена классическим моделям.

При этом сложность разработки и внедрения таких моделей, как правило, выше.

При выборе подхода к управлению запасами важно ориентироваться не на тренды, а на реальную эффективность — с учетом данных, особенностей бизнеса и подтвержденных кейсов в вашей отрасли.

О том, как выбрать подходящее решение у нас есть подробная инструкция.

Нейросети могут быть хороши там, где у нас много качественных данных. В этом случае они могут дать существенно лучший результат, чем обычные, не нейросетевые модели. И это возможно при привлечении дополнительных ресурсов и специалистов. Там, где исходно мало данных, ресурсов или специалистов, нейросети с большой вероятностью будут давать худшие результаты и усложнять систему.

ИИ в управлении запасами

Когда нейросети могут быть полезны в управлении запасами?

Для большинства компаний нейросети могут быть полезны для верхнеуровневого прогнозирования по кластерам магазинов.

У малого, среднего и большей части крупного бизнеса, скорее всего, будет недостаточно данных, а также могут возникнуть сложности с поиском специалистов по нейросетям.

Для таких компаний использование нейросетей — это в первую очередь использование больших языковых моделей (LLM) для процессов, не связанных с прогнозами и расчетами. И здесь как раз есть большой потенциал для улучшения. Это возможные помощники для рутинных задач.

LLM как отдельный класс могут быть полезны заказчику в операционной деятельности. Они могут использоваться для анализа и интерпретации данных, отчетов, подготовки к переговорам с поставщиками, написания писем и других регулярных задач. Также нейросети могут быть полезны при анализе переписки и выделении факторов, которые на верхнем уровне могут влиять на прогноз.

Еще одно применение LLM — интерфейс общения между системой управления запасами и пользователем. Нейросеть может упрощать взаимодействие и обучение пользователей. В этом случае пользователь сможет общаться с системой посредством чата или голоса, говорить, что и как нужно проверить, проанализировать, настроить. А нейросеть будет выполнять команды и настраивать программу так, как нужно пользователю.

Также нейросеть может использоваться для объяснения прогноза, расшифровки заказов и работы программы. Например, LLM, подключенная к системе, может помочь пользователю понять, как именно делается прогноз в этой системе. Это своеобразный помощник для закупщика.

Такой гибридный сценарий вполне вероятен. LLM может существовать, например, вместе с системой вероятностного прогнозирования и моделирования запасов. Большая языковая модель в этом случае может представлять собой интерфейс, помогать пользователям настраивать систему и управлять ею, анализировать отчеты, объяснять полученные данные и т. д. Но ядро расчетов остается за вероятностными алгоритмами. Это то направление, в котором мы развиваем Forecast NOW!
 

Готовы ответить на вопросы
и показать Forecast NOW! в деле
Наши специалисты готовы провести демонстрацию программы и представить ее на самостоятельное ознакомление, рассчитать стоимость внедрения и сроки окупаемости, проконсультировать о лучших практиках управления запасами.
Телеграм-канал и рассылка
Актуальные материалы по теме управления товарными запасами и наши исследования.
Учебный курс
Управление товарными запасами для специалистов по закупкам.

Другие публикации