Просто о сложном: математика, на которой учится ИИ

5 июня, 2024

Кристьян Эльянд

бизнес-аналитик, преподаватель

5 июня, 2024

Простой обзор математической логики, с помощью которой учится ИИ

Всегда полезно знать, как всё устроено. В этой статье я максимально просто объясню базовую математическую логику, которая используется при обучении моделей искусственного интеллекта. Обещаю: если у вас есть базовое образование, следующие примеры будут вам понятны, и вы станете чуть лучше разбираться в сфере ИИ.

Создаем ИИ для прогнозирования выручки от продаж

Допустим, мы хотим создать новую модель ИИ, которая прогнозировала бы выручку нашей компании. В качестве данных у нас есть выручка, расходы на рекламу и цены на продукцию за предыдущие два месяца.

Иными словами, мы хотим создать модель, которая показывала бы, как наша выручка зависит от цены товара и расходов на рекламу. С помощью такого инструмента маркетолог мог бы, например, рассчитать, какой будет выручка, если потратить на рекламу 50 € и установить цену товара 6 €.

Искусственный интеллект - это математическая формула

По своей сути ИИ — это не что иное, как математическая формула (или набор формул). Наш пример с прогнозом продаж можно представить в виде формулы следующим образом:

Формула есть, но мы не знаем, какие значения присвоить параметрам m и n. То есть мы не знаем, насколько сильно изменение расходов на рекламу или цены товара влияет на нашу выручку.

Начнем обучение

Когда мы начинаем обучать ИИ, мы можем задать параметрам модели произвольные значения. Например, сначала установим параметр расходов на рекламу равным 2, а параметр цены — равным -2.

Теперь просто проверим это. Если мы умножим расходы на рекламу и цену товара на значения параметров, то увидим, что наша начальная модель слишком оптимистична. В первый месяц фактическая выручка составила 5 €, а модель предсказала 30 €. Во второй месяц фактическая выручка была 18 €, а прогноз составил 52 €.

Начнем обучение

Правило обучения ИИ следующее:

Если ошибка равна 0, модель идеальна;
Если ошибка >0, модель дала слишком оптимистичный результат, и нам следует уменьшить параметры переменных с положительным значением и увеличить параметры переменных с отрицательным значением;
Если ошибка <0, модель была слишком пессимистичной, и нам следует увеличить параметры переменных с положительным значением и уменьшить параметры переменных с отрицательным значением.

Следуя правилу обучения, мы должны уменьшить оба параметра, так как и расходы на рекламу, и цена товара являются у нас положительными переменными. Например, уменьшим параметр расходов на рекламу с 2 до 1, а параметр цены — с -2 до -3.

Если мы проведем расчет снова, то увидим, что наша модель дает точный прогноз (даже очень точный, так как ошибка равна 0). Отлично, наша первая обученная вручную модель ИИ готова.

Тестируем модель на данных, которые не использовались для обучения

Если вам кажется, что эта модель слишком хороша, чтобы быть правдой, вы правы. Наша модель отлично отработала на тренировочных данных. Чтобы оценить точность модели, ее нужно протестировать на данных, которые не использовались в процессе обучения.

Мы обучили модель на данных за январь и февраль. Теперь проверим, насколько хорошо модель может предсказать выручку за март и апрель.

Из таблицы выше видно, что модель прогнозирует выручку за март в размере 28 € (фактическая — 24 €), а за апрель — 21 € (фактическая — 18 €). В среднем наша модель ошибается на новых данных на 3.5 евро, и это можно назвать точностью нашей модели.

Резюме

В итоге, искусственный интеллект по своей сути — это математическая формула. В нашем примере у формулы было 2 параметра, у модели GPT-4 их более триллиона (1 триллион = 1 000 000 000 000). Однако обе они обучены по одному и тому же принципу: путем постепенного изменения параметров модели в сторону уменьшения ошибки.

Также важно помнить, что ИИ учится на тренировочных данных, но его точность можно оценить только на тех данных, которые не использовались при обучении (тестовые данные).