Новый подход к законам масштабирования может изменить способ обучения AI-моделей

Исследователи в области ИИ значительно снизили вычислительные затраты на предсказание того, как крупнейшие модели языков будут масштабироваться в будущем, используя статистические концепции из науки о измерениях и образования. Это может сэкономить миллионы долларов на обучении.

Хотя крупные технологические компании редко раскрывают, сколько стоит обучение крупных языковых моделей, таких как ChatGPT, Claude или Gemini, оценки варьируются от сотен миллионов до миллиарда долларов за каждую итерацию обучения. Такая высокая стоимость заставляет разработчиков ИИ предпочитать обучать свои новые модели только один раз.

Чтобы сократить затраты и повысить уверенность в этих масштабных однократных запусках обучения, разработчики начали полагаться на так называемые законы масштабирования, которые помогают прогнозировать, как языковые модели будут масштабироваться во время обучения. Эти законы стали важной частью ИИ-инфраструктуры, и даже эти техники масштабирования требуют затрат на вычисления.

Новый подход к масштабированию

Ученые разработали новый подход к масштабированию, который значительно снижает требования к обучению, уменьшая время и стоимость масштабирования.

«До того, как законы масштабирования были подтверждены, лучшие разработчики ставили на них, и им повезло. Они принимали важные стратегические решения о том, как настроить и спроектировать свои модели, и использовали законы масштабирования для экстраполяции производительности, и они оказались правы. Но масштабирование все равно было дорогим, просто менее дорогим, чем альтернатива», — говорит Санми Койеджо, ассистент профессора компьютерных наук и старший автор нового исследования.

«Основной вопрос, который мы изучаем, довольно прост», — говорит Санг Труонг, аспирант лаборатории Койеджо и первый автор статьи, «Можем ли мы использовать алгоритмы для улучшения масштабирования?»

Основная архитектура

В своей новой статье Койеджо, Труонг и их коллеги показывают, как они могут адаптировать алгоритмы масштабирования, чтобы значительно сократить вычислительные затраты. Они назвали свою методику законами масштабирования ответов на задания (IRSL). Это тот же принцип, который используется в стандартизированных академических оценках, таких как SAT.

Заимствуя принципы из науки о измерениях (психометрики) и образования, IRSL строится на отношении участников тестирования к вопросам, которые им задают, увеличивая сложность вопросов с последующими раундами по мере правильных ответов модели. Это значительно сокращает количество запросов, необходимых для точной оценки способностей, утверждает Койеджо.

Исследователи показали, что IRSL достигает равной или более высокой предсказательной точности с гораздо меньшим количеством запросов — экономя время и деньги, повышая производительность.

Преимущества нового подхода

При существующих методах часто приходится запускать тысячи небольших моделей и использовать десятки тысяч контрольных вопросов для предсказания результатов, объясняет Труонг. «Наш подход значительно упрощает этот процесс и делает его более надежным. В некоторых случаях выполнение меньшего объема вычислений улучшает предсказательные результаты.»

Койеджо предсказывает, что влияние IRSL будет наибольшим в академическом мире, где затраты на обучение могут быть чрезмерными, но также могут извлечь выгоду и хорошо финансируемые частные разработчики. Цель заключается в том, чтобы предоставить исследователям новые инструменты для научного и статистически строгого обоснования масштабирования, отмечает Труонг.

«Мы считаем, что законы масштабирования ответов на задания — это важный шаг вперед», — заключает Койеджо. «Это показывает, что можно уточнять масштабирование — и обучение в целом. Это дает вам контринтуитивное сочетание лучшего сигнала с меньшими затратами.»

Работа была обеспечена финансированием от Национального фонда науки, ARPA-H, Фонда Макаратура, Schmidt Sciences, Института ИИ, ориентированного на человека (HAI) Стэнфорда, OpenAI, Microsoft и Google.




Прокомментировать в Телеграм: https://t.me/n8nhow

Подписаться на канал обучения n8n: https://t.me/n8ncoaching

Советы, обучающие курсы, компьютерная грамотность
Обзор конфиденциальности

На этом сайте используются файлы cookie, что позволяет нам обеспечить наилучшее качество обслуживания пользователей. Информация о файлах cookie хранится в вашем браузере и выполняет такие функции, как распознавание вас при возвращении на наш сайт и помощь нашей команде в понимании того, какие разделы сайта вы считаете наиболее интересными и полезными.