Запуск Googles Gemini 3: Ожидания возрастают, историк утверждает, что он решает две проблемы

Ожидания запуска модели Google Gemini 3 достигли исторического максимума. Один из историков утверждает, что эта модель смогла решить две из самых древних проблем в области искусственного интеллекта.

Прорывы в распознавании рукописного текста и символическом мышлении

12 ноября в искусственном сообществе разошлась статья под заголовком «А не решил ли Google тихо две из старейших проблем ИИ?» Авторам статьи является Марк Хамфрис, доцент истории в Университете Уилфрида Лориера в Ватерлоо, Канада. Этот ученый, который изначально изучал историю Северной Америки XX века, недавно сместил фокус на цифровые гуманитарные науки и применение искусственного интеллекта. В своей колонке на Substack "Генеративная история" он сообщил, что таинственная модель, которую он протестировал в Google AI Studio, показала "почти идеальные" навыки распознавания рукописного текста и явления "спонтанного, абстрактного и символического рассуждения".

Open Experimental Platform

Google AI Studio представляет собой открытую экспериментальную платформу, на которой пользователи могут тестировать запросы и сравнивать производительность различных моделей. За последнюю неделю некоторые пользователи заметили, что система случайным образом генерирует два ответа и просит выбрать лучший. Это распространённый метод A/B тестирования, используемый крупными лабораториями ИИ перед запуском модели.

Эксперимент Хамфриса

Эксперимент Хамфриса изначально был направлен на проверку производительности этой модели в задаче "транскрибирования рукописных исторических документов". Однако он неожиданно обнаружил более глубокое явление: модель не только достигла уровня человеческих экспертов в точности транскрипции, но также могла рассуждать, корректировать и объяснять самостоятельно, когда сталкивалась с неоднозначной или неполной информацией, как будто она "понимала" исторические материалы.

Неожиданные находки эксперимента

Чтобы проверить производительность модели, Хамфрис загрузил набор рукописных учетных книг и писем XVIII века. Эти материалы часто полны орфографических ошибок, неразборчивого почерка и непоследовательных форматов. Процесс тестирования оказался крайне сложным.

Примеры моделей

  • Модель не только достигла почти идеального распознавания слов и символов, но и продемонстрировала "активное рассуждение, выходящее за рамки требований задачи".
  • Наиболее яркий пример был из журнала купца из Олбани, Нью-Йорк, 1758 года. Он записал: «1 булка сахара 145 @1/4 0 19 1». Человеческие учёные знают, что это означает "покупка сахарного конуса, 1 шиллинг и 4 пенса за фунт, с общей ценой 0 фунтов, 19 шиллинг и 1 пенни".

От трансформации к рассуждению

Когда Хамфрис протестировал эту модель, он был удивлён тем, что модель смогла самостоятельно устранить нестыковки в расчетах и предложить корректные выводы. Это говорит о том, что модель может устанавливать "внутреннюю проблемную репрезентацию" и приходить к разумным выводам через многошаговые логические расчеты.

Озвучивание нового подхода в исследовании AI

Это открытие согласно Хамфрису показывает, что понимание может начать интегрироваться в конечном итоге от "вероятности" к "концептуальному". Это также открывает новые этические и методологические вызовы.

Заключение

Если AI сможет транскрибировать и понимать рукописные исторические материалы на уровне экспертов, это кардинально изменит подходы к архивным исследованиям. Теперь исторические исследования могут перейти в "эпоху совместного чтения с машинами".




Прокомментировать в Телеграм: https://t.me/n8nhow

Подписаться на канал обучения n8n: https://t.me/n8ncoaching