🔥 Google готовит к релизу по-настоящему думающую ИИ модель
На AI Studio появилась загадочная модель в A/B тестировании. Скорее всего это Gemini 3.0, которая должна выйти в ближайшее время.
Историк Марк Хамфрис тестировал её на рукописях XVIII века и обнаружил две вещи:
- Распознавание рукописного текста на уровне эксперта-человека
- Спонтанное логическое мышление — без просьб и подсказок
Качество распознавания: - 0.56% ошибок по символам (без учёта пунктуации) - 1 ошибка на 200 символов - На 50-70% точнее Gemini 2.5 Pro
Но настоящий прорыв — в логике: Модель расшифровывала торговую книгу 1758 года. В записи о сахаре стояло "145" без единиц измерения.
Что сделала модель сама: - Заметила несостыковку - Увидела цену: 1 шиллинг 4 пенса = 16 пенсов за фунт - Взяла итоговую сумму: 0/19/1 = 229 пенсов - Посчитала: 229 ÷ 16 = 14.3125 - Перевела в фунты и унции: 14 фунтов 5 унций - Исправила транскрипцию
Многоступенчатая конвертация между двумя недесятичными системами (деньги + вес), которую никто не просил делать.
Почему это важно: Языковые модели обычно всего лишь предсказывают следующий токен по вероятности. Они не должны уметь в символическую логику!
Но модель: - Обнаружила проблему - Построила цепочку рассуждений - Применила исторический контекст XVIII века - Проверила себя обратным расчётом
Текущие модели Gemini 2.5 Pro и GPT-5 Pro даже с подсказками выдумывают дополнения типа "145 фунтов" или "1 фунт 5".
Новая модель даёт правильный ответ с первой попытки.
Спонтанное мышление: Модель не программировалась на символические вычисления. Способность рассуждать возникла сама из масштаба и сложности обучения.
Т.е. еще раз, - там нет фреймворка вроде Курсора в бэкэнде. Это чисто работа модели.
Если это будет в релизе, - мы увидим фундаментальный сдвиг: истинное мышление может возникать не из явных правил, а из размера модели. Это позволит: Историкам распознать старинные архивы автоматически с правильным пониманием контекста Медицине - расшифровать врачебные записи с логическими выводами Финансам - проанализировать старые бухгалтерские книги В общем в любой области, где нужна визуальная точность + экспертное рассуждение будет значительный прогресс.
Ждем, готовимся :)
· 13.11
Очень сомнительно: 1. Это не выборка, а субъективное мнение одного человека 2. Как отметили в комментариях к оригиналу: кернинг единицы и сорока пяти немного отличается 3. Все доводы о "логическом мышлении" косвенные - где доказательства, что автор оригинала не выдумал их сам? 4. Оценочные суждения по типу "работает на уровне эксперта" - может он даже не видел в своей жизни настоящих экспертов 5. Ну и наконец, нет доказательств, что модель просто не "подсмотрела" такой подход в скормленных ей работах других переводчиков.
Что более вероятно, так это то, что Гугл нашел способ повысить "чувствительность" весов модели без потери "качества", от чего она стала предсказывать токены по чуть более точной траектории.
ответить
коммент удалён