Новая модель искусственного интеллекта Gemini от Google может показать вам, что он действительно «думает»

🎉 🎮 Привет! Тебе что, совсем нечем заняться? Идеально! Присоединяйся к нашему телеграм-каналу Roblox, где мы веселимся больше, чем в бочке с виртуальными обезьянками. Приходи за кубиками, оставайся, чтобы подшутить. Ты не пожалеешь об этом... наверное. Увидимся в чате! 🕹️ 🚀 👇

Roblox Telegram


Новая модель искусственного интеллекта Gemini от Google может показать вам, что он действительно «думает»

Как давний энтузиаст технологий и поклонник искусственного интеллекта, я должен сказать, что последнее предложение Google, Gemini 2.0 Flash Thinking, является многообещающим шагом вперед в развитии технологий искусственного интеллекта. Исходя из мнения человека, который видел, как модели ИИ спотыкались на самых простых вопросах, способность увидеть мыслительный процесс модели ИИ, когда она решает проблему, кажется переломным моментом.

Как исследователь, я внимательно слежу за достижениями в области искусственного интеллекта. В сентябре прошлого года OpenAI представила предварительную версию o1 для ChatGPT, новаторской серии моделей, разработанных для обеспечения вдумчивых ответов, а не просто быстрых, за счет улучшения их рассуждений. В ответ различные компании представили свои собственные модели искусственного интеллекта, такие как DeepSeek-R1 и модель QwQ-32B-Preview от Alibaba.

Теперь настала очередь Google.

Обновленный мыслящий ИИ от Google, известный как Gemini 2.0 Flash Thinking, был назван Джеффом Дином, главным научным сотрудником Google DeepMind, «пробной моделью, которая открыто отображает его мыслительные процессы». Далее он объясняет, что эта модель учит использовать мысли для улучшения своих рассуждений, предлагая интригующую разработку для тех, кто обеспокоен тем, как ИИ генерирует свои ответы.

Новая модель Google Gemini 2.0 Flash Thinking — шаг в правильном направлении

Поскольку модель рассуждения ИИ построена так, чтобы демонстрировать его мыслительный процесс по мере генерации ответа, ИИ становится проще выявлять ошибки и исправлять их. Однако в ходе экспериментов с Gemini 2.0 Flash Thinking Experimental от TechCrunch наблюдались неудовлетворительные результаты при ответе на конкретный вопрос. Сайт задал вопрос, сколько букв «R» в слове «клубника», и получил неверный ответ «два».

На этом этапе модель ИИ, которую вы видите, все еще находится на экспериментальной стадии. Он может решать сложные вопросы значительно лучше, чем простые. Например, Джефф Дин демонстрирует передовую модель искусственного интеллекта Google, решающую физическую задачу и формулирующую свои рассуждения в ходе процесса.

Руководитель продукта Google Логан Килпатрик также обратился к X, чтобы поделиться захватывающим примером того, как Gemini 2.0 Flash Thinking решает «сложную головоломку, включающую как визуальные, так и текстовые подсказки». В общем видео вы можете увидеть весь мыслительный процесс модели ИИ от начала до конца.

Килпатрик подчеркивает, что то, что мы наблюдаем, — это всего лишь предварительная версия модели, но наблюдение за ее работой действительно впечатляет. Вместо того, чтобы просто сосредотачиваться на ответе, который дает ИИ, вы можете глубоко углубиться в то, как модель изначально решила вопрос, и понять, какие точные шаги она предприняла, чтобы прийти к окончательному выводу.

Одним из потенциальных недостатков является то, что получение вашего ответа может занять немного больше времени, поскольку модели ИИ необходимо формулировать свои мысли, а не просто обрабатывать их внутри, как традиционная модель ИИ. Этот дополнительный шаг в процессе мышления иногда может привести к задержке в принятии решения.

В задаче по физике, продемонстрированной Джеффом Дином, модели ИИ потребовалось примерно 37 секунд, чтобы завершить вычислительное мышление. И хотя ожидание может показаться коротким, окончательное решение более чем ценно. Для людей, которые полагаются на ИИ в вопросах кодирования, физики или математики, наблюдение за мыслительным процессом модели может дать представление об областях, где могли произойти ошибки, или о концепциях, которые были упущены из виду.

Очевидно, что моделям рассуждения ИИ предстоит преодолеть значительный путь, прежде чем они достигнут желаемого уровня (например, идентифицируя три R в клубнике вместо двух). Однако постепенные шаги, предпринимаемые компаниями, дают обнадеживающие признаки движения вперед.

Смотрите также

2024-12-20 20:29