Эволюция или революция? Обзор новых возможностей GPT-4.5

11 марта 2025 в 10:00

Фото носит иллюстративный характер, источник: freepik.com

GPT-4.5 от OpenAI – обновление флагманской языковой модели, которое ждали с надеждой на светлое будущее ИИ. Давайте посмотрим по-человечески, оправдались ли надежды и что в ней нового, как она отличается от GPT-4/4o, как чувствует себя среди других тяжеловесов (Claude Sonnet 3.7 и Grok 3) и какие реальные кейсы показывают ее силу.

Содержание

Что за зверь эта GPT-4.5, какие изменения?
Чем GPT-4.5 отличается от GPT-4/4о?
GPT-4.5 vs GPT-4.0 vs «размышляющие» O1/O3: два подхода к ИИ
Сравнение GPT-4.5 с Claude Sonnet 3.7 и Grok 3
Личный опыт использования
Что в итоге?

Что за зверь эта GPT-4.5, какие изменения?

Самая крупная и универсальная модель OpenAI. GPT-4.5 – самая большая и «знающая» модель, созданная OpenAI. Она обучена на еще большем массиве данных с помощью огромных вычислительных мощностей. Это логическое продолжение идей GPT-4: модель не делает ничего принципиально нового, но делает лучше. OpenAI пишет, что это самая универсальная модель, – она должна хорошо справляться с любыми задачами, и они сделали акцент на «понимание человека». По сути, это ChatGPT в люксовой комплектации.

Обучение и нововведения. Принципы обучения сохранены, но добавлены изменения в архитектуре и подходах, чтобы модель «думала» последовательнее и давала более точные ответы, реже выдумывая факты. Благодаря доработке архитектуры и обучения, модель стала лучше понимать сложные вопросы, более последовательно отвечать и, самое главное, меньше придумывать факты. Новых целых модулей, как, например, в GPT-4 с режимами рассуждения, не добавлено – работа проведена под капотом. Медленнее, но лучше.

Эмоциональный интеллект. Одним из ключевых улучшений стал более высокий эмоциональный интеллект. GPT-4.5 лучше чувствует настроение пользователя и может подстроить тон ответа – будь то дружеская беседа или серьезный вопрос. Это создает иллюзию разговора с понимающим человеком: где надо – подбодрит, где надо – даст конструктивный совет. Такое ощущение, что у нее включается режим психотерапевта.

А что говорят бенчмарки?

Коротко: OpenAI снова в лидерах. Полный лист сравнения моделей можете посмотреть тут.

А что такое Style Control, спросите вы. Это «честный фильтр», на арене модель оценивают люди, и, конечно, когда она выдала больше текста, красиво оформлена, выделены заголовки, люди, не вчитываясь, отдают предпочтение этой модели. Поэтому для оценки умственных способностей лучше смотреть без учета оформления.

Кому доступно? Пока доступно только пользователям пакета Pro, который стоит 200 USD в месяц. Также доступно в API, но цена кусается, как лошадь Пржевальского. Мы уже добавили модель в наш сервис доступа без VPN (мы, как никто другой, понимаем боли белорусов с новыми сервисами), но будьте осторожнее – модель намного дороже всех предшественников.

Чем GPT-4.5 отличается от GPT-4/4о?

Качество и точность ответов. На первом месте – новая модель лучше справляется с запросами. По отзывам, заметно снижен уровень «галлюцинаций», выдумываемых фактов. Сложные, запутанные вопросы решает увереннее. Эта модель показывает более правильное поведение: она так же может чего-то не знать, но не будет с умным видом придумывать ересь.
Улучшение в диалогах и решении задач. Улучшение в диалогах, переключении контекста. Лучше делает как творческие задания, так и аналитические. Более безопасна. В общем, хороший друг в чате. Как по мне, отлично везде. По ощущениям, будучи универсальной моделью, она сделал акцент на творчестве, диалоге и понимании задач, в стиле «делай все и улыбайся». Старые версии были неглупыми, а эта прямо умная.
Повышенная языковая гибкость. Расширено знание иных языков – отличная новость для немалой части пользователей. Особенно это коснулось более редких и менее популярных языков – для наших задач полезно будет тем, кто работает в Средней Азии.
Минимум выдумок – больше фактов. Скажем галлюцинациям твердое «нет»: модель стала выдавать гораздо меньше неточных данных. Теперь студенты, аналитики и просто заинтересованные пользователи могут больше доверять ее ответам, ведь фактическая точность значительно улучшилась. Проверять, конечно, еще нужно.
Стоимость доступа. Одно из существенных отличий – цена. Использование GPT-4.5 через API неприлично дороже, чем у предыдущей версии, что делает ее выбор оправданным только для задач, где критична высочайшая точность и надежность, а не массовое применение.

В целом, GPT-4.5 – это эволюционное обновление GPT-4, которое делает модель умнее, чутче и точнее. Теперь посмотрим, как она выглядит на фоне других топовых ИИ.

GPT-4.5 vs GPT-4.0 vs «размышляющие» O1/O3: два подхода к ИИ

Важно понимать, что сейчас существуют два направления развития больших языковых моделей.

Традиционные LLM (как GPT-4 и GPT-4.5) – это гигантские нейросети, способные давать быстрые и качественные ответы, опираясь на огромный объем знаний, полученных при обучении. Их еще можно назвать прямыми – они дают ответ сразу, не задумываясь.

«Размышляющие» модели (например, серия O1, O3) – это эксперименты, где модель старается имитировать пошаговое рассуждение, как человек, разбивая решение задачи на этапы. Такие системы могут оказаться точнее при решении сложных логических или математических задач, хотя отвечают медленнее.

Главное отличие в подходе – GPT-4.5 сразу выдает готовый ответ, что идеально подходит для диалога и творчества, а «размышляющие» модели иногда тратят больше времени, чтобы обдумать сложные задачи. Это разные подходы для разных задач: у думающих моделей метрики выше, но с ними тяжелее вести диалог и креативить, а вот прямые модели как раз лучше решают этот вопрос.

Сравнение GPT-4.5 с Claude Sonnet 3.7 и Grok 3

На рынке ИИ сейчас появились серьезные конкуренты. Многие сравнивают GPT-4.5 с моделями Claude 3.7 Sonnet от Anthropic и Grok 3 от xAI. У каждого из этих «титанов» свои сильные стороны.

GPT-4.5 (OpenAI) – универсальный ассистент, который стабильно выдает качественные ответы в самых разных областях. Он отлично подходит для разговоров, творчества и аналитики, но за его возможности приходится платить – модель требует значительных вычислительных ресурсов. Но, как всегда бывает в мире ИИ, через полгода модель значительно подешевеет и будет стандартной для простого чата.

Claude 3.7 Sonnet (Anthropic) – специалист по рассуждениям и коду. Эта модель демонстрирует высокую точность в программировании и логических задачах, а благодаря оптимизированной работе отвечает быстрее и доступнее по цене. Особенно Claude хорош с функцией Artifact – прямо в браузере он может создавать готовые, работающие приложения.

Grok 3 (xAI) – экспериментальная модель с огромным потенциалом, отличающаяся свежестью данных и высокой вычислительной мощностью. Однако на практике она пока остается несколько сырой, а ее стоимость и стабильность требуют доработок. Но это еще не конечная версия, больше похоже, что Маск очень хотел сделать релиз до GPT-4.5 и в обозримом будущем нас ждет уже финальная версия.

На вкус и цвет фломастеры разные. Нет четкой метрики, каждый выбирает для себя – выбор лучшей модели зависит от задач. Если вам нужна стабильность, универсальность и поддержка экосистемы – GPT-4.5 остается золотым стандартом. Для задач, где важна скорость и экономичность, отлично подойдет Claude, а Grok 3 может стать выбором для проектов, требующих максимальной вычислительной мощности и актуальности.

Личный опыт использования

Поделюсь опытом недельного взаимодействия с моделью.

Стиль общения модели. Да, OpenAI не соврали – сильно переработаны ответы в переписке, иногда и вправду создается впечатление, что общаешься с живым человеком. В отличие от прошлых моделей, GPT 4.5 хорошо уже понимает, где надо коротко ответить, а где развернуто. Потрясающие и пугающие впечатления.
Креативный парень. Предыдущие модели отлично помогали в вопросе генерации новых идей, тут появляется больше разнообразия.
Теперь это стандарт. Если ваш бюджет позволяет, то теперь даже нет желания включать 4о. Это отличная базовая модель для повседневных задач.

Прошлые модели в этой задаче по придумыванию домена для сервиса доступа к нейросетям зачастую фокусировались только на вариациях AI.

Что в итоге?

Можно с уверенностью сказать, что ChatGPT с мозгом GPT-4.5 становится все ближе к идеальному цифровому помощнику, способному поддержать как душевную беседу, так и серьезный анализ. Но нужно понимать, OpenAI не делает ставку на эту модель, ее даже не Сэм Альтман презентовал – это переходная модель перед GPT5, которая будет размышляющей моделью поверх 4,5, и там, вполне возможно, мы скажем «ВАУ».

Если вы заметили ошибку в тексте новости, пожалуйста, выделите её и нажмите Ctrl+Enter

Разместить рекламу на Myfin.by