Web Analytics

Chat GPT-5 vs. GPT-4: Подробное сравнение флагманских моделей OpenAI

*Мы выбрали товары, которые, по нашему мнению, вам понравятся, и можем получить комиссию по ссылкам на этой странице.
Выход GPT-5 от OpenAI ознаменовал значительный скачок по сравнению с GPT-4/4o, благодаря адаптивному режиму рассуждений («Thinking»), улучшенному мультимодальному пониманию и заметному снижению галлюцинаций и чрезмерного заискивания (sycophancy). Эта статья сравнивает GPT-5 и GPT-4 по архитектуре, точности, производительности, мультимодальности, специализации в областях, безопасности, настройкам и доступности.

Базовая архитектура и рассуждения

GPT-4 работает как единая модель в рамках сессии и требует от пользователя выбора режимов (например, браузинг/кодинг). Режим рассуждений фиксированный и не адаптируется, что может замедлять выполнение сложных задач.

GPT-5 — это объединённая система, включающая:

  • быструю модель по умолчанию для кратких ответов,
  • GPT-5 Thinking для расширенного рассуждения над сложными задачами,
  • маршрутизатор в реальном времени, который выбирает правильный режим в зависимости от сложности задачи, необходимости инструментов и явного указания пользователя («подумай над этим»).

Это обеспечивает быстрые ответы на простые вопросы и глубокий, надёжный анализ для сложных случаев.

Точность и снижение галлюцинаций

GPT-5 значительно снижает количество фактических ошибок по сравнению с GPT-4/4o и обучен распознавать неопределённость, вместо того чтобы угадывать. Заискивание также уменьшено, что повышает доверие и ясность.

Результаты тестов и производительность в реальных условиях

В математике, программировании, мультимодальном понимании и области здравоохранения GPT-5 демонстрирует явное превосходство над GPT-4/4o.

Область GPT-4/4o (средний результат) GPT-5 (средний результат) Ключевое отличие
Соревновательная математика (AIME) Стабильный, но непоследовательный результат Новый SOTA; значительно выше pass@1 Существенный рост точности на уровне конкурсов
Разработка ПО (SWE-bench Verified) Средний процент успешных решений Заметно выше процент успеха Сильный прогресс на реальных репозиториях кода
Мультимодальность (MMMU и др.) Хорош в статичных изображениях Лучше в изображениях, видео, диаграммах и пространственных задачах Зрелая и надёжная мультимодальность
Здравоохранение (HealthBench) Полезен, но нестабилен Лучший на сегодня; более безопасный и точный Серьёзный прогресс в реалистичных сценариях

Мультимодальные возможности

GPT-4 ввёл мультимодальные входы и хорошо справлялся со статичными изображениями. GPT-5 расширяет эти возможности, показывая большую точность в диаграммах, научных изображениях, пространственных задачах и анализе видео, что позволяет эффективнее извлекать информацию из сложных визуальных данных.

Специализация по областям

Программирование: GPT-5 стабильно создаёт полноценные приложения/сайты, обрабатывает крупные репозитории и демонстрирует лучший эстетический вкус во фронтенде (интервалы, типографика, отступы).
Творческое письмо: Лучшая литературная структура (напр., устойчивый ямб или свободный стих), более сильные метафоры и мощные концовки.
Медицина: Более контекстно-чувствителен и проактивен; лучше выявляет риски и предлагает дальнейшие шаги (не заменяет врача).

Безопасность, честность и стиль

GPT-5 вводит safe completions — полезные, ограниченные ответы вместо мгновенных отказов, когда можно дать безопасные детали. Он яснее сообщает об ограничениях и неопределённостях, снижает ложные утверждения при отсутствии инструментов и уменьшает заискивание, делая диалог честнее и полезнее.

Настройка и пользовательский опыт

Точнее выполняет индивидуальные инструкции. Новые предустановленные личности (например, Циник, Робот, Слушатель, Ботаник) позволяют быстро настроить тон общения, с меньшим уровнем заискивания.

Доступность и варианты использования

GPT-5 — новая модель по умолчанию в ChatGPT (у бесплатных пользователей после лимита включается GPT-5 mini). Пользователи Plus/Team имеют большие лимиты; у Pro есть доступ к GPT-5 Pro с более долгим и детальным рассуждением для сложных задач.

Расширенное резюме: где GPT-5 стал лучше

  • Адаптивные рассуждения: Динамический маршрутизатор, автоматически выбирающий быстрый или глубокий режим.
  • Меньше галлюцинаций: Значительно меньше ошибок, чем у GPT-4/4o, в реальных запросах.
  • Больше честности: Быстрее признаёт неопределённость или отсутствие инструментов вместо догадок.
  • Меньше заискивания: Реже чрезмерно соглашается; более ровный тон.
  • Крупномасштабное кодирование: Выше показатели в SWE-bench; лучше работа с большими репозиториями; лучшее оформление фронтенда.
  • Творческое письмо: Более сильные образы, лучшая структура и концовки; больший навык в поэтических формах.
  • Медицинские консультации: Лучшие результаты в сложных случаях; более безопасные и точные ответы.
  • Мультимодальность: Лучшая работа с изображениями, диаграммами, научными схемами, пространственными задачами и видео.
  • Следование инструкциям: Более точное выполнение многошаговых задач; лучшее использование инструментов.
  • Вызовы функций: Лучшая координация инструментов и адаптация к изменениям контекста.
  • Эффективность рассуждений: Более высокая точность при меньшем количестве токенов.
  • Настройка: Лучшая работа с кастомными инструкциями; предустановленные личности для быстрой смены стиля.
  • Обучение безопасности: Safe completions с полезными ответами; меньше ненужных отказов.
  • Устойчивость к обману: Меньше случаев уверенных, но ложных ответов в невыполнимых сценариях.
  • Готовность к бизнесу: Более высокие лимиты, повышенная надёжность и Pro-режим для ценных задач.

Вывод: GPT-4 установил высокую планку; GPT-5 её превзошёл, предложив более умные рассуждения, большую практическую точность, улучшенную мультимодальность, безопасное поведение и более гладкий пользовательский опыт.

Enable registration in settings - general