
Базовая архитектура и рассуждения
GPT-4 работает как единая модель в рамках сессии и требует от пользователя выбора режимов (например, браузинг/кодинг). Режим рассуждений фиксированный и не адаптируется, что может замедлять выполнение сложных задач.
GPT-5 — это объединённая система, включающая:
- быструю модель по умолчанию для кратких ответов,
- GPT-5 Thinking для расширенного рассуждения над сложными задачами,
- маршрутизатор в реальном времени, который выбирает правильный режим в зависимости от сложности задачи, необходимости инструментов и явного указания пользователя («подумай над этим»).
Это обеспечивает быстрые ответы на простые вопросы и глубокий, надёжный анализ для сложных случаев.
Точность и снижение галлюцинаций
GPT-5 значительно снижает количество фактических ошибок по сравнению с GPT-4/4o и обучен распознавать неопределённость, вместо того чтобы угадывать. Заискивание также уменьшено, что повышает доверие и ясность.
Результаты тестов и производительность в реальных условиях
В математике, программировании, мультимодальном понимании и области здравоохранения GPT-5 демонстрирует явное превосходство над GPT-4/4o.
| Область | GPT-4/4o (средний результат) | GPT-5 (средний результат) | Ключевое отличие |
|---|---|---|---|
| Соревновательная математика (AIME) | Стабильный, но непоследовательный результат | Новый SOTA; значительно выше pass@1 | Существенный рост точности на уровне конкурсов |
| Разработка ПО (SWE-bench Verified) | Средний процент успешных решений | Заметно выше процент успеха | Сильный прогресс на реальных репозиториях кода |
| Мультимодальность (MMMU и др.) | Хорош в статичных изображениях | Лучше в изображениях, видео, диаграммах и пространственных задачах | Зрелая и надёжная мультимодальность |
| Здравоохранение (HealthBench) | Полезен, но нестабилен | Лучший на сегодня; более безопасный и точный | Серьёзный прогресс в реалистичных сценариях |
Мультимодальные возможности
GPT-4 ввёл мультимодальные входы и хорошо справлялся со статичными изображениями. GPT-5 расширяет эти возможности, показывая большую точность в диаграммах, научных изображениях, пространственных задачах и анализе видео, что позволяет эффективнее извлекать информацию из сложных визуальных данных.
Специализация по областям
Программирование: GPT-5 стабильно создаёт полноценные приложения/сайты, обрабатывает крупные репозитории и демонстрирует лучший эстетический вкус во фронтенде (интервалы, типографика, отступы).
Творческое письмо: Лучшая литературная структура (напр., устойчивый ямб или свободный стих), более сильные метафоры и мощные концовки.
Медицина: Более контекстно-чувствителен и проактивен; лучше выявляет риски и предлагает дальнейшие шаги (не заменяет врача).
Безопасность, честность и стиль
GPT-5 вводит safe completions — полезные, ограниченные ответы вместо мгновенных отказов, когда можно дать безопасные детали. Он яснее сообщает об ограничениях и неопределённостях, снижает ложные утверждения при отсутствии инструментов и уменьшает заискивание, делая диалог честнее и полезнее.
Настройка и пользовательский опыт
Точнее выполняет индивидуальные инструкции. Новые предустановленные личности (например, Циник, Робот, Слушатель, Ботаник) позволяют быстро настроить тон общения, с меньшим уровнем заискивания.
Доступность и варианты использования
GPT-5 — новая модель по умолчанию в ChatGPT (у бесплатных пользователей после лимита включается GPT-5 mini). Пользователи Plus/Team имеют большие лимиты; у Pro есть доступ к GPT-5 Pro с более долгим и детальным рассуждением для сложных задач.
Расширенное резюме: где GPT-5 стал лучше
- Адаптивные рассуждения: Динамический маршрутизатор, автоматически выбирающий быстрый или глубокий режим.
- Меньше галлюцинаций: Значительно меньше ошибок, чем у GPT-4/4o, в реальных запросах.
- Больше честности: Быстрее признаёт неопределённость или отсутствие инструментов вместо догадок.
- Меньше заискивания: Реже чрезмерно соглашается; более ровный тон.
- Крупномасштабное кодирование: Выше показатели в SWE-bench; лучше работа с большими репозиториями; лучшее оформление фронтенда.
- Творческое письмо: Более сильные образы, лучшая структура и концовки; больший навык в поэтических формах.
- Медицинские консультации: Лучшие результаты в сложных случаях; более безопасные и точные ответы.
- Мультимодальность: Лучшая работа с изображениями, диаграммами, научными схемами, пространственными задачами и видео.
- Следование инструкциям: Более точное выполнение многошаговых задач; лучшее использование инструментов.
- Вызовы функций: Лучшая координация инструментов и адаптация к изменениям контекста.
- Эффективность рассуждений: Более высокая точность при меньшем количестве токенов.
- Настройка: Лучшая работа с кастомными инструкциями; предустановленные личности для быстрой смены стиля.
- Обучение безопасности: Safe completions с полезными ответами; меньше ненужных отказов.
- Устойчивость к обману: Меньше случаев уверенных, но ложных ответов в невыполнимых сценариях.
- Готовность к бизнесу: Более высокие лимиты, повышенная надёжность и Pro-режим для ценных задач.
Вывод: GPT-4 установил высокую планку; GPT-5 её превзошёл, предложив более умные рассуждения, большую практическую точность, улучшенную мультимодальность, безопасное поведение и более гладкий пользовательский опыт.