
Базова архітектура та міркування
GPT-4 працює як єдина модель у межах сесії й вимагає від користувача вибору режимів (наприклад, перегляд/програмування). Режим міркувань є фіксованим і не адаптується, що може уповільнювати виконання складних завдань.
GPT-5 — це уніфікована система, яка включає:
- швидку модель за замовчуванням для коротких відповідей,
- GPT-5 Thinking для тривалого міркування над складними завданнями,
- маршрутизатор у реальному часі, який обирає правильний режим залежно від складності завдання, необхідних інструментів та явного запиту користувача («добре подумай над цим»).
Це забезпечує швидкі відповіді на прості питання та глибокий, надійний аналіз для складніших випадків.
Точність та зменшення галюцинацій
GPT-5 суттєво знижує кількість фактичних помилок у порівнянні з GPT-4/4o та навчений визнавати невизначеність замість вгадування. Надмірна підлесливість також зменшена, що підвищує довіру та ясність.
Бенчмарки та продуктивність у реальних умовах
У математиці, програмуванні, мультимодальному розумінні та медицині GPT-5 показує явну перевагу над GPT-4/4o.
| Галузь | GPT-4/4o (середній результат) | GPT-5 (середній результат) | Основна відмінність |
|---|---|---|---|
| Змагальна математика (AIME) | Стабільний, але непослідовний результат | Новий SOTA; значно вищий pass@1 | Відчутне зростання точності на рівні змагань |
| Розробка ПЗ (SWE-bench Verified) | Середній рівень успішних рішень | Набагато вищий відсоток успіху | Суттєвий прогрес на реальних репозиторіях |
| Мультимодальність (MMMU та ін.) | Добрий зображеннях | Кращий в обробці зображень, відео, діаграм і просторових завдань | Зріла та надійна мультимодальність |
| Медицина (HealthBench) | Корисний, але нестабільний | Найкращий на сьогодні; більш безпечний і точний | Великий прогрес у реалістичних сценаріях |
Мультимодальні можливості
GPT-4 ввів мультимодальні вхідні дані та добре працював зі статичними зображеннями. GPT-5 розширює ці можливості, демонструючи вищу точність при роботі з діаграмами, науковими ілюстраціями, просторовими завданнями та відео, що дозволяє ефективніше отримувати інформацію зі складних візуальних даних.
Галузева спеціалізація
Програмування: GPT-5 стабільно створює повноцінні додатки/сайти, працює з великими репозиторіями та демонструє кращий естетичний смак у фронтенді (відступи, типографіка, використання простору).
Творче письмо: Краща літературна структура (наприклад, стабільний ямб або вільний вірш), сильніші метафори та більш виразні фінали.
Медицина: Більш чутливий до контексту й проактивний; краще виявляє ризики та пропонує подальші кроки (не замінює лікаря).
Безпека, чесність і стиль
GPT-5 вводить safe completions — корисні, але обмежені відповіді замість миттєвих відмов, коли можна надати безпечні деталі. Він чіткіше повідомляє про обмеження та невизначеність, зменшує кількість неправдивих тверджень при відсутності інструментів і знижує підлесливість, роблячи діалог більш чесним і корисним.
Персоналізація та досвід користувача
Точніше виконує індивідуальні інструкції. Нові готові стилі (наприклад, Цинік, Робот, Слухач, Нerd) дозволяють швидко налаштувати тон спілкування, з меншим рівнем підлесливості.
Доступність та використання
GPT-5 — нова модель за замовчуванням у ChatGPT (у безкоштовних користувачів після ліміту вмикається GPT-5 mini). Користувачі Plus/Team мають вищі ліміти; користувачі Pro отримують доступ до GPT-5 Pro з довшими й детальнішими міркуваннями для складних завдань.
Розширений підсумок: де GPT-5 став кращим
- Адаптивні міркування: Динамічний маршрутизатор автоматично обирає швидкий або глибокий режим.
- Менше галюцинацій: Значно менший рівень помилок у порівнянні з GPT-4/4o у реальних запитах.
- Більше чесності: Швидше визнає невизначеність або відсутність інструментів замість вгадування.
- Менше підлесливості: Рідше надмірно погоджується; більш рівний тон.
- Масштабне програмування: Вищі показники у SWE-bench; краща робота з великими репозиторіями; якісніший фронтенд.
- Творче письмо: Сильніші образи, краща структура та фінали; більша майстерність у поетичних формах.
- Медичні консультації: Кращі результати у складних випадках; безпечніші й точніші відповіді.
- Мультимодальність: Краща робота із зображеннями, діаграмами, науковими ілюстраціями, просторовими завданнями та відео.
- Виконання інструкцій: Точніше виконання багатокрокових завдань; краще використання інструментів.
- Виклики функцій: Краща координація інструментів і адаптація до змін контексту.
- Ефективність міркувань: Вища точність при меншій кількості токенів.
- Персоналізація: Краща робота з власними інструкціями; готові стилі для швидкої зміни тону.
- Навчання безпеки: Safe completions з корисними відповідями; менше зайвих відмов.
- Стійкість до обману: Менше впевнених, але помилкових відповідей у невиконуваних сценаріях.
- Готовність до бізнесу: Вищі ліміти, краща надійність і Pro-режим для завдань високої цінності.
Висновок: GPT-4 встановив високу планку; GPT-5 її перевершив, запропонувавши розумніші міркування, більшу практичну точність, кращу мультимодальність, безпечнішу поведінку та більш плавний користувацький досвід.