
Podstawowa architektura i rozumowanie
GPT-4 działa jako pojedynczy model w ramach sesji i wymaga od użytkownika wyboru trybów (np. przeglądanie/programowanie). Tryb rozumowania jest stały i nie adaptuje się, co może spowalniać złożone zadania.
GPT-5 to zunifikowany system, który zawiera:
- szybki model domyślny do krótkich odpowiedzi,
- GPT-5 Thinking do dłuższego rozumowania przy złożonych zadaniach,
- router w czasie rzeczywistym, który wybiera właściwy tryb na podstawie złożoności zadania, potrzebnych narzędzi oraz wyraźnego polecenia użytkownika („pomyśl nad tym głębiej”).
Zapewnia to szybkie odpowiedzi na proste pytania i dogłębną, wiarygodną analizę w przypadku bardziej skomplikowanych.
Dokładność i redukcja halucynacji
GPT-5 znacząco zmniejsza liczbę błędów faktycznych w porównaniu z GPT-4/4o i został wytrenowany tak, aby przyznawać się do niepewności, zamiast „zgadywać”. Zredukowano również nadmierną uległość, co zwiększa zaufanie i klarowność odpowiedzi.
Benchmarki i wydajność w realnych zastosowaniach
W matematyce, programowaniu, rozumieniu multimodalnym i medycynie GPT-5 wyraźnie przewyższa GPT-4/4o.
| Obszar | GPT-4/4o (wynik referencyjny) | GPT-5 (wynik referencyjny) | Kluczowa różnica |
|---|---|---|---|
| Matematyka konkursowa (AIME) | Mocny, ale niespójny | Nowy SOTA; znacznie wyższy pass@1 | Znaczny wzrost dokładności na poziomie konkursowym |
| Inżynieria oprogramowania (SWE-bench Verified) | Średni wskaźnik rozwiązań | Znacznie wyższy wskaźnik pass | Duża poprawa w pracy z rzeczywistymi repozytoriami |
| Multimodalność (MMMU i pokrewne) | Dobre wyniki przy obrazach statycznych | Lepsze wyniki przy obrazach, wideo, diagramach i zadaniach przestrzennych | Dojrzała, niezawodna multimodalność |
| Medycyna (HealthBench) | Pomocny, ale niespójny | Najlepszy do tej pory; bezpieczniejszy i dokładniejszy | Znaczny postęp w realistycznych konsultacjach |
Możliwości multimodalne
GPT-4 wprowadził wejście multimodalne i dobrze radzi sobie z obrazami statycznymi. GPT-5 rozszerza te możliwości, osiągając wyższą dokładność w pracy z diagramami, ilustracjami naukowymi, zadaniami przestrzennymi i wideo, co pozwala skuteczniej wydobywać informacje z złożonych danych wizualnych.
Specjalizacja branżowa
Programowanie: GPT-5 konsekwentnie tworzy kompletne aplikacje/strony, obsługuje duże repozytoria i wykazuje lepsze wyczucie estetyki we frontendzie (odstępy, typografia, wykorzystanie pustej przestrzeni).
Pisanie kreatywne: Lepsza struktura literacka (np. stabilny jamb lub wiersz wolny), silniejsze metafory i mocniejsze zakończenia.
Medycyna: Bardziej kontekstowy i proaktywny; lepiej wykrywa ryzyka i proponuje kolejne kroki (nie zastępuje lekarza).
Bezpieczeństwo, uczciwość i styl
GPT-5 wprowadza safe completions — pomocne, lecz ograniczone odpowiedzi zamiast natychmiastowych odmów, gdy można przekazać bezpieczne szczegóły. Model wyraźniej informuje o ograniczeniach i niepewności, rzadziej podaje błędne informacje w braku narzędzi i zmniejsza nadmierną uległość, czyniąc dialog bardziej uczciwym i przydatnym.
Personalizacja i doświadczenie użytkownika
Lepiej podąża za instrukcjami użytkownika. Nowe gotowe style (np. Cynik, Robot, Słuchacz, Nerd) pozwalają szybko zmienić ton komunikacji, z mniejszą ilością pochlebstw.
Dostępność i użycie
GPT-5 jest nowym modelem domyślnym w ChatGPT (dla użytkowników darmowych po osiągnięciu limitu działa GPT-5 mini). Użytkownicy Plus/Team mają wyższe limity; Pro uzyskują dostęp do GPT-5 Pro z dłuższym i bardziej szczegółowym rozumowaniem dla złożonych zadań.
Rozszerzone podsumowanie: gdzie GPT-5 jest lepszy
- Adaptacyjne rozumowanie: Dynamiczny router automatycznie wybiera tryb szybki lub dogłębny.
- Mniej halucynacji: Znacznie niższy odsetek błędów niż GPT-4/4o w realnych zapytaniach.
- Większa uczciwość: Szybciej przyznaje się do braku pewności lub narzędzi zamiast zgadywać.
- Mniej pochlebstw: Rzadziej nadmiernie się zgadza; bardziej wyważony ton.
- Programowanie na dużą skalę: Wyższe wyniki w SWE-bench; lepsza praca z dużymi repozytoriami; lepszy frontend.
- Pisanie kreatywne: Silniejsze obrazy, lepsza struktura i zakończenia; większe mistrzostwo w formach poetyckich.
- Konsultacje medyczne: Lepsze wyniki w złożonych przypadkach; bezpieczniejsze i dokładniejsze odpowiedzi.
- Multimodalność: Lepsza obsługa obrazów, diagramów, ilustracji naukowych, zadań przestrzennych i wideo.
- Podążanie za instrukcjami: Dokładniejsze wykonywanie wieloetapowych zadań; lepsze użycie narzędzi.
- Wywoływanie funkcji: Lepsza koordynacja narzędzi i adaptacja do zmian kontekstu.
- Efektywność rozumowania: Wyższa dokładność przy mniejszej liczbie tokenów.
- Personalizacja: Lepsza obsługa instrukcji użytkownika; gotowe style do szybkiej zmiany tonu.
- Szkolenie w zakresie bezpieczeństwa: Safe completions z użytecznymi odpowiedziami; mniej zbędnych odmów.
- Odporność na oszustwa: Mniej pewnych, ale błędnych odpowiedzi w niewykonalnych scenariuszach.
- Gotowość biznesowa: Wyższe limity, większa niezawodność i tryb Pro do zadań o wysokiej wartości.
Wniosek: GPT-4 postawił wysoko poprzeczkę; GPT-5 ją przeskoczył, oferując mądrzejsze rozumowanie, większą dokładność praktyczną, lepszą multimodalność, bezpieczniejsze zachowanie i płynniejsze doświadczenie użytkownika.