
Arsitektur inti dan penalaran
GPT-4 beroperasi sebagai satu model tunggal selama sesi; pengguna harus memilih mode (misalnya, penelusuran/pemrograman). Penalarannya kuat tetapi tetap, sehingga bisa melambat pada tugas yang kompleks.
GPT-5 memperkenalkan sistem terpadu yang terdiri dari:
- Model cepat untuk respons instan,
- GPT-5 Thinking untuk masalah sulit,
- Router waktu nyata yang memilih model berdasarkan kompleksitas tugas, kebutuhan alat, dan niat eksplisit pengguna (“pikirkan ini secara mendalam”).
Hasilnya: pertanyaan sederhana dijawab dengan cepat, kasus sulit dianalisis secara mendalam dan dapat diandalkan.
Akurasi dan pengurangan halusinasi
GPT-5 menghasilkan lebih sedikit informasi salah dibanding GPT-4/4o, dan lebih sering mengakui ketidakpastian daripada menebak. Tingkat sikofansi juga menurun drastis, meningkatkan transparansi.
Uji perbandingan dan kinerja
Dalam matematika, rekayasa perangkat lunak, interpretasi multimodal, dan kesehatan, GPT-5 mengungguli GPT-4/4o secara konsisten.
| Domain | GPT-4/4o (referensi) | GPT-5 (referensi) | Perbedaan utama |
|---|---|---|---|
| Matematika Kompetisi (AIME) | Kuat tapi tidak konsisten | SOTA baru; pass@1 jauh lebih tinggi | Lompatan besar dalam akurasi tingkat kompetisi |
| Rekayasa Perangkat Lunak (SWE-bench Verified) | Tingkat penyelesaian masalah sedang | Tingkat keberhasilan jauh lebih tinggi | Peningkatan besar pada repositori dunia nyata |
| Multimodal (MMMU & sejenisnya) | Baik pada gambar statis | Lebih kuat pada gambar, video, grafik, penalaran spasial | Multimodalitas matang dan andal |
| Kesehatan (HealthBench) | Bermanfaat tapi tidak konsisten | Terbaik sejauh ini; lebih aman dan akurat | Peningkatan signifikan dalam konsultasi realistis |
Kemampuan multimodal
GPT-4 memperkenalkan input multimodal dan menafsirkan gambar statis dengan baik. GPT-5 melangkah lebih jauh: akurasi lebih tinggi pada grafik, diagram ilmiah, tugas spasial, dan video, sehingga analisis materi visual yang kompleks menjadi lebih efektif.
Kekuatan sektor
Pemrograman: GPT-5 konsisten dalam membangun aplikasi/situs web lengkap, mengelola repositori besar, dan memiliki estetika antarmuka yang lebih baik (spasi, tipografi, area kosong).
Penulisan kreatif: Kontrol bentuk sastra yang lebih baik (misalnya, meteran konsisten atau puisi bebas), metafora yang lebih kuat, akhir yang lebih efektif.
Kesehatan: Lebih kontekstual dan proaktif; lebih baik dalam mengenali risiko dan mengajukan pertanyaan lanjutan (tidak menggantikan profesional medis).
Keamanan, kejujuran, dan gaya
GPT-5 memperkenalkan pendekatan safe completions: memberikan jawaban bermanfaat yang aman, atau penolakan dengan penjelasan transparan. Model ini lebih jarang membuat klaim palsu saat alat tidak tersedia, dan memiliki nada yang lebih seimbang serta tidak terlalu setuju secara berlebihan.
Kustomisasi dan pengalaman pengguna
Kemampuan mengikuti instruksi pengguna meningkat. Kepribadian siap pakai baru (Cynic, Robot, Listener, Nerd) memungkinkan perubahan nada cepat tanpa kehilangan objektivitas.
Ketersediaan dan penggunaan
GPT-5 adalah model default di ChatGPT (pengguna gratis beralih ke GPT-5 mini setelah batas tercapai). Pengguna Plus/Team mendapat kuota lebih tinggi, sementara pengguna Pro mengakses GPT-5 Pro untuk tugas profesional paling kompleks.
Ringkasan diperluas: Bidang di mana GPT-5 jauh lebih baik
- Penalaran adaptif: Router dinamis yang beralih otomatis antara cepat dan mendalam.
- Lebih sedikit halusinasi: Tingkat kesalahan jauh lebih rendah dibanding GPT-4/4o.
- Lebih jujur: Mengakui keterbatasan dan ketidakpastian.
- Lebih sedikit sikofansi: Nada lebih seimbang, menghindari pujian berlebihan.
- Pemrograman proyek besar: Tingkat keberhasilan SWE-bench lebih tinggi; manajemen repositori besar lebih baik; antarmuka lebih estetis.
- Penulisan kreatif: Imajinasi lebih kuat, struktur dan penutupan lebih baik.
- Konsultasi kesehatan: Terbaik sejauh ini; panduan lebih aman dan akurat.
- Multimodal: Kinerja lebih baik pada gambar, grafik, diagram ilmiah, tugas spasial, dan video.
- Instruksi multi-langkah: Lebih akurat, penggunaan alat lebih baik.
- Pemanggilan fungsi: Koordinasi alat yang lebih baik.
- Efisiensi penalaran: Akurasi lebih tinggi dengan token lebih sedikit.
- Kustomisasi: Instruksi lebih baik, kepribadian siap pakai.
- Pelatihan keamanan: Jawaban aman, lebih sedikit penolakan yang tidak perlu.
- Pengurangan misinformasi: Lebih sedikit klaim salah dalam situasi mustahil.
- Kesiapan perusahaan: Batas lebih tinggi, keandalan lebih baik, penalaran tingkat Pro.
Kesimpulan: GPT-4 menetapkan standar tinggi; GPT-5 melampauinya dengan penalaran lebih pintar, akurasi praktis yang lebih baik, multimodalitas yang lebih kaya, keamanan yang lebih kuat, dan pengalaman pengguna yang lebih halus.