GPT-5 tidak hanya unggul dalam menciptakan aplikasi web dari perintah teks, tetapi juga menetapkan standar baru dalam pengembangan perangkat lunak.
Sebagaimana tertulis di laman web OpenAI, GPT-5 mencatatkan skor 74,9 persen pada SWE-bench Verified, sebuah evaluasi berbasis tugas rekayasa perangkat lunak dunia nyata, naik dari skor o3 sebesar 69,1 persen.
GPT-5 mencetak 96,7 persen di τ2-bench telecom, membuktikan kemampuannya merencanakan dan mengeksekusi proyek dari awal hingga akhir secara mandiri.
Selain itu, GPT-5 menunjukkan keunggulan dalam pengembangan front-end. Dalam pengujian, penilai manusia lebih menyukai antarmuka pengguna (UI) yang dihasilkan oleh GPT-5 dibandingkan model sebelumnya seperti o3 dan GPT-4.1, karena desainnya yang lebih estetis dan fungsional.
:strip_icc():format(jpeg):watermark(kly-media-production/assets/images/watermarks/liputan6/watermark-color-landscape-new.png,1100,20,0)/kly-media-production/medias/5309589/original/023471500_1754635026-OpenAI_GPT-5_01.jpg?w=1200&resize=1200,0&ssl=1)