ChatGPT-5 excelle tout particulièrement dans le codage front-end, surpassant OpenAI o3
OpenAI publie ChatGPT‑5 sur sa plateforme API, qualifié SOTA (State-Of-The-Art) dans les principaux benchmarks de codage, avec un score de 74,9 % sur SWE-bench Verified et de 88 % sur Aider Polyglot.
Désormais, ChatPGT-5 peut générer des applications Web complètes en quelques minutes. Plus besoin de savoir programmer, assure OpenAI. Vraiment ?
OpenAI assure avoir formé GPT‑5 pour qu’il devienne un véritable collaborateur de codage. ChatGPT-5 excelle tout particulièrement dans le codage front-end, surpassant OpenAI o3 en développement web front-end dans 70 % des cas. Sur le test SWE-bench Verified, il obtient un score de 74,9 %, contre 69,1 % pour o3, tout en étant plus rapide et avec 22 % de tokens en moins. Il serait particulièrement doué pour rectifier des bugs, éditer le code et répondre à des questions sur des bases de code complexes.
Tâches agentiques de longue durée
L’entreprise Sam Altman dit avoir formé GPT‑5 à des tâches de codage concrètes, en collaboration avec des testeurs précoces issus de startups et d’entreprises. Cursor affirme que GPT‑5 est « le modèle le plus intelligent [qu’ils aient] utilisé » et « remarquablement intelligent, facile à piloter, et possède même une personnalité [qu’ils] n’ont jamais vue chez d’autres modèles ».
Windsurf a indiqué que GPT‑5 est SOTA lors de ses évaluations et « présente un taux d’erreur d’appel d’outils deux fois inférieur à celui des autres modèles frontiers ». Vercel affirme que « c’est le meilleur modèle d’IA front-end, avec des performances exceptionnelles tant sur le plan esthétique que sur celui de la qualité du code, ce qui le place dans une catégorie à part. »
Profondeur de raisonnement
GPT‑5 excelle également dans les tâches agentiques de longue durée, obtenant des résultats SOTA sur τ2-bench telecom (96,7 %), un benchmark d’appel d’outils publié il y a seulement deux mois. L’intelligence améliorée des outils de GPT‑5 lui permet d’enchaîner de manière fiable des dizaines d’appels d’outils, en séquence et en parallèle, sans se tromper, Ce qui le rend bien plus performant pour l’exécution de bout en bout de tâches complexes et concrètes. Il suit également les instructions des outils avec plus de précision. Enfin, il gère mieux les erreurs et excelle dans la récupération de contenu contextuel long.
Manus affirme que GPT‑5 « a atteint les meilleures performances jamais observées avec un seul modèle lors de ses benchmarks internes ». Notion précise que « la rapidité de réponse du modèle, notamment en mode raisonnement faible, fait de GPT‑5 un modèle idéal pour résoudre des tâches complexes en une seule fois ». Inditex met en avant sa profondeur de son raisonnement : des réponses nuancées et multicouches qui reflètent une compréhension réelle du sujet. »
ChatGPT-5 publié en trois tailles
OpenAI introduit de nouvelles fonctionnalités. GPT‑5 prend notamment en charge un nouveau paramètre de verbosité (valeurs : faible, moyenne, élevée) pour aider à contrôler si les réponses sont courtes et concises ou longues et complètes. Le paramètre « reasoning effort » de GPT‑5 peut désormais prendre une valeur minimale pour obtenir des réponses plus rapidement, sans raisonnement approfondi préalable. OpenAI dit avoir également ajouté un nouveau type d’outil : les outils personnalisés, permettant à GPT‑5 d’appeler des outils en texte brut plutôt qu’en JSON. Les outils personnalisés prennent en charge les contraintes imposées par les grammaires hors contexte fournies par les développeurs.
GPT‑5 est pubilé en trois tailles dans l’API : gpt-5, gpt-5-mini et gpt-5-nano, afin d’offrir aux développeurs une plus grande flexibilité pour concilier performances, coût et latence. Alors que GPT‑5 dans ChatGPT est un système de modèles raisonnés, non raisonnés et routeurs, GPT‑5 dans la plateforme API est le modèle raisonné qui optimise les performances de ChatGPT. Notamment, GPT‑5 avec raisonnement minimal est un modèle différent du modèle non raisonné de ChatGPT et mieux adapté aux développeurs.