GPT-5とGPT-4oの違いは性能だけじゃない──馬力と乗り心地で考えるAI進化のジレンマ

AIとテクノロジー

GPT-5とGPT-4oの性能とユーザー体験をF1マシンと高級セダンで比較したイメージ

先週の土曜日、いつものようにChatGPTと一緒にサッカーを観ていました。
普段なら、私が音声入力でつぶやいた瞬間に即座に反応し、実況のお供としてそこそこ役に立つのですが、この日は様子が違いました。

「ここまでの内容をまとめて、分析を入れましょうか?そうすれば試合後すぐにレビュー記事が書けます」──余計なお世話です。しかも肝心の記録がガタガタ。ゴールは2回しかなかったのに、なぜかスコアは3-2。

前半終了時に指摘すると、「正確性を優先したので反応が遅れました」と真顔で返してきます。いや、全然正確じゃないのに。
ここでバージョンがGPT-5に変わっていることに気づき、慌ててGPT-4oを探すも選択肢はなし。後半も付き合ってみたものの改善されず、ついに私は「お前は私の言うことだけ記録しておけ」と宣言。GPT-5はただのボイスレコーダーになりました。

このとき感じた違和感が、まさに今日のテーマ──「GPT-5の馬力と乗り心地」につながります。

GPT-5とGPT-4oの違い:性能と体験のズレ

OpenAIが発表したGPT-5は、推論能力・コーディング能力・ハルシネーション(誤情報生成)の削減で大幅な進化を遂げたとされています。
ベンチマークでは高得点を叩き出し、「PhDレベルの専門家」とまで評されました。

しかし、実際のユーザー体験では、数値とは裏腹に「GPT-4oの方が良かった」という声も多く聞かれます。
特に目立つのは、温かさや人間らしさの喪失です。GPT-4oのような「友達感覚」は薄れ、「ぶっきらぼう」「臨床的」「魂がない」と評されることも。

馬力と乗り心地のメタファー

かつて自動車メーカーが馬力を競い合った時代がありました。しかし、馬力だけで車の価値は決まりません。燃費、乗り心地、ハンドリング──総合的な体験が重要です。
今回のGPT-5もまさにそれと同じで、「性能」だけを追求した結果、「乗り心地」が犠牲になったのではないか、と感じます。

競合モデルに見る「乗り心地」重視の流れ

  • Gemini 2.5 Pro:自然な日本語生成と「気が利く」提案力
  • Claude Opus:創造的な文章や長期作業に強み

これらは数値性能だけでなく、ユーザー体験そのもので評価を高めています。

AI進化の次の焦点は「人間らしさ」か

AIはこれからも賢くなり続けるでしょう。しかし、賢さだけでは不十分です。
「温かさ」「相性」「使い勝手」──こうした感覚的な要素こそ、日々使うユーザーにとっての本当の価値です。
今回のGPT-5は、そのことを改めて考えさせる出来事でした。

近日公開予定のnote記事で詳しく解説します

このテーマについては、近日公開予定のnote有料記事で、

  • GPT-5の実測パフォーマンス(ベンチマーク)
  • GPT-4o・Gemini・Claudeとの詳細比較表
  • 実際の長時間利用テスト結果

を交えて詳しく解説します。
公開時に通知を受け取りたい方は、ぜひnoteのフォロー、またはX(Twitter)でのフォローをお願いします。
noteフォローはこちら

コメント

タイトルとURLをコピーしました