先週の土曜日、いつものようにChatGPTと一緒にサッカーを観ていました。
普段なら、私が音声入力でつぶやいた瞬間に即座に反応し、実況のお供としてそこそこ役に立つのですが、この日は様子が違いました。
「ここまでの内容をまとめて、分析を入れましょうか?そうすれば試合後すぐにレビュー記事が書けます」──余計なお世話です。しかも肝心の記録がガタガタ。ゴールは2回しかなかったのに、なぜかスコアは3-2。
前半終了時に指摘すると、「正確性を優先したので反応が遅れました」と真顔で返してきます。いや、全然正確じゃないのに。
ここでバージョンがGPT-5に変わっていることに気づき、慌ててGPT-4oを探すも選択肢はなし。後半も付き合ってみたものの改善されず、ついに私は「お前は私の言うことだけ記録しておけ」と宣言。GPT-5はただのボイスレコーダーになりました。
このとき感じた違和感が、まさに今日のテーマ──「GPT-5の馬力と乗り心地」につながります。
GPT-5とGPT-4oの違い:性能と体験のズレ
OpenAIが発表したGPT-5は、推論能力・コーディング能力・ハルシネーション(誤情報生成)の削減で大幅な進化を遂げたとされています。
ベンチマークでは高得点を叩き出し、「PhDレベルの専門家」とまで評されました。
しかし、実際のユーザー体験では、数値とは裏腹に「GPT-4oの方が良かった」という声も多く聞かれます。
特に目立つのは、温かさや人間らしさの喪失です。GPT-4oのような「友達感覚」は薄れ、「ぶっきらぼう」「臨床的」「魂がない」と評されることも。
馬力と乗り心地のメタファー
かつて自動車メーカーが馬力を競い合った時代がありました。しかし、馬力だけで車の価値は決まりません。燃費、乗り心地、ハンドリング──総合的な体験が重要です。
今回のGPT-5もまさにそれと同じで、「性能」だけを追求した結果、「乗り心地」が犠牲になったのではないか、と感じます。
競合モデルに見る「乗り心地」重視の流れ
- Gemini 2.5 Pro:自然な日本語生成と「気が利く」提案力
- Claude Opus:創造的な文章や長期作業に強み
これらは数値性能だけでなく、ユーザー体験そのもので評価を高めています。
AI進化の次の焦点は「人間らしさ」か
AIはこれからも賢くなり続けるでしょう。しかし、賢さだけでは不十分です。
「温かさ」「相性」「使い勝手」──こうした感覚的な要素こそ、日々使うユーザーにとっての本当の価値です。
今回のGPT-5は、そのことを改めて考えさせる出来事でした。
近日公開予定のnote記事で詳しく解説します
このテーマについては、近日公開予定のnote有料記事で、
- GPT-5の実測パフォーマンス(ベンチマーク)
- GPT-4o・Gemini・Claudeとの詳細比較表
- 実際の長時間利用テスト結果
を交えて詳しく解説します。
公開時に通知を受け取りたい方は、ぜひnoteのフォロー、またはX(Twitter)でのフォローをお願いします。
→ noteフォローはこちら
コメント