開発のJSです。
本日は5/14にリリースされた米OpenAI社のchatGPTの新モデル「GPT-4o」がすごいと話題になっていたので、少し調べてみました。
GPT-4oの”o”は、omniの略のようで、「全て・全方位」の意味があるそうです。
なにがすごいの?
1.出力が高速になり、精度も向上
私自身は無料版しか利用したことがありませんが、質問から回答まで時間がかかることがあり、待ち時間が発生します。しかし、4 oは4 Turbo(1つ前のモデル)よりも2倍応答速度が早くなったとのこと。あっという間に出力が完了します。
2.音声チャット精度が向上
GPT 4o以前の音声チャットでの会話は、3つの独立したモデルの組み合わせによって実現していたため、待ち時間がありました。しかし、今回発表されたモデルではテキスト、音声、視覚すべての入力と出力をすべて1つのモデルにしたことで、応答速度が格段に速くなり、AIではなく人との会話をしているように錯覚してしまうほど優れたモデルになりました。
公式が発表した映像の中で驚いたのは、GPTが話す速度を会話の途中で人が「もう少しゆっくり話して」と伝えると、会話中でも関係なく会話の速度をGPT自身が調節して会話を始めたのです。本当にびっくりしました。
3.API料金が安くなった。
Model | input | output |
GPT 4o | $5.00 / 1M tokens | $15.00 / 1M tokens |
GPT-4 Turbo | $10.00 / 1M tokens | $30.00 / 1M tokens |
GPT-4 | $30.00 / 1M tokens | $60.00 / 1M tokens |
1つ前のモデル(GPT-4 Turbo)と比較して、100万トークン当たりの入力・出力の料金が半額になり、より使いやすくなったと言えます。
お小遣いが5千円アップしたらGPT-4oを使ってみようかなと思います。