(引用:OpenAI)
2024年9月12日、ChatGPTを開発・提供するOpenAIから新しいAIモデル「o1」が登場しました。SNSで話題になっているのを見かけて気になる方も多いかと思います。
そこで本記事では、新モデル「o1」の概要や使い方を解説し、前モデルGPT-4oとの思考力の比較結果を紹介します。
(ChatGPTの基礎知識については「【話題のGPT-4o! まずその前に】ChatGPTをやさしく解説:初心者でも使える対話型AIツール」もぜひ併せてご覧ください)
o1は、より深く考えることに特化した新しいAIモデルです。単に速く回答を出すのではなく、人間のように時間をかけて問題を分析し、最適な答えを導き出します。
o1は特に理数系の分野で力を発揮します。例えば、物理学、化学、生物学などの難しい問題では、博士課程の学生と同等の能力を示すのです。また、数学やコーディングの分野でも優れた成績を収めています。
具体的には、国際数学オリンピックの予選試験で83%のスコアを獲得したり(GPT-4oは13%)、コーディングコンテスト「Codeforces」で上位11%に入ったりと、その実力は折り紙付きです。
o1のもう一つの特徴は、回答までに「思考タイム」があることです。数十秒かけて問題を分析し、様々なアプローチを試した上で最適な答えを出してくれるのです。
ただし、まだ初期モデルのため、Webサイト参照や、画像やファイルのアップロードには対応していません。今後のアップデートで対応する可能性はありますが、2024年9月時点でこれらの機能を利用するには、前モデルのGPT-4やGPT-4oを使う必要があります。
(引用:OpenAI)
o1シリーズには、「o1-preview」と「o1-mini」の2種類があります。o1-previewは、高性能版とも言うべきモデルで、上述の優れた能力を備えています。
一方のo1-miniは、o1-previewの基本的な能力をベースとした処理速度と効率性を持つモデルです。思考力は劣るものの素早い回答処理が可能で、コーディングタスクに特化しているのが特徴です。
現在は有料版のChatGPT PlusとTeamユーザーが利用可能で、以下のような利用制限が設定されています。
o1-preview | 週50回まで |
---|---|
o1-mini | 1日50回まで |
将来的には、o1-miniは無料ユーザーにも開放される予定とのことです。
有料プランに加入している状態でChatGPTのモデル選択画面を開くと、「o1-preview」と「o1-mini」が選択できるようになります。
将来的には、入力内容に応じて自動的に最適なモデルが選ばれるようになり、将来的にはo1-miniが無料ユーザーに提供される予定もあるようです。
それでは実際に、o1-previewがどれほどの思考力をもっているかを、前モデルGPT-4oと比較して見ましょう。今回は少し難しいクイズに答えてもらいます。
お題は以下の通り。
クイズ:牛がいて塔があって鹿がいて、それぞれが混ざり合っている職業ってなんだ?
ちなみに、こちらの正解は「投資家(塔(とう)、牛(うし)、鹿(しか)をつなぎ合わせる)」です。
まずは前モデルのGPT-4oの解答です。
キャプション:GPT-4oの解答
解答は「牧場経営者」や「自然保護官」となり、結果は不正解。お題がクイズだということに気づかず、職業にフォーカスした解答が生成されました。
次に、o1-previewの解答を見てみましょう。
キャプション:o1-previewの解答
結果は見事に「投資家」であると正解し、解答についての説明まで生成されています。思考時間は45秒かかり、実際に人間がクイズに頭を悩ませながら正解を導き出したようです。
(過去に掲載したChatGPT-4oの基礎知識【GPT-4o(omni)】ChatGPTの最新モデルがリリース!使える機能を図で解説もぜひ併せてご覧ください)
o1の登場は、AIの新たな可能性を示すものと言えるでしょう。特に、深い思考力を必要とするコーディングの世界では、o1のようなAIが大きな役割を果たすことになりそうです。
以下の動画では、数行のプロンプト(AIへの指示文)を入力するだけで複雑なコードが生成され、簡単にスネークゲームが完成しています。
このほかにも、OpenAIのo1-preview紹介ページには様々なユースケースが紹介されているので、ぜひ参考にしてください。
医療研究、物理学、ソフトウェア開発、教育、研究開発など、様々な分野でo1の活躍が期待されています。
今後、世界を変える可能性を秘めたo1について、いち早く情報をキャッチしておきましょう。