1. MetaStep TOP
  2. ビジネス活用を学ぶ
  3. ChatGPT、Claude3、Geminiの実力を検証!文章・画像認識・プログラミング能力の違いは?

2024.08.16

ChatGPT、Claude3、Geminiの実力を検証!文章・画像認識・プログラミング能力の違いは?

2022年11月にChatGPTがリリースされてからAIブームが到来し、2024年8月現在はClaude3(クロードスリー)やGemini(ジェミニ)などの優秀なAIツールが存在します。

結局どのAIツールを使えばよいのかわからないという方のために、今回はChatGPT、Claude3、Geminiの3つのツールを実際に使って生成能力を比較します。比較する能力は以下の通りです。

●文章作成能力

画像認識能力

プログラミング能力

本記事を参考に、自身のビジネスにどのツールが適しているかを見極めるヒントを見つけていただければ幸いです。

なお、すべてのツールはすべて有料版(GPT-4o、Claude3 Opus、Gemini Advanced)を使用しています。

(各ツールの特徴や主な違いについては話題のAIツールはどう違うの?ChatGPT・Claude3・Geminiの主な違いを解説記事を参考にしてください。)

文章作成能力

まずはもっとも基本的な文章作成能力を比較してみましょう。今回は、新しい取引先への挨拶文を作成するために、以下のプロンプトを各ツールに入力しました。

プロンプト

私の業種はIT企業です。

新しい取引先に挨拶するメールの文章を作成したいです。

できるだけ丁寧な文章を生成してください。

ChatGPT

ChatGPTの生成結果は以下の通りです。

生成結果

件名: 【会社名】との新規取引に関するご挨拶

拝啓

平素は格別のご高配を賜り、厚く御礼申し上げます。

さて、この度【貴社名】様と新たに取引を開始させていただくこととなりました。まずは、ご挨拶かたがたご連絡をさせていただきます。

弊社、【あなたの会社名】は、IT業界において長年の経験と実績を持ち、最新の技術とサービスを提供しております。今後、【貴社名】様のビジネスの更なる発展に貢献できるよう、全力を尽くしてまいりますので、何卒よろしくお願い申し上げます。

なお、今後の具体的な進め方や詳細についてご相談させていただきたく存じますので、改めてご連絡の機会を頂戴できれば幸いです。

貴社との協力関係を大切にし、長期にわたる信頼関係を築いてまいりたいと考えております。何かご不明な点やご要望がございましたら、どうぞお気軽にお知らせください。

末筆ながら、貴社の益々のご繁栄をお祈り申し上げます。

敬具

【あなたの名前】

【あなたの役職】

【あなたの会社名】

【あなたの連絡先】

一見丁寧な文書に見えますが、一般的にメール文章では「拝啓、敬具」などの頭語、結語は使いません。また、文頭に取引先の会社名や担当者名が記載されていないことから、修正しないと非常識と捉えられる可能性があります。

Claude3

Claude3の生成結果は以下の通りです。

生成結果

subject: 【ご挨拶】〇〇株式会社の△△と申します

〇〇株式会社

△△部 △△ △△

□□様

はじめまして、〇〇株式会社の△△と申します。

この度は弊社とお取引をいただく機会を賜り、誠にありがとうございます。

心より感謝申し上げます。

弊社は、最新のテクノロジーを活用し、お客様のビジネスに貢献できるソリューションを提供することを使命としております。

長年培ってきた知見とノウハウを活かし、貴社のお役に立てるよう、全力で取り組んでまいります。

今後とも、どうぞよろしくお願い申し上げます。

ご不明な点などございましたら、いつでもお気軽にお問い合わせください。

貴社のますますのご発展と、実りあるパートナーシップを心よりお祈り申し上げます。

敬具

〇〇株式会社

△△部

△△ △△

電話番号:xx-xxxx-xxxx

メールアドレス:xxxx@xxxxxx.co.jp

ChatGPTと比較すると、実用的なメール文章が生成されました。しかし、文頭に「拝啓」がないにもかかわらず、文末に「敬具」だけが記載されています。そもそもビジネスメールで使用しないだけでなく、「敬具」は「拝啓」とセットで使うため、単体で使用するのは適切ではありません。

ChatGPTよりも日本語生成能力が高いと言われるClaude3ですが、細かい点は修正が必要な箇所もあるようです。

Gemini

Geminiの生成結果は以下の通りです。

生成結果

件名:株式会社[御社名] [部署名] [氏名] ご挨拶

〇〇株式会社

〇〇部 〇〇様

拝啓

時下ますますご清栄のこととお慶び申し上げます。

突然のご連絡失礼いたします。

株式会社[御社名] [部署名]の[氏名]と申します。

この度、〇〇様にご担当いただきました[案件名]の件で、

今後、私の方で窓口を担当させていただくこととなりました。

つきましては、まずは書中にてご挨拶を申し上げます。

[案件名]に関しましては、

これまでの経緯や詳細について、〇〇様から

ご教示いただければ大変幸いです。

微力ではございますが、

誠心誠意努めてまいる所存でございますので、

何卒ご指導ご鞭撻を賜りますようお願い申し上げます。

まずは略儀ながらメールにてご挨拶申し上げます。

敬具

[日付]

株式会社[御社名]

[部署名]

[氏名]

[電話番号]

[メールアドレス]

[会社のホームページURL] (もしあれば)

Geminiは、Claude3と似た内容の文章が生成されましたが、プロンプトで入力した「IT企業」の内容は反映されていません。ChatGPTやClaude3と同様に、ビジネスメールでは原則的に不要とされる「拝啓、敬具」を使用しています。

ChatGPTよりも実用的なものの、Claude3よりもやや劣るという結果となりました。

画像認識能力

続いて、各ツールに以下のスパイスカレーの画像を読み込ませ、テキストで内容を説明するようにプロンプトを入力しました。

(引用:写真AC

プロンプト

アップロードした画像を詳細に説明してください。

ChatGPT

ChatGPTの生成結果は以下の通りです。

写真中央の料理の内容や、周囲に配置されたスパイスの内容が正確に説明されています。「美しく盛り付けられた」や、「インド料理の豊かさと多様性を美しくかつ食欲をそそる形で表現」など、料理を表現する描写も印象的です。

Claude3

Claude3の生成結果は以下の通りです。

写真がスパイスカレーであることは認識していますが、プレートにのっている卵が説明されておらず、ChatGPTと比較して詳細な説明はされていません。

また、プレートの周囲に「新鮮な野菜(レタス、キュウリ)が置かれています」とありますが、レタスとキュウリは配置されておらず、正しく認識していないことがわかります。

画像認識においては、Claude3よりもChatGPTの方が優秀であることがわかりました。

Gemini

Geminiの生成結果は以下の通りです。

画面中央の料理がカレーであると認識していますが、具材についての詳細な説明はありません。また、ソースのひとつを「唐揚げ」と勘違いしているようです。

プレートの周囲に配置された食材がスパイスであることは認識していますが、画面左上に3つのスパイスが配置されているものの、「カレーのルーとは別に、4つの小さな白いボウルに入ったスパイスがあります」と、4つだと誤認識しています。

Claude3と同程度の結果となり、ChatGPTが最も高い画像認識能力があることがわかりました。

プログラミング能力

最後に、プログラミング能力の比較をしてみましょう。Pythonコードを使ってブロック崩しゲームを作成するため、以下のプロンプトを各ツールに入力しました。

プロンプト

ブロック崩しゲームを作成するPythonコードを作成できますか?

各ツールの生成結果を見てみましょう。

ChatGPT

ChatGPTでは、以下のような回答が得られました。

実際にプログラムを動かした画面は以下の通りです。

シンプルな見た目のブロック崩しゲームが完成しました。ボールを打ち返すバーはキーボードのカーソルキーで動き、ゲームオーバーになるとプログラムが終了します。コードやゲーム性に不足があるとは感じられません。

ボールの速度やブロックの量は、プロンプトで指示すればコードが修正されます。

Claude3

続いて、Claude3の生成結果を見てみましょう。

2024年7月時点では、画面左側に質問の回答が、右側にPythonコードが生成されます。ChatGPTではコードを確認するために画面をスクロールする必要があるため、Claude3の方がコードの改変や修正時の視認性が良く感じました。

コードを実行した画面は以下の通りです。

ChatGPTよりもカラフルなブロックが配置され、バーはカーソルキーではなくマウスで操作するゲームが完成しました。

ただし、マウスでバーが動くことが優秀という訳ではなく、ChatGPTでもコード生成後に「バーをマウスで操作するシステムに変更して」と指示すればコードが修正されます。

Gemini

最後に、Geminiの生成結果を見てみましょう。

ChatGPTやClaude3と比較して大きな違いは見られません。実際にゲームを実行した画面は以下の通りです。

ChatGPTと同じように、カーソルキーでバーを操作するシンプルなゲームが作成できました。しかし、ボールの速度が速すぎて開始直後にゲームオーバーになり、バーが動く速度も速すぎました。また、バーが動く速度がゲームの途中で遅くなるという不具合も発生しています。

ゲームをプレイするためにはコードを修正する必要があるため、プログラミング能力はChatGPT、Claude3と比較してやや劣るという結果になりました。

まとめ

ChatGPTとClaude3、Geminiの生成能力の違いを、文章作成能力、画像認識能力、プログラミング能力で比較しました。

文章作成能力ではClaude3が比較的優秀で、GeminiとChatGPTにはやや課題が残る結果に。画像認識能力についてはChatGPTが圧倒的で、Claude3とGeminiは同程度の能力があることがわかりました。

プログラミング能力についてはClaude3がChatGPTよりもやや優れた結果を見せ、Geminiはコードの修正が必要だという結果になりました。

今回の比較を参考に、ぜひ自身のビジネスに役立てていただければ幸いです。