ChatGPTは、OpenAI社が2022年11月に公開した、人工知能チャットボット。人間のような自然な会話でさまざま生成AIのサービスを利用できるのが特長です。最新版「GPT-4V」は従来のテキストベースから画像認識機能を搭載し、完全無欠な存在に近づきつつあります。GPT-4Vの画像認識で何ができるか見ていきましょう。
GPT-4Vは画像認識で写真をテキスト化
GPT-4Vの「V」はVisualのことで、画像認識機能を新たに搭載。例えば読み込ませた画像が何なのかを説明をさせたり、写真の撮り方のアドバイスを受けたり、写真に写り込んでいる場所を特定させたりなど、さまざまな使い方が可能です。
GPT-4Vで使える画像認識の活用例に「画像の説明」があります。どういった画像なのかをテキストで説明。写真の中に写り込んでいる物や風景を的確に言語化してくれます。
GPT-4Vでは「場所の特定」も可能。写真が撮影された場所を、写り込んでいる建物の特徴などから特定します。正確に特定するためには、ランドマークになる建物や目印が必要です。
GPT-4Vは画像認識で撮影のアドバイス
GPT-4Vは「写真のアドバイス」も可能。アップロードされた写真について、構図だけでなく明るさなど撮影に関するテクニックを細かくアドバイスしてくれます。デザインや絵のアドバイスにも利用可能です。
さらに、GPT-4Vでは「宿題をやらせる」ことも可能。例えば算数の計算問題を写真に撮れば、テキスト化せずともGPT-4Vに解かせることができるというわけです。
GPT-4Vは高校生レベルの数学はカバーしているといいます。ちなみにスマホ版には、音声認識も追加されており、こちらも用途が広がっているのです。
【関連リンク】
チョコボール銀と金のエンゼルの当たり確率と見分け方
セブンイレブン700円くじ引き景品の抽選確率を上げる方法
NHK地上契約のみがバレることないBSメッセージ消去の裏ワザ
チョコボールおもちゃの缶詰の当たりの見分け方
青春18切符の裏ワザとそれより安いJRのお得な切符
情報提供元:ラジオライフ
記事名:「GPT-4Vの画像認識で写真から場所が特定できる?」