Amazonタイムセールが開催中!
PR

ChatGPTが音声・画像も認識して返答が可能に!

ChatGPTが音声・画像も認識して返答が可能に! WEBサービス
ChatGPTが音声・画像も認識して返答が可能に!

OpenAIがChatGPTに新たに音声・画像認識機能を実装したことを発表しました。

テキストだけでなく合成音声でChatGPTとの会話が可能に

テキストだけでなく合成音声でChatGPTとの会話が可能に

ChatGPT can now see, hear, and speak

OpenAIによると、声の元はプロの声優と協力してを作成したそうで、OpenAIの文字起こしAI「Whisper」 を使用して、話した言葉を文字に起こしているようです。

音声も複数用意されていて、公開ページでは違和感を感じない音声サンプルを聞くこともできます。

画像を認識してChatGPTが回答

ChatGPTに画僧を送って質問すると、その画像を認識したうえで回答をしてくれます。

サンプルではChatGPTに自転車のサドルの調節の方法を質問していて、それに対してChatGPTは自転車の画像を認識て、サドル調節の方法を回答してくれています。

この新たな機能は現在、ChatGPT PlusかChatGPT Enterpriseサービスを契約している方に限られ、今後2週間以内に音声と画像認識機能を利用できるようになるとしています。

実際にはまだ精度はあまり高くないという話ではありますが、精度が上がれば様々なところで活用できるようになりそうです。

タイトルとURLをコピーしました