これまでの間に ChatGPT を運営元となる OpenAI が AI を活用した検索エンジンをリリースするという噂がありましたが、新しい情報では検索エンジンではなくマルチモーダルなデジタルアシスタントを発表する可能性が示唆されました。
マルチモーダルとは AI がテキストによる入力だけでなく画像や音声など複数の入力を処理できることで、例えば、カメラを使って現実世界のテキストやモノを映したり、音声入力によって入力すると AI が識別や翻訳をしてくれるといったことができるようになります。
もしこれが本当であれば、これまで噂されていた従来の検索エンジンとは少し違いますが、このような機能は Google がすでに Google レンズ、アシスタント、Gemini で行っているものとほぼ同じで、これらを ChatGPT でもできるようになる可能性があります。
なお、今回の発表では現在のモデルである GPT-4 と GPT-4 Turbo のアップグレードである GPT-5 ではないことはほぼ確実で、新しいバージョンのモデルは2024年後半になると言われています。
いずれにしても現時点ではまだはっきりと発表内容はわかりませんが、「ChatGPTとGPT-4のアップデートのデモ」を行うことは確実なので、どのような機能が登場するかは楽しみです。
ちなみに発表イベントは Google I/O 2024 が行われる1日前(米国では 2024年5月13日 10:00 / 日本では14日 02:00)となっていて、ライブストリーミングで視聴可能です。