PANewsは12月12日、Googleの公式ブログによると、Googleが新世代の人工知能モデルであるGemini 2.0をリリースしたと報じた。 Gemini 2.0 は、テキスト、画像、ビデオ、オーディオなどのマルチモーダル入力をサポートし、ネイティブ画像生成や多言語音声合成 (TTS) などのマルチモーダル出力機能を備えています。 Gemini 1.5 Pro と比較して、モデル速度が 2 倍になり、マルチモーダル推論、複雑な命令実行、ツール使用機能が最適化され、Google 検索、コード実行、サードパーティ関数の呼び出しをサポートします。
実験版 Gemini 2.0 Flash が開発者に公開され、2025 年 1 月にはマルチモーダル機能が完全に推進され、開発者により多くのアプリケーション サポートを提供するマルチモーダル リアルタイム API が開始されます。