Google が公式ポッドキャストで、Pixel 10 シリーズに搭載されているチップ「Tensor G5」の技術的な詳細を公開しました。
このチップは、デバイス上で高度な AI 処理を実行することに重点を置いて設計されています。
40 億パラメータの AI モデルがデバイス上で動作
Google のシリコンチームでグループプロダクトマネージャーを務める Jesse Seed 氏によると、Pixel 10 はデバイス上で約 40 億パラメータの Gemini Nano モデルを動作させます。これは DeepMind と Tensor チームが 1 年以上前から共同で設計してきた成果です。
また、タスクに応じて高速な小規模モデルと高品質なフルモデルを切り替える単一の大規模言語モデル(LLM)の「Matformer」という新しいアーキテクチャも導入されました。
10 億パラメータの拡散モデルがカメラ機能を向上
Pixel 10 Pro の「ProRes Zoom」機能は、約 10 億パラメータを持つ拡散モデル(Diffusion Model)によって実現されています。このモデルは Tensor G5 上で直接動作します。
Jesse Seed 氏によると、Tensor G5 に搭載された TPU の性能が 60% 向上したことなどにより、従来は 100 秒以上かかっていた処理が数秒に短縮されました。これにより、Pixel 10 Pro は 100 倍ズームでも精細なディテールを捉えることが可能になります。
事前登録不要の音声再現とパフォーマンス向上
リアルタイム翻訳機能「マイボイス通訳」では、事前の音声登録なしにユーザーの声をリアルタイムで再現し、翻訳音声として使用できます。
また、レコーダーアプリの要約機能は、Tensor G5 のCPU、メモリ、ストレージの改良により、前モデル比で 2.6 倍高速化し、エネルギー効率も 2 倍に向上しました。
ベンチマークスコアよりも「AI フォン」としての実用性を重視
Google は、Tensor チップをベンチマークスコアのためではなく、日常での使い勝手と実際の AI 機能のために設計していると説明しており、今回の発表は、その方針を示すものです。
オンデバイスで動作する大規模言語モデルや拡散モデルによる写真撮影、リアルタイムの音声再現といった機能は、Pixel が Google の目指す「AIフォン」に近づいていることを示唆します。
まとめ
Pixel 10 に搭載されている Tensor G5 は、デバイス上での高度な AI 処理に重点を置いています。
これにより、大規模言語モデルのオンデバイス実行や、拡散モデルを利用した高度なカメラ機能などが実現されています。
筆者も Pixel 10 Pro を愛用していますが、Pixel 10 シリーズは、ベンチマークやゲーミングパフォーマンスを求めるユーザーには物足りない性能かもしれませんが、日常における使い勝手や AI 機能、電力効率などトータルバランスを重視したデバイスに仕上がっています。