グーグルは米国時間2026年3月24日、AIのアテンション計算をエヌビディア製H100 GPU上で最大8倍に高速化しながら、同時にメモリー消費を最大6分の1に削減する圧縮アルゴリズム「TurboQuant」を発表した。精度の劣化はゼロだ。同社はすでにGeminiへの適用を主要ユースケースとして明示しており、単なる研究成果にとどまらない実装レベルの技術として位置づけている。 背景として知っておくべき ...
たとえば「次の旅行用に新しいコートが欲しい」と検索すると、AIモードはユーザーの好みや旅行先の気候条件を踏まえ、防風性があり、かつ「いつもの雰囲気」に合うコートを提案する。Googleはこれを「あなたの旅程と好みを理解しているパーソナル ...