Microsoftは、大規模言語モデル(LLM)以外のAIモデルへの投資を強化している。同社は米国時間4月2日、3つの新しいモデルをリリースすると発表した。音声を文字起こしする「MAI-Transcribe-1」、音声生成モデル「MAI-Voice- ...
Microsoftが自社開発の新基盤モデルを公開した。音声認識、音声生成、画像生成向けの3種で、高い品質に加え、効率的な処理速度で価格競争力も打ち出す。生成AIを他社製モデルに頼るだけでなく、自社モデル群の拡充を本格化させた点が注目される。
Microsoftが、高精度な多言語音声認識モデル「MAI-Transcribe-1」を公開した。日本語を含む25の主要言語に対応し、企業向けの音声処理用途を想定したモデルとなっている。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する