最近、Googleから音声合成モデル「T5Gemma」というボイスエンコーダー、デコーダが発表されました。 T5Gemma-TTS試してみました 自分の声、約10秒ほどのゼロショット学習です。
# Copyright 2026 The Qwen team, Alibaba Group and the HuggingFace Inc. team. All rights reserved. # Licensed under the Apache License, Version 2.0 (the "License ...