米Googleは4月15日(現地時間)、最新のテキスト読み上げ(Text-to-Speech)モデル「Gemini 3.1 Flash TTS」を発表した。「Gemini API」や「Google AI Studio」(開発者向け)、「Vertex ...
米ElevenLabs社と米IBMは現地時間3月25日、ElevenLabsの音声認識(Speech-to-Text)および音声合成(Text-to-Speech)機能を、IBMのAIエージェント製品である「watsonx ...
スリーシェイクは2026年4月13日、クラウドETLツール「Reckoner(レコナー)」に、PythonまたはJavaScriptでデータ処理を実装できる「コード実行機能」を追加したと発表した。GUIによるノーコード操作だけでなく、コードによるカス ...
DeepLは16日、音声から音声へのリアルタイム翻訳機能「DeepL ...
2026年3月に公開されたTypeScriptライブラリ「Pretext」は登場するやいなやX(旧Twitter)などのSNSを中心にポストが拡散されました。Pretextはウェブ上のテキストの行数や高さを計算してくれるツールとのことですが、その話題 ...
OpenClawの開発者であるピーター・スタインバーガーは先月、レックス・フリードマンと共演したポッドキャストで、音声プロンプトをあまりにも多用して実際に声を失ったと語った。スタインバーガーはいま、ワークフローの一部として音声AIを試す数多 ...