株式会社エーピーコミュニケーションズの永里氏は、リアルタイム文字起こし処理について、検証のアーキテクチャを紹介し、実際にデモを行いました。 永里氏の自己紹介 永里洋氏:今回はStudyCoさんのLT会に初参加ということで、よろしくお願いいたします。
OpenAIは文字起こしAIのWhisperを「人間レベルの堅牢性と正確性を持ったツール」と宣伝していますが、これには大きな欠点があると専門家たちが指摘しています。十数人のソフトウェアエンジニア、開発者、学術研究者にインタビューしたというAP通信による ...
ウェブブラウザ「Firefox」などを開発するMozillaが、OpenAIの「Whisper」ベースの文字起こしAI「Whisperfile」を開発中であることを発表しました。Whisperfileでは、英語以外の音声を英語に翻訳することも可能とのことです。 Mozillaが開発中のWhisperfileは、OpenAIの文字 ...
インター・ラボ株式会社(本社:大阪府大阪市、代表取締役:長山 清志)は、Whisperを利用した音声文字起こしAPI、「WhisperAPI」の無償提供を12月15日(木)より開始します。その高い音声認識精度を持つWhisperを用いたAPIを無償提供し、外部サービスと連携 ...
米AppStoreにて配信が始まった「ChatGPT for iOS」 ChatGPTはユーザーが自然言語を用いて、AIと対話できるのが大きな特徴。質問に対する答えをチャット形式で得られる他、文章やコンテンツの作成も可能だ。初めて一般公開されたのは2022年11月で、その言語モデル ...
AutoMemoは、ソースネクストが2020年12月に最初のモデルを発売したAIボイスレコーダーです。 2022年1月にはコンパクトなポケットサイズの本体に、音声文字起こしの結果をリアルタイムに表示するタッチ液晶を載せた「AutoMemo S」がラインナップに加わりました。
米OpenAIは3月19日(現地時間)、Python開発者向けの高速なツール群を提供する米Astralを買収することで合意したと発表した。買収総額などの取引の詳細は公表されていない。 買収の主な目的は、OpenAIのプログラミング支援AI「Codex」の成長を加速させ、単なる ...
会員(無料)になると、いいね!でマイページに保存できます。 Astralは2022年に創業したニューヨーク州ブルックリンを拠点とする企業で、Rust言語を用いて構築された高速なPython開発ツールを提供している。代表的な製品には、コードチェックおよび整形 ...