ソフトバンクの子会社でAIの研究開発などを手掛けるSB Intuitions(東京都港区)は6月17日、大規模視覚言語モデル(VLM)の基礎などをまとめた資料「大規模視覚言語モデルの開発」を無料公開した。5月に開催した人工知能学会全国大会(JSAI)の講演で使用し ...
キヤノンITソリューションズ(キヤノンITS)は2025年11月12日、異常監視システム「ANOMALY WATCHER」に、視覚言語モデル(VLM)と連携した異常検知機能を追加した。「人が倒れている状態を検知対象とする」といった自然言語で異常状態のルールを設定できる。
IoTデバイスNo.1ブランド(2022年11月 家電Biz調べ)のSWITCHBOT株式会社は、「見る・考える・動かす」を1台に集約した次世代スマートホーム中枢「AIハブ」の予約販売を開始しました。VLMによる映像理解、ローカルAIによる顔や物体の識別に加え、ローカルでの ...
この資料では、VLM(大規模視覚言語モデル)の基礎から、LLM(大規模言語モデル)とVLMの違い、開発ステップや業界・分野での活用事例など、詳細な情報をわかりやすくまとめています。 特に、画像を用いた検索・解析や、画像処理と言語処理を統合したAI ...
# Toyota Woven City×AI「掛け算戦略」2026年4月22日全解説:スマートシティVLM×中小企業参入3機会と今月の設計図 2026年4月22日、Toyotaはウーブン・シティにおけるAI技術の最新動向を公式に発表しました。翌23日には最終アクセラレーターピッチイベントが開催され ...
現在、人工知能(AI)の発展は急速に進んでおり、特に視覚情報と言語情報を組み合わせて処理できるVision Language Model(以下、VLM)は、ビジネスに新たな可能性を提供しています。 本記事では、VLMの概要と構造、ビジネス上のインパクトについてご紹介します ...
生成AI技術で柔軟性の高い異常監視を実現 「ANOMALY WATCHER」とVLMの連携により新たな検知手法を提供 キヤノンマーケティングジャパングループのキヤノンITソリューションズ株式会社(本社:東京都港区、代表取締役社長:金澤 明、以下キヤノンITS)は、製造 ...
Stability AIは11月13日、商用利用可能な日本語画像言語モデル「Japanese Stable VLM」をリリースした。公開中のGoogle Colabページにて試用できる。 「Japanese Stable VLM」は、「Japanese Stable LM Instruct Gamma 7B」をベースとした日本語画像言語モデル。VLMはVision-Language Modelの略 ...
こうした中、ソフトバンク株式会社は、株式会社安川電機と共同で、自社の物流倉庫におけるフィジカルAIの実タスクを用いた動作検証を実施し、ロボットによる柔軟で高精度な物体把持と配置作業に成功したと発表した。
前回までは「gpt-oss-20b」を使ってテキストデータを用いたLLMの活用方法を解説してきた。テキストデータだけでも十分活用できるが、欲を言えば画像や動画、音声なども取り扱えるようにしたいところだろう。 そんな方に朗報だ。LM Studioではテキストデータ ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する