株式会社LegalOn Technologies(本社:東京都渋谷区代表取締役 執行役員・CEO:角田望、以下LegalOn Technologies)は、日本の企業法務実務における大規模言語モデル(LLM)の性能を評価するベンチマークデータセット「Legal Rikai: Open Benchmark」を公開しました。「Legal ...
「CPU」「2Dグラフィックス」「3Fグラフィックス」「メモリ」「ディスク速度」の5項目について、それぞれ複数のベンチマークを行って詳細な数値化を行ってくれるベンチマークソフトが「PassMark PerformanceTest」です。 まずは公式サイトのダウンロードページ ...
NVIDIAの新世代GPU「GeForce RTX 5070 Ti」の発売が2月20日に予定されている。国内販売想定価格が14万8,800円からと発表されているBlackwell世代の準ハイエンドGPUで、先に発売された上位GPU同様に高い注目を集めている。 今回、同GPUを搭載するPalit Microsystems製のビデオ ...
「PassMark PerformanceTest」などのベンチマークソフトウェアを開発するPassMarkが、世界中のWindows PCから得られたCPUのベンチマークスコアの平均値を算出しました。これによると、2025年は計測開始以来初めて「CPUの平均スコアが前年を下回った年」になったとの ...
~国内開発のAIエージェント技術として世界最高水準の性能を実証~ JAPAN AI株式会社(本社:東京都新宿区、代表取締役社長:工藤 智昭、以下JAPAN AI)は、AIコーディングエージェント「JAPAN AI Code」が、ソフトウェア開発AIの国際的な評価基準であるSWE-bench ...
自分が使っているLLMの性能はどの程度なのか。そもそもLLMの性能を評価するにはどうすればよいのか。そうした疑問を解消する、LLMの「ベンチマーク」や実施方法を紹介する。 LLMのベンチマークは、LLMの性能を評価するための標準化された手順や指標だ。