マルチモーダルRAGとは、通常のRAGと何が違うのか? 企業データの90%が非構造化データであり、その80%以上が画像、動画 ...
パナソニック ホールディングス株式会社(以下、パナソニックHD)およびパナソニックR&Dカンパニーオブアメリカ(以下、PRDCA)は4日、カリフォルニア大学ロサンゼルス校(以下、UCLA)の研究者らと共同で、テキスト/画像/音といった異なるデータ形式 ...
会員(無料)になると、いいね!でマイページに保存できます。 フランスのAIスタートアップMistral AIは9月、同社初となるマルチモーダルAIモデル「Pixtral 12B」をリリースした。 Pixtral 12Bとは、テキストと画像を組み合わせた分析が可能なマルチモーダルAI ...
アクロクエストテクノロジー株式会社(本社:神奈川県横浜市・代表取締役:新免流、以下、アクロクエスト)は、テキストでも画像でも、もしくは、その両方合わせてでも検索可能な、次世代の検索を実現する「マルチモーダル検索ソリューション」の ...
生成AIを業務で活用しようとしているけれども、なかなかうまくいかない――。そんなお悩みを抱える方に、筆者が今週お届けするのは「マルチモーダル」です。テキストだけでなく、画像や音声、動画など複数種類のデータを読み込ませることで、生成AIの ...
翔泳社では、「独習」「徹底入門」「スラスラわかる」「絵で見てわかる」「一年生」などの人気シリーズをはじめ、言語や開発手法、最新技術を解説した書籍を多数手がけています。プロジェクトマネジメントやチームビルティングといった管理職向けの ...
AIソリューション事業を手掛ける株式会社ヘッドウォータース(本社:東京都新宿区、代表取締役:篠田 庸介、以下「ヘッドウォータース)」は、日本マイクロソフトが提供する「Azure OpenAI Service」利用企業向けにテキスト、音声、画像・映像の複合的な ...
テキスト、画像、音声、動画など異なる種類のデータを一度に扱える「マルチモーダルAI」と呼ばれる技術のニーズが近年特に高まっています。従来のAIでは実現できなかった複雑な課題の解決や、業務の効率化を後押しする「具体的な成果」が認められる ...
米Microsoftは2月26日(現地時間)、小規模言語モデル(SLM)である「Phi」ファミリーに「Phi-4-multimodal」「Phi-4-mini」が加わったと発表した。現在、「Azure AI Foundry」、「HuggingFace」、「NVIDIA API Catalog」で利用可能。 小規模言語モデル(Small Language Model:SLM)は ...
――142億パラメータを持つ日本語に特化した視覚言語モデル―― 【発表のポイント】 142億パラメータを持つオープンな日本語に特化したマルチモーダルモデルを開発しました。構築されたモデルは、出力の利用が制限されている大規模言語モデル(chatGPT ...