Multimodal Text - 検索 News

テキストだけでなく画像や音声なども処理するマルチモーダルRAG ...

マルチモーダルRAGとは、通常のRAGと何が違うのか？企業データの90%が非構造化データであり、その80%以上が画像、動画 ...

パナソニックHD、テキスト／画像／音を相互に変換できる ...

パナソニックホールディングス株式会社（以下、パナソニックHD）およびパナソニックR＆Dカンパニーオブアメリカ（以下、PRDCA）は4日、カリフォルニア大学ロサンゼルス校（以下、UCLA）の研究者らと共同で、テキスト／画像／音といった異なるデータ形式 ...

ビジネス＋IT

Mistral AIの「Pixtral 12B」「Pixtral Large」とは何か？手書きからWeb制作 ...

会員（無料）になると、いいね！でマイページに保存できます。フランスのAIスタートアップMistral AIは9月、同社初となるマルチモーダルAIモデル「Pixtral 12B」をリリースした。 Pixtral 12Bとは、テキストと画像を組み合わせた分析が可能なマルチモーダルAI ...

PR TIMES

テキストでも画像でもすぐに探せる、生成AIを活用した ...

アクロクエストテクノロジー株式会社（本社：神奈川県横浜市・代表取締役：新免流、以下、アクロクエスト）は、テキストでも画像でも、もしくは、その両方合わせてでも検索可能な、次世代の検索を実現する「マルチモーダル検索ソリューション」の ...

ITmedia

「マルチモーダルなAI」とは？生成AI活用をレベルアップさせる ...

生成AIを業務で活用しようとしているけれども、なかなかうまくいかない――。そんなお悩みを抱える方に、筆者が今週お届けするのは「マルチモーダル」です。テキストだけでなく、画像や音声、動画など複数種類のデータを読み込ませることで、生成AIの ...

CodeZine（コードジン）

AIエンジニア必見！実践から見る、マルチモーダルRAG最前線

翔泳社では、「独習」「徹底入門」「スラスラわかる」「絵で見てわかる」「一年生」などの人気シリーズをはじめ、言語や開発手法、最新技術を解説した書籍を多数手がけています。プロジェクトマネジメントやチームビルティングといった管理職向けの ...

PR TIMES

「Azure OpenAI Service」利用企業向けにテキスト、音声、画像・映像の ...

AIソリューション事業を手掛ける株式会社ヘッドウォータース（本社：東京都新宿区、代表取締役：篠田庸介、以下「ヘッドウォータース）」は、日本マイクロソフトが提供する「Azure OpenAI Service」利用企業向けにテキスト、音声、画像・映像の複合的な ...

ITmedia

マルチモーダルAIとは？最新技術と活用シーンをわかりやすく解説

テキスト、画像、音声、動画など異なる種類のデータを一度に扱える「マルチモーダルAI」と呼ばれる技術のニーズが近年特に高まっています。従来のAIでは実現できなかった複雑な課題の解決や、業務の効率化を後押しする「具体的な成果」が認められる ...

窓の杜

Microsoft、小規模言語モデル「Phi-4-multimodal」「Phi-4-mini」を発表

米Microsoftは2月26日（現地時間）、小規模言語モデル（SLM）である「Phi」ファミリーに「Phi-4-multimodal」「Phi-4-mini」が加わったと発表した。現在、「Azure AI Foundry」、「HuggingFace」、「NVIDIA API Catalog」で利用可能。小規模言語モデル（Small Language Model：SLM）は ...

日本経済新聞

東大、オープンな日本語マルチモーダルモデルを開発

――142億パラメータを持つ日本語に特化した視覚言語モデル―― 【発表のポイント】 142億パラメータを持つオープンな日本語に特化したマルチモーダルモデルを開発しました。構築されたモデルは、出力の利用が制限されている大規模言語モデル（chatGPT ...

一部の結果でアクセス不可の可能性があるため、非表示になっています。

アクセス不可の結果を表示する