Multimodal Lesson - 検索 News

Microsoft、小規模言語モデル「Phi-4-multimodal」「Phi-4-mini」を発表

米Microsoftは2月26日（現地時間）、小規模言語モデル（SLM）である「Phi」ファミリーに「Phi-4-multimodal」「Phi-4-mini」が加わったと発表した。現在、「Azure AI Foundry」、「HuggingFace」、「NVIDIA API Catalog」で利用可能。小規模言語モデル（Small Language Model：SLM）は ...

PR TIMES

オンライン保育・レッスン「NannyME」対話AIを研究する名古屋大学 ...

オンライン保育／レッスン「NannyME」（運営：株式会社七色、代表取締役CEO：佐々木綾香）は、名古屋大学東中研究室（東中竜一郎教授）と、「子どもとインタラクションを行うマルチモーダル対話システムに関する研究」について共同研究を開始したことを ...

PR TIMES

マルチモーダルAIの研究・開発会社「アイメソフト」が日本法人を ...

マルチモーダルAIの研究・開発およびサービス提供において、グローバルリーディングカンパニーである株式会社アイメソフト（Aimesoft Joint Stock Company 本社：ベトナム・ハノイ、CEO：グェントアンドゥク、以下アイメソフト）は、日本法人である「株式会社 ...

日本経済新聞

東大、オープンな日本語マルチモーダルモデルを開発

――142億パラメータを持つ日本語に特化した視覚言語モデル―― 【発表のポイント】 142億パラメータを持つオープンな日本語に特化したマルチモーダルモデルを開発しました。構築されたモデルは、出力の利用が制限されている大規模言語モデル（chatGPT ...

ギズモード・ジャパン

AIの｢マルチモーダル｣ってなんだろう？グーグルやOpenAIが大騒ぎ ...

5月といえば、スター・ウォーズとゴールデンウィーク。しかし、今年の5月はSWよりもGWよりも、AIな月となりました。OpenAIとGoogle（グーグル）が、次々と大きなAI関連の発表を行なったからです。近年、テック大手はAIモデルの開発に注力し、より賢く、より ...

ITmedia

「GPT-4o」は何がすごい？なぜLLMは画像や音声も扱えるの ...

米OpenAIが5月に発表した生成AIモデル「GPT-4o」。テキストだけでなく音声や画像も扱えるマルチモーダルモデルとして、その特徴が注目を集めている。ChatGPTでは、GPT-4oの性能を生かした「高度な音声モード」も提供予定（6月25日に延期を発表）で、感情や非 ...

BRIDGE

Meta、最先端マルチモーダルモデル「Chameleon」を発表

生成 AI 分野の競争がマルチモーダルモデルへとシフトする中、Metaは frontier labs が発表したモデルに対する答えとなるプレビューを発表した。Meta の新しいモデルファミリー「Chameleon」は、異なるモダリティのコンポーネントを組み合わせるのではなく ...

毎日新聞

AVerMedia、エッジ環境におけるマルチモーダルAIアプリケーション ...

アバーメディア・テクノロジーズ株式会社（東京都千代田区）は、2025年11月24日、エッジ環境におけるマルチモーダルAIアプリケーション（LLM／VLMを含む）開発向けキット『AVerMedia AI Fusion Kit』を発表しました。本製品は2025年12月1日以降、市場へ順次投入さ ...

CodeZine（コードジン）

「Amazon Nova Multimodal Embeddings」がリリース、クロスモーダル検索を実現

翔泳社では、「独習」「徹底入門」「スラスラわかる」「絵で見てわかる」「一年生」などの人気シリーズをはじめ、言語や開発手法、最新技術を解説した書籍を多数手がけています。プロジェクトマネジメントやチームビルティングといった管理職向けの ...

一部の結果でアクセス不可の可能性があるため、非表示になっています。

アクセス不可の結果を表示する