米Microsoftは2月26日(現地時間)、小規模言語モデル(SLM)である「Phi」ファミリーに「Phi-4-multimodal」「Phi-4-mini」が加わったと発表した。現在、「Azure AI Foundry」、「HuggingFace」、「NVIDIA API Catalog」で利用可能。 小規模言語モデル(Small Language Model:SLM)は ...
オンライン保育/レッスン「NannyME」(運営:株式会社七色、代表取締役CEO:佐々木綾香)は、名古屋大学東中研究室(東中竜一郎教授)と、「子どもとインタラクションを行うマルチモーダル対話システムに関する研究」について共同研究を開始したことを ...
マルチモーダルAIの研究・開発およびサービス提供において、グローバルリーディングカンパニーである株式会社アイメソフト(Aimesoft Joint Stock Company 本社:ベトナム・ハノイ、CEO:グェン トアン ドゥク、以下アイメソフト)は、日本法人である「株式会社 ...
――142億パラメータを持つ日本語に特化した視覚言語モデル―― 【発表のポイント】 142億パラメータを持つオープンな日本語に特化したマルチモーダルモデルを開発しました。構築されたモデルは、出力の利用が制限されている大規模言語モデル(chatGPT ...
5月といえば、スター・ウォーズとゴールデンウィーク。しかし、今年の5月はSWよりもGWよりも、AIな月となりました。OpenAIとGoogle(グーグル)が、次々と大きなAI関連の発表を行なったからです。 近年、テック大手はAIモデルの開発に注力し、より賢く、より ...
米OpenAIが5月に発表した生成AIモデル「GPT-4o」。テキストだけでなく音声や画像も扱えるマルチモーダルモデルとして、その特徴が注目を集めている。ChatGPTでは、GPT-4oの性能を生かした「高度な音声モード」も提供予定(6月25日に延期を発表)で、感情や非 ...
生成 AI 分野の競争がマルチモーダルモデルへとシフトする中、Metaは frontier labs が発表したモデルに対する答えとなるプレビューを発表した。Meta の新しいモデルファミリー「Chameleon」は、異なるモダリティのコンポーネントを組み合わせるのではなく ...
アバーメディア・テクノロジーズ株式会社(東京都千代田区)は、2025年11月24日、エッジ環境におけるマルチモーダルAIアプリケーション(LLM/VLMを含む)開発向けキット『AVerMedia AI Fusion Kit』を発表しました。本製品は2025年12月1日以降、市場へ順次投入さ ...
翔泳社では、「独習」「徹底入門」「スラスラわかる」「絵で見てわかる」「一年生」などの人気シリーズをはじめ、言語や開発手法、最新技術を解説した書籍を多数手がけています。プロジェクトマネジメントやチームビルティングといった管理職向けの ...