Model Text - 検索 News

アドビ、初の動画生成AIモデル発表テキスト・画像→動画のほか ...

米Adobeは9月11日（現地時間）、同社初の動画生成AIモデル「Adobe Firefly Videoモデル」を発表した。テキストや画像から動画を生成するだけでなく、クリップの尺を引き伸ばしたり、動画の別の視点を生成したりできるようになる。2024年後半にβ版として提供 ...

GIGAZINE

Metaが動画内の物体を識別して切り抜けるAIモデル「SAM 3」を発表

Metaがテキストや視覚的なサンプルをプロンプトとして使用し、画像やビデオ内のオブジェクトを検出、分割、追跡するための統合モデル「Meta Segment Anything Model 3(SAM 3)」を発表しました。 Introducing Meta Segment Anything Model 3 and Segment Anything Playground https://ai.meta ...

Impress Watch

Adobeの生成AIにビデオモデル「Firefly Video Model」が登場…テキスト ...

アドビは10月14日（月）、アメリカ・マイアミビーチで開催している「Adobe MAX 2024」で、Adobe Creative Cloud製品のアップデートを発表した。生成AI「Adobe Firefly」に、ビデオモデルとなる「Adobe Firefly Video Model（ベータ）」を追加した。生成AIに“ビデオモデル”が ...

@DIME

NVIDIAがテキストから音楽や音声を生成できるAI研究モデル「Fugatto ...

NVIDIAの生成AIの研究者チームから、オーディオの生成と変換のための画期的な新しいAI研究モデル、Fugattoが発表された。このFugatto、あらゆるテキストプロンプトを音声に変換して音楽の断片を作成したり、既存の曲から楽器を削除または追加したり、声の ...

GIGAZINE

OpenAIが日本語にも対応した音声文字起こしモデルやテキスト ...

音声からテキストに変換する「gpt-4o-transcribe」および「gpt-4o-mini-transcribe」モデルはそれぞれGPT-4oおよびGPT-4o-miniがベースとなっており、トレーニングの際にデータセットを利用した事前トレーニングだけでなく、強化学習を活用することで認識精度を最先端のレベルまで引き上げることに成功したとのこと。

Impress Watch

テキスト・静止画から動画を生成する「Adobe Firefly Videoモデル」

アドビは9月12日（木）、生成AIモデル「Adobe Firefly Videoモデル」を先行公開すると発表した。テキストや画像から動画を生成できる。あわせて、「Adobe Premiere Pro」のアップデートも発表した。 Adobe Firefly Videoモデル商業的に安全に利用できるという動画の生成 ...

GameBusiness.jp

【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる ...

2025年7月、ゲームツール＆ミドルウェアフォーラム「GTMF 2025」において、アリババクラウドによるセッション「アイデアがゲームになる未来アリババAIが解き放つ、次世代クリエイションの扉」が実施されました。登壇した同社AIソリューションアーキテクトの藤川裕一氏は、EC企業のイメージが強いアリババグループが、実は世界有数のAI技術とクラウドインフラを持つ「社会インフラ」企業であることを強調 ...

The Wall Street Journal on MSN

メタ、新AI画像・動画モデル開発中コードネーム「マンゴー」

米メタ・プラットフォームズは、次世代のテキストベースの大規模言語モデルと並行して、コードネーム「マンゴー」という画像・動画に特化した新しい人工知能（AI）モデルを開発している。発言を聞いた複数の関係者によると、アレクサンダー・ワン最高AI責任者は18日、クリス・コックス最高製品責任者との社内Q&AでこれらのAIモデルについて語った。新しいモデルは2026年上半期にリリースされる見込みだ。ワン氏はま ...

Excite エキサイト

Hugging Faceの最新小型AIモデル「SmolVLM」、ビジョン／テキストタスク ...

AIモデルの高性能化と小型化の流れが加速している。メタが2024年7月にリリースしたLlama 3.1 405B（4,050億パラメータ）と、その5カ月後にリリースされたLlama 3.3 70B（700億パラメータ）の性能を比較すると、その進化の速さが見て取れる。 Llama 3.1 405Bは基本的な ...

一部の結果でアクセス不可の可能性があるため、非表示になっています。

アクセス不可の結果を表示する

アドビ、初の動画生成AIモデル発表 テキスト・画像→動画のほか ...