米Adobeは9月11日(現地時間)、同社初の動画生成AIモデル「Adobe Firefly Videoモデル」を発表した。テキストや画像から動画を生成するだけでなく、クリップの尺を引き伸ばしたり、動画の別の視点を生成したりできるようになる。2024年後半にβ版として提供 ...
Metaがテキストや視覚的なサンプルをプロンプトとして使用し、画像やビデオ内のオブジェクトを検出、分割、追跡するための統合モデル「Meta Segment Anything Model 3(SAM 3)」を発表しました。 Introducing Meta Segment Anything Model 3 and Segment Anything Playground https://ai.meta ...
アドビは10月14日(月)、アメリカ・マイアミビーチで開催している「Adobe MAX 2024」で、Adobe Creative Cloud製品のアップデートを発表した。生成AI「Adobe Firefly」に、ビデオモデルとなる「Adobe Firefly Video Model(ベータ)」を追加した。 生成AIに“ビデオモデル”が ...
NVIDIAの生成AIの研究者チームから、オーディオの生成と変換のための画期的な新しいAI研究モデル、Fugattoが発表された。 このFugatto、あらゆるテキストプロンプトを音声に変換して音楽の断片を作成したり、既存の曲から楽器を削除または追加したり、声の ...
音声からテキストに変換する「gpt-4o-transcribe」および「gpt-4o-mini-transcribe」モデルはそれぞれGPT-4oおよびGPT-4o-miniがベースとなっており、トレーニングの際にデータセットを利用した事前トレーニングだけでなく、強化学習を活用することで認識精度を最先端のレベルまで引き上げることに成功したとのこと。
アドビは9月12日(木)、生成AIモデル「Adobe Firefly Videoモデル」を先行公開すると発表した。テキストや画像から動画を生成できる。 あわせて、「Adobe Premiere Pro」のアップデートも発表した。 Adobe Firefly Videoモデル 商業的に安全に利用できるという動画の生成 ...
2025年7月、ゲームツール&ミドルウェアフォーラム「GTMF 2025」において、アリババクラウドによるセッション「アイデアがゲームになる未来 アリババAIが解き放つ、次世代クリエイションの扉」が実施されました。 登壇した同社AIソリューションアーキテクトの藤川裕一氏は、EC企業のイメージが強いアリババグループが、実は世界有数のAI技術とクラウドインフラを持つ「社会インフラ」企業であることを強調 ...
米メタ・プラットフォームズは、次世代のテキストベースの大規模言語モデルと並行して、コードネーム「マンゴー」という画像・動画に特化した新しい人工知能(AI)モデルを開発している。発言を聞いた複数の関係者によると、アレクサンダー・ワン最高AI責任者は18日、クリス・コックス最高製品責任者との社内Q&AでこれらのAIモデルについて語った。新しいモデルは2026年上半期にリリースされる見込みだ。ワン氏はま ...
AIモデルの高性能化と小型化の流れが加速している。メタが2024年7月にリリースしたLlama 3.1 405B(4,050億パラメータ)と、その5カ月後にリリースされたLlama 3.3 70B(700億パラメータ)の性能を比較すると、その進化の速さが見て取れる。 Llama 3.1 405Bは基本的な ...