VLA(Vision-Language-Action)モデルなどのロボット向け基盤モデルが脚光を浴びている。当初の大規模言語モデルベースのアーキテクチャに拡散モデルを組み合わせることで、言語で指示を受け、実行の段取りをつけ、個々の行動を連続値で生成できるようになってきた。
そのなかで現在、欧米やイスラエルでは、生存者の証言を映像や音声で記録し、そのデータを将来世代に残す「ホロコーストの記憶のデジタル化」が進められている。問題は、証言の量である。録画された証言映像は、総量で数十万時間規模に達しつつあり、人間が一つひとつ再 ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する