前回の記事④で利用したCyberAgent社以外にも、DeepSeek-r1・Qwen蒸留の日本語チューニング版がhuggingfaceのLightBlue社のページにて公開されています。CyberAgent版にはない、より小さな7B版を利用できます。 さらに、上記の環境変数(KVアテンションキャッシュの量子 ...
東京大学発AIスタートアップのLightblueは2025年2月3日、中国製LLM「DeepSeek-R1」に日本語で追加学習を施したLLMを公開したと発表した。DeepSeek-R1の出力結果を用いる蒸留モデルの1つで中国AlibabaのLLM「Qwen」軽量版(70億パラメータ)に対し、日本語での追加学習を ...
急成長を遂げる中国の AI 企業 DeepSeek が、再び世界のテクノロジー界を揺るがしている。同社のフロンティア AI モデルの急速な台頭が米国の人工知能株の売りを引き起こしたまさにそのタイミングで、同社は新製品を発表した。 Janus Pro 7B は、オープン ...
新しいモデルは、データ品質、トレーニング プロセスに関して Janus を改善し、より優れた画像を生み出します。 DeepSeekは、同社の新モデルがいくつかのベンチマークにおいてOpenAIのDALLE-E 3やStability AIのStable Diffusionよりも優れていると主張している。
こんにちは、スクーティーという会社の代表のかけやと申します。 弊社は生成AIを強みとするベトナムオフショア開発・ラボ型開発や、生成AIコンサルティングなどのサービスを提供しており、最近はありがたいことに生成AIと連携したシステム開発のご ...