「ん?実験管理?」と思う方もいるかもなので、軽く背景のところから共有したいのですが、システムに組み込むプロンプト作りは、すごい難易度が高いなーと思ってます。 何が大変かというと、求められる品質が高いからです! 出力形式が期待通りで ...
promptfooを使って、プロンプトエンジニアリングの実験管理を行う方法についてまとめました。 進め方については公式ドキュメントのこちらからご参考ください。 セットアップ 実行に当たって、以下の準備が必要です。 リポジトリをクローンします git clone ...
OpenAIの推論モデルである「o1」と比べ、コストがわずか3%でありながら同等のパフォーマンスを発揮可能な「DeepSeek-R1」の登場で、開発元であるDeepSeekへの注目が高まっています。しかし、DeepSeekは中国の企業であるため、中国政府にとってデリケートな話題 ...
Le chatbot DeepSeek, développé par une start-up chinoise, évite de répondre à 85 % des questions sur des sujets sensibles liés à la Chine. Une étude menée par le site Promptfoo pointe que le modèle de ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する