Langfuseスキルをオープンソース化しました — コーディングエージェントからLLMオブザーバビリティを操作する

以前、Claude Code × Langfuseで同族デバッグ環境を作った話を紹介しました。社内で使っていたLangfuse連携スキルを、このたび langfuse-skills としてオープンソース公開しました。

なぜ公開したか

前回の記事を公開後、「同じものを自分のプロジェクトでも使いたい」という反応を多くいただきました。

LLMアプリを開発していると、Langfuseダッシュボードとエディタの往復が日常になります。トレースを確認するためにブラウザを開き、IDをコピーし、JSONの入れ子をたどる。この作業をコーディングエージェントに任せられたら、という発想は多くの開発者に共通するものだったようです。

そこで、社内スキルを汎用パッケージとして整理し、Vercelのskillsエコシステムに対応する形でリリースしました。

インストール

1行で完了します。

# Claude Code
npx skills add neuradex/langfuse-skills -a claude-code

# Cursor
npx skills add neuradex/langfuse-skills -a cursor

# Codex / Windsurf / Cline / Roo Code なども対応
npx skills add neuradex/langfuse-skills -a <agent>

環境変数を設定すれば準備完了です。

export LANGFUSE_PUBLIC_KEY="pk-lf-..."
export LANGFUSE_SECRET_KEY="sk-lf-..."

できること

10個のスキルを提供しています。

トレース・セッション分析: langfuse-trace-list / langfuse-trace-view / langfuse-session-list / langfuse-session-view / langfuse-observation-view — 遅延トレースの診断、会話品質の分析、コスト監視を自然言語で行えます。

プロンプト管理: langfuse-prompt-list / langfuse-prompt-view / langfuse-prompt-upsert — プロンプトの確認から改善・反映までエージェントとの会話で完結します。問題の原因がプロンプトにあると分かったら、その場で修正してdevelopmentラベルで保存できます。

モデル・コスト管理: langfuse-model-list / langfuse-model-upsert — モデルの料金設定を確認・更新できます。

実際の使い方

前回の記事で紹介したワークフローがそのまま使えます。

あなた: 「このトレースが遅い。原因を調べて」
エージェント: (langfuse-trace-viewでトレース取得)
             「入力トークンが12,000を超えています。
              システムプロンプトのfew-shot例が過剰です。
              3つから1つに削減することを提案します。」
あなた: 「プロンプトを直して」
エージェント: (langfuse-prompt-viewで現在のプロンプト取得)
             (改善案を提示)
あなた: 「OK、反映して」
エージェント: (langfuse-prompt-upsertで保存)
             「developmentラベルで保存しました。」

トレース分析からプロンプト修正まで、エディタを離れずに完了します。

まとめ

langfuse-skillsは、LLMオブザーバビリティをコーディングエージェントのワークフローに統合するスキルパッケージです。

GitHub: neuradex/langfuse-skills
対応エージェント: Claude Code, Cursor, Codex, Windsurf, Cline, Roo Code, GitHub Copilot
ライセンス: MIT

LLMアプリの開発・運用で「ダッシュボードとエディタの往復」に疲れている方は、ぜひ試してみてください。