Langfuseスキルをオープンソース化しました — コーディングエージェントからLLMオブザーバビリティを操作する

以前、Claude Code × Langfuseで同族デバッグ環境を作った話を紹介しました。社内で使っていたLangfuse連携スキルを、このたび langfuse-skills としてオープンソース公開しました。
なぜ公開したか
前回の記事を公開後、「同じものを自分のプロジェクトでも使いたい」という反応を多くいただきました。
LLMアプリを開発していると、Langfuseダッシュボードとエディタの往復が日常になります。トレースを確認するためにブラウザを開き、IDをコピーし、JSONの入れ子をたどる。この作業をコーディングエージェントに任せられたら、という発想は多くの開発者に共通するものだったようです。
そこで、社内スキルを汎用パッケージとして整理し、Vercelのskillsエコシステムに対応する形でリリースしました。
インストール
1行で完了します。
# Claude Code
npx skills add neuradex/langfuse-skills -a claude-code
# Cursor
npx skills add neuradex/langfuse-skills -a cursor
# Codex / Windsurf / Cline / Roo Code なども対応
npx skills add neuradex/langfuse-skills -a <agent>
環境変数を設定すれば準備完了です。
export LANGFUSE_PUBLIC_KEY="pk-lf-..."
export LANGFUSE_SECRET_KEY="sk-lf-..."
できること
10個のスキルを提供しています。
トレース・セッション分析: langfuse-trace-list / langfuse-trace-view / langfuse-session-list / langfuse-session-view / langfuse-observation-view — 遅延トレースの診断、会話品質の分析、コスト監視を自然言語で行えます。
プロンプト管理: langfuse-prompt-list / langfuse-prompt-view / langfuse-prompt-upsert — プロンプトの確認から改善・反映までエージェントとの会話で完結します。問題の原因がプロンプトにあると分かったら、その場で修正してdevelopmentラベルで保存できます。
モデル・コスト管理: langfuse-model-list / langfuse-model-upsert — モデルの料金設定を確認・更新できます。
実際の使い方
前回の記事で紹介したワークフローがそのまま使えます。
あなた: 「このトレースが遅い。原因を調べて」
エージェント: (langfuse-trace-viewでトレース取得)
「入力トークンが12,000を超えています。
システムプロンプトのfew-shot例が過剰です。
3つから1つに削減することを提案します。」
あなた: 「プロンプトを直して」
エージェント: (langfuse-prompt-viewで現在のプロンプト取得)
(改善案を提示)
あなた: 「OK、反映して」
エージェント: (langfuse-prompt-upsertで保存)
「developmentラベルで保存しました。」
トレース分析からプロンプト修正まで、エディタを離れずに完了します。
まとめ
langfuse-skillsは、LLMオブザーバビリティをコーディングエージェントのワークフローに統合するスキルパッケージです。
- GitHub: neuradex/langfuse-skills
- 対応エージェント: Claude Code, Cursor, Codex, Windsurf, Cline, Roo Code, GitHub Copilot
- ライセンス: MIT
LLMアプリの開発・運用で「ダッシュボードとエディタの往復」に疲れている方は、ぜひ試してみてください。