概要
webclawは、ウェブサイトからコンテンツを高速かつローカルファーストで抽出するツールです。
ウェブページをMarkdown、JSON、またはLLMが利用しやすい形式のクリーンなコンテキストに変換します。
ナビゲーション、スクリプト、広告などの不要なHTML要素を自動で除去し、生のHTMLではなくAIエージェントやRAGパイプラインが直接活用できる情報を提供します。
CLIツール、REST API、MCPサーバーとして提供され、ターミナルからの直接操作、ClaudeやCursorといったMCP対応ツールとの連携、アプリケーションからのAPI利用、またはセルフホスト型サーバーとしての運用が可能です。
LLMを用いたAIエージェント開発者や、ウェブコンテンツの効率的なデータ抽出を求めるユーザーに最適です。
互換性・特徴
- CLI
- REST API
- MCP Server
- Rust
- Docker
- AI/LLM向け
基本情報
| ライセンス | AGPL-3.0 |
| Stars | 1,456 |
| Forks | 160 |
| カテゴリ | LLM |
| アクティビティ | high |
最新リリース: v0.6.13 (2026-06-17)
