3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

webclaw

★ 1.5k ⑂ 160 AGPL-3.0 更新: 2026-06-20 GitHubで見る →

概要

webclawは、ウェブサイトからコンテンツを高速かつローカルファーストで抽出するツールです。

ウェブページをMarkdown、JSON、またはLLMが利用しやすい形式のクリーンなコンテキストに変換します。

ナビゲーション、スクリプト、広告などの不要なHTML要素を自動で除去し、生のHTMLではなくAIエージェントやRAGパイプラインが直接活用できる情報を提供します。

CLIツール、REST API、MCPサーバーとして提供され、ターミナルからの直接操作、ClaudeやCursorといったMCP対応ツールとの連携、アプリケーションからのAPI利用、またはセルフホスト型サーバーとしての運用が可能です。

LLMを用いたAIエージェント開発者や、ウェブコンテンツの効率的なデータ抽出を求めるユーザーに最適です。

互換性・特徴

  • CLI
  • REST API
  • MCP Server
  • Rust
  • Docker
  • AI/LLM向け

基本情報

ライセンスAGPL-3.0
Stars1,456
Forks160
カテゴリLLM
アクティビティhigh

最新リリース: v0.6.13 (2026-06-17)

GitHub: https://github.com/0xMassi/webclaw