422 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

scrape-website-mcp

★ 1 MIT 更新: 2026-05-12 GitHubで見る →

概要

scrape-website-mcpは、ウェブサイトを高性能にスクレイピングし、クリーンなMarkdown形式でコンテンツを抽出するセルフホスト型のMCPサーバーです。

主にOpenAI-Assistants / Responsesエージェントのリモートツールとして設計されており、OpenAIのVector Storeと連携し、URLによるコンテンツのアップロード、更新、削除をサポートします。

Dockerでのデプロイが容易で、開発者やAIエージェントを構築するユーザーが、エージェントに最新のウェブコンテンツを効率的に取り込むために利用することを想定しています。

特に、Harvard EA assistants platformのようなプラットフォームとの統合も可能で、コンテンツ取得からベクトルストアへの同期までを自動化します。

互換性・特徴

  • Python
  • CLI
  • Docker
  • OpenAI-Assistants対応
  • Webスクレイピング
  • セルフホスト

基本情報

ライセンスMIT
Stars1
カテゴリLLM
アクティビティlow

GitHub: https://github.com/ventz/scrape-website-mcp