3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2216 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
画像生成 GitHub codex-pet-generator
このツールは、Codexデスクトップペットを生成するための再利用可能なスキルです。大規模な画像生成に起因するクロッ…
★ 8 MIT 2026-05-05
LLM GitHub ai-world-cup
AI World Cupは、FIFAワールドカップ2026の試合予測における無料の大規模言語モデル(LLM)の性能を比較するための、…
★ 8 ⑂ 2 MIT 2026-06-26
ASR / 音声認識 GitHub Seam-LocalFirstMinutes
Seamは、会議の録音・文字起こし・要約をローカル環境中心で完結させるmacOS向けアプリです。マイク録音とシステム音…
★ 8 Apache-2.0 2026-06-23
画像生成 GitHub relay-imagegen
「Relay Imagegen」は、AIアシスタント「Codex」の中継ステーションを用いた画像生成において、解像度やアスペクト比…
★ 8 MIT 2026-06-02
ComfyUI GitHub J-AI-Studio
J AI Studioは、複雑なグラフエディタを必要とせずに、ローカルで画像や動画を生成するためのComfyUI用シンプルUIで…
★ 8 MIT 2026-05-03
ComfyUI GitHub ComfyUI-LocateAnything
「ComfyUI-LocateAnything」は、NVIDIAのLocateAnything-3BビジュアルグラウンディングモデルをComfyUIで利用可能に…
★ 8 ⑂ 3 GPL-3.0 2026-06-01
AIエージェント GitHub muapi-mcp-server
MuAPI MCPサーバーは、Claude、Cursor、WindsurfなどのModel Context Protocol (MCP) 互換AIアシスタントをmuapi.ai…
★ 8 ⑂ 3 MIT 2026-06-16
LLM GitHub corplaw-rag
corplaw-ragは、企業法務に特化した先進的な検索拡張生成(RAG)システムです。このツールは、高度な情報検索とコン…
★ 8 ⑂ 1 NOASSERTION 2026-05-01
LLM GitHub Plasmod
Plasmodは、マルチエージェントシステム向けに設計されたエージェントネイティブデータベースです。粘菌ネットワーク…
★ 8 MIT 2026-06-13
音声生成 / TTS GitHub DeepInterview
DeepInterviewは、CVと職務経歴書をアップロードするだけで、AIが模擬面接官として音声で面接練習をサポートするオー…
★ 8 Apache-2.0 2026-06-24
マルチモーダル GitHub GDB
GDB (GraphicDesignBench) は、グラフィックデザインタスクにおけるビジョン言語モデルの性能を評価するためのリアル…
★ 8 ⑂ 1 NOASSERTION 2026-05-05
LLM GitHub Local-LLM-Discord-Bot
このツールは、ローカルで動作するLLM(OllamaやLM Studio)をDiscordボットとして利用可能にします。これにより、ユ…
★ 8 ⑂ 2 MIT 2026-05-28
音声生成 / TTS GitHub Local-TTS-studio
Open TTSは、サーバーやAPIキーなしでデバイス上で完結する、ローカルファーストのテキスト読み上げ(TTS)スタジオ…
★ 7 Apache-2.0 2026-06-23
3D / NeRF GitHub interactive-website-navigator
このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…
★ 7 MIT 2026-05-17
画像生成 GitHub ltx2-vidgen-skill
この「ltx2-vidgen-skill」は、AIビデオ生成パイプラインを自社で所有・運用できるClaude Codeスキルです。写真一枚…
★ 7 ⑂ 1 NOASSERTION 2026-06-11
LLM GitHub RAG-Roadmap-with-Notes-and-Projects
このリポジトリは、Retrieval-Augmented Generation(RAG)の学習に特化した、基礎から本番環境でのエージェントRAG…
★ 7 MIT 2026-06-21
AIエージェント GitHub Operon
Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…
★ 7 ⑂ 1 MIT 2026-06-01
ASR / 音声認識 GitHub MavKa
MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…
★ 7 ⑂ 1 MIT 2026-05-10
画像生成 GitHub sd-faceswap
このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…
★ 7 MIT 2026-05-19
音声生成 / TTS GitHub okay-hermes-voice
「Okay Hermes Voice」は、既存の「Hermes Agent」に「Okay Hermes」というウェイクフレーズを追加し、常に音声で操…
★ 7 NOASSERTION 2026-06-29
3D / NeRF GitHub stechdrive-3dgs-utils
このツールは、360度カメラで撮影した動画を、3D Gaussian Splatting(3DGS)のトレーニングに利用できる画像、マス…
★ 7 MIT 2026-05-31
マルチモーダル GitHub CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 7 BSD-3-Clause-Clear 2026-06-22
動画生成 GitHub Awesome-Gemini-Omni-API-Prompts
このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…
★ 7 ⑂ 1 CC0-1.0 2026-07-01
LLM GitHub reyn
Reynは、MarkdownとYAMLで定義したスキルをもとに、LLMエージェントの処理フローを制約付きで実行・検証・再現できる…
★ 7 MIT 2026-06-28