3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub VTS
VTS(Voice To Sound)は、ユーザーの音声スケッチとテキストプロンプトを組み合わせて効果音を生成するツールです。…
★ 131 ⑂ 4 MIT 2026-06-18
ComfyUI GitHub Minimalistic-Comfy-Wrapper-WebUI
Minimalistic Comfy Wrapper WebUI (MCWW) は、ComfyUIに推論に特化したシンプルなUIを追加する拡張機能です。既存の…
★ 129 ⑂ 10 AGPL-3.0 2026-06-24
3D / NeRF GitHub nexels
「Nexels」は、疎なジオメトリを用いてリアルタイムで新しい視点画像を合成するニューラルテクスチャ付きサーフェル…
★ 129 ⑂ 6 NOASSERTION 2025-12-18
動画生成 GitHub Crayotter
Crayotterは、単一のテキストリクエストから完全に編集されたビデオを生成する、マルチモーダルでエージェント駆動型…
★ 129 ⑂ 9 2026-06-27
動画生成 GitHub EffectErase
「EffectErase」は、ビデオからのオブジェクト除去と挿入を同時に、かつ高品質に行うためのツールです。CVPR 2026で…
★ 128 ⑂ 7 NOASSERTION 2026-04-10
マルチモーダル GitHub count-anything
Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。自…
★ 127 ⑂ 6 Apache-2.0 2026-06-04
動画生成 HF Wan2.1-T2V-1.3B-Diffusers
Wan2.1は、最先端のビデオ生成技術を提供するオープンな大規模ビデオ基盤モデルスイートです。テキストからビデオ、…
❤ 127 ↓ 162.2k apache-2.0 2025-04-04
ASR / 音声認識 GitHub MioVRC_Translator
VRChat向けデスクトップリアルタイム翻訳ツール「Mio RealTime Translator」は、VRChatでの国際交流を支援します。主…
★ 127 ⑂ 1 NOASSERTION 2026-06-18
LLM GitHub chunky
Chunkyは、RAG(Retrieval-Augmented Generation)パイプラインの品質を向上させるためのローカルでオープンソースの…
★ 126 ⑂ 11 MIT 2026-06-06
LLM GitHub VidCom2
VidCom2は、Video Large Language Models (VideoLLMs) の推論を高速化するためのプラグアンドプレイなフレームワーク…
★ 126 ⑂ 14 Apache-2.0 2026-05-14
画像生成 GitHub Spectrum
「Spectrum」は、学習不要なスペクトル拡散特徴予測を用いて、拡散モデルのサンプリング速度を大幅に向上させるツー…
★ 125 ⑂ 7 MIT 2026-04-30
AIエージェント GitHub lecture-to-hw
「lecture-to-hw」は、大学の授業資料(講義、宿題ファイル、コード、過去の解答スタイル)から、簡潔なMarkdown形式…
★ 124 ⑂ 6 MIT 2026-05-08
マルチモーダル GitHub ScreenMind
ScreenMindは、PCの画面活動をAIでキャプチャ、分析し、検索可能なプライベートAIメモリを構築するツールです。Gemma…
★ 123 ⑂ 6 MIT 2026-06-23
ASR / 音声認識 GitHub ai-course-notes
このプロジェクトは、AI/LLM関連の公開講義、インタビュー、技術記事を中国語でまとめた学習リソースです。合計303の…
★ 123 ⑂ 4 NOASSERTION 2026-05-25
ComfyUI GitHub OpenWebui-Tools
このプロジェクトは、Open WebUIの体験を強化するために設計された26種類のカスタムツール集です。主な特徴は、30秒…
★ 122 ⑂ 6 MIT 2026-06-01
AIエージェント GitHub ai-desk-card
「AI Desk Card」は、Claude CodeやCodexなどのAI AgentとM5Paper墨水屏を連携させるデスクトップサブスクリーンSkil…
★ 120 ⑂ 10 NOASSERTION 2026-05-22
画像生成 GitHub image-prompt-library
Image Prompt Libraryは、生成AIで作成された画像とそのプロンプトをローカルで一元管理するための視覚的ライブラリ…
★ 120 ⑂ 17 AGPL-3.0 2026-05-06
ComfyUI GitHub ComfyUI-Text_Image-Composite
ComfyUI-Text_Image-Compositeは、ComfyUI向けのテキストと画像を合成するツールです。テキストの自動折り返しや、h3…
★ 119 ⑂ 16 GPL-3.0 2024-05-31
音楽生成 GitHub VODER
VODERは、ローカルで動作し、無料で利用できるプロフェッショナルグレードの音声処理ツールです。音声認識、テキスト…
★ 119 ⑂ 11 AGPL-3.0 2026-06-20
動画生成 GitHub Echo-Memory
Echo-Memoryは、Joy Future AcademyのEcho Teamが開発した、ビデオワールドモデルにおけるメモリの役割を研究するた…
★ 119 ⑂ 6 2026-06-25
LLM GitHub engram
Engramは、OpenClawエージェントに永続的な長期記憶機能を提供するハイブリッドプラグインです。SQLiteとFTS5を使用…
★ 119 ⑂ 1 MIT 2026-06-08
動画生成 GitHub comfyui-mesh
ComfyUI Meshは、拡散モデル(FLUX.2、LTX 2.3など)の計算を2つのNVIDIA GPU(同一マシンまたはLAN経由)に分散させ…
★ 118 ⑂ 14 2026-05-17
動画生成 GitHub lpwm
「Latent Particle World Models (LPWM)」は、ICLR 2026で発表された自己教師ありオブジェクト中心ワールドモデルのP…
★ 117 ⑂ 5 MIT 2026-03-19
AIエージェント GitHub QuantClaw-plugin
QuantClawはOpenClaw向けのプラグアンドプレイ型タスクルーティング量子化プラグインです。このツールは、着信する各…
★ 116 ⑂ 1 MIT 2026-04-27