3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2208 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
Nav2PlannerBattle
Nav2PlannerBattleは、ROS 2のNav2で使用される実際のプランナーとコントローラーの性能を比較できるユニークなブラ…
★ 4 Apache-2.0 2026-06-17
音声生成 / TTS
GitHub
mammamiradio
「Mamma Mi Radio」は、AIが生成するイタリアのラジオ局エンジンです。Spotifyライブラリから連続的にMP3をストリー…
★ 4 ⑂ 2 Apache-2.0 2026-07-05
LLM
GitHub
EvoReplay
EvoReplayは、進化コーディングエージェントの研究論文「What Do Evolutionary Coding Agents Evolve?」のために開発…
★ 4 Apache-2.0 2026-05-20
ASR / 音声認識
GitHub
whisper-input-next-mac-kit
本ツールは、Whisper-Input-NextをmacOS向けに最適化するワンコマンドインストーラーです。Right-⌘キーによるタップ…
★ 4 ⑂ 1 MIT 2026-06-02
画像生成
GitHub
rahulk-ddpm
rahulk-ddpmは、PyTorchでスクラッチから実装されたDenoising Diffusion Probabilistic Models (DDPM)です。UNetと正…
★ 4 MIT 2026-06-23
画像生成
GitHub
text-diffusion
このプロジェクトは、ランダムなノイズから意味のあるテキストを生成する革新的なテキスト拡散モデルです。従来のモ…
★ 4 2026-05-05
マルチモーダル
GitHub
opencode-vision
opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。ユーザーが…
★ 4 ⑂ 1 MIT 2026-07-01
LLM
GitHub
MCP-Production-Business-Agent
本ツールは、Model Context Protocol、LangGraph、FastMCPを活用した自律的な買掛金AIシステムです。請求書のデータ…
★ 4 ⑂ 1 MIT 2026-06-23
ASR / 音声認識
GitHub
crisp-caption
crisp-captionは、ブラウザの音声やライブストリーム、OBSでの配信に対して、リアルタイムで日本語のライブキャプシ…
★ 4 ⑂ 3 Apache-2.0 2026-05-24
動画生成
GitHub
paper2video
「paper2video」は、あらゆる技術記事や論文を、著名な「3Blue1Brown」スタイルに倣った2〜5分間の解説動画へと自動…
★ 4 Apache-2.0 2026-04-13
AIエージェント
GitHub
memharness
memharnessは、AIエージェント向けのバイテンポラルで来歴を保持する長期記憶プリミティブです。SQLiteをバックエン…
★ 4 ⑂ 1 Apache-2.0 2026-06-26
音声生成 / TTS
GitHub
phonicorn
子供向けのフォニックス学習用フラッシュカードアプリで、単語の音、発音、解読パターンを練習できます。自己ホスト…
★ 4 MIT 2026-06-06
ComfyUI
GitHub
ai-cinema-studio-engine
PopTech Studioが提供するAI Cinema Studio Engineは、自社ホスト型のAI映画制作エンジンです。Higgsfield Cinema St…
★ 4 ⑂ 2 MIT 2026-04-13
動画生成
GitHub
grok-imagine-toolkit
xAI Grok Imagine API向けのPythonクライアントであり、画像や動画の生成、編集、拡張、複数クリップのオーケストレ…
★ 4 ⑂ 1 MIT 2026-05-02
マルチモーダル
GitHub
vidground
VidGroundは、動画理解ベンチマークや機械学習の後学習データセットに内在する「動画を見なくても回答できる」テキス…
★ 4 MIT 2026-05-09
画像生成
GitHub
civitai-post-splitter
このツールは、Civitaiの複数画像投稿を単一画像投稿に分割し、Civitai、Pixiv、X (Twitter)、小紅書といった複数の…
★ 4 MIT 2026-06-25
ComfyUI
GitHub
ComfyUI-mflux-AnyModel
「ComfyUI-mflux-AnyModel」は、Apple Silicon(MLX/Metal)環境でComfyUIを使用して、あらゆるmflux/MLXモデルを実…
★ 4 ⑂ 1 MIT 2026-06-08
画像生成
GitHub
pixeltamer-gpt-image-skill
「pixeltamer」は、Claude Code、Codex CLI、OpenCode、Cursorなど50以上のAIコーディングエージェント向けに設計さ…
★ 4 MIT 2026-06-17
ComfyUI
GitHub
vramsuite
VRAM Suiteは、ローカルAI推論ワークフローにおけるGPUメモリ診断のためのPythonフレームワークです。OOMエラーによ…
★ 4 ⑂ 1 NOASSERTION 2026-05-31
LLM
GitHub
Local-Brain-Retrieval-Augmented-Generation
Local Brain RAGは、プライバシーを最優先し、完全にオフラインで動作する超最適化された知識ベースです。複雑なコー…
★ 4 ⑂ 1 2026-06-27
LLM
GitHub
Metis
Metisは、コードの読み書き、ターミナル操作、Webブラウジングが可能なデスクトップAIエージェントです。ユーザーが…
★ 4 NOASSERTION 2026-07-01
LLM
GitHub
mnemara
Mnemaraは、Claude Agent SDKを土台にした対話ランタイムです。毎ターンでロールドキュメントを再読込してシステムプ…
★ 4 MIT 2026-05-13
マルチモーダル
GitHub
roboclaws
Roboclawsは、VLMポリシー、OpenClaw、AIコーディングエージェントによって駆動されるAIロボティクスデモのためのリ…
★ 4 ⑂ 2 MIT 2026-06-26
ASR / 音声認識
GitHub
VoxPulse
VoxPulseは、オフラインで動作し、100%プライバシーを保証する軽量なカスタムウェイクワード検出フレームワークです…
★ 4 MIT 2026-06-15