3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2208 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
rahulk-ddpm
rahulk-ddpmは、PyTorchでスクラッチから実装されたDenoising Diffusion Probabilistic Models (DDPM)です。UNetと正…
★ 4 MIT 2026-06-23
画像生成
GitHub
text-diffusion
このプロジェクトは、ランダムなノイズから意味のあるテキストを生成する革新的なテキスト拡散モデルです。従来のモ…
★ 4 2026-05-05
マルチモーダル
GitHub
opencode-vision
opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。ユーザーが…
★ 4 ⑂ 1 MIT 2026-07-01
ASR / 音声認識
GitHub
crisp-caption
crisp-captionは、ブラウザの音声やライブストリーム、OBSでの配信に対して、リアルタイムで日本語のライブキャプシ…
★ 4 ⑂ 3 Apache-2.0 2026-05-24
動画生成
GitHub
paper2video
「paper2video」は、あらゆる技術記事や論文を、著名な「3Blue1Brown」スタイルに倣った2〜5分間の解説動画へと自動…
★ 4 Apache-2.0 2026-04-13
AIエージェント
GitHub
memharness
memharnessは、AIエージェント向けのバイテンポラルで来歴を保持する長期記憶プリミティブです。SQLiteをバックエン…
★ 4 ⑂ 1 Apache-2.0 2026-06-26
音声生成 / TTS
GitHub
phonicorn
子供向けのフォニックス学習用フラッシュカードアプリで、単語の音、発音、解読パターンを練習できます。自己ホスト…
★ 4 MIT 2026-06-06
動画生成
GitHub
grok-imagine-toolkit
xAI Grok Imagine API向けのPythonクライアントであり、画像や動画の生成、編集、拡張、複数クリップのオーケストレ…
★ 4 ⑂ 1 MIT 2026-05-02
マルチモーダル
GitHub
vidground
VidGroundは、動画理解ベンチマークや機械学習の後学習データセットに内在する「動画を見なくても回答できる」テキス…
★ 4 MIT 2026-05-09
画像生成
GitHub
civitai-post-splitter
このツールは、Civitaiの複数画像投稿を単一画像投稿に分割し、Civitai、Pixiv、X (Twitter)、小紅書といった複数の…
★ 4 MIT 2026-06-25
ComfyUI
GitHub
ComfyUI-mflux-AnyModel
「ComfyUI-mflux-AnyModel」は、Apple Silicon(MLX/Metal)環境でComfyUIを使用して、あらゆるmflux/MLXモデルを実…
★ 4 ⑂ 1 MIT 2026-06-08
画像生成
GitHub
pixeltamer-gpt-image-skill
「pixeltamer」は、Claude Code、Codex CLI、OpenCode、Cursorなど50以上のAIコーディングエージェント向けに設計さ…
★ 4 MIT 2026-06-17
ComfyUI
GitHub
vramsuite
VRAM Suiteは、ローカルAI推論ワークフローにおけるGPUメモリ診断のためのPythonフレームワークです。OOMエラーによ…
★ 4 ⑂ 1 NOASSERTION 2026-05-31
LLM
GitHub
Local-Brain-Retrieval-Augmented-Generation
Local Brain RAGは、プライバシーを最優先し、完全にオフラインで動作する超最適化された知識ベースです。複雑なコー…
★ 4 ⑂ 1 2026-06-27
LLM
GitHub
Metis
Metisは、コードの読み書き、ターミナル操作、Webブラウジングが可能なデスクトップAIエージェントです。ユーザーが…
★ 4 NOASSERTION 2026-06-22
LLM
GitHub
mnemara
Mnemaraは、Claude Agent SDKを土台にした対話ランタイムです。毎ターンでロールドキュメントを再読込してシステムプ…
★ 4 MIT 2026-05-13
マルチモーダル
GitHub
roboclaws
Roboclawsは、VLMポリシー、OpenClaw、AIコーディングエージェントによって駆動されるAIロボティクスデモのためのリ…
★ 4 ⑂ 2 MIT 2026-06-26
ASR / 音声認識
GitHub
VoxPulse
VoxPulseは、オフラインで動作し、100%プライバシーを保証する軽量なカスタムウェイクワード検出フレームワークです…
★ 4 MIT 2026-06-15
ComfyUI
GitHub
aeon-radio-drama
aeon-radio-dramaは、ラジオドラマ、オーディオブック、オーディオフィクションを制作するためのフルパイプラインツ…
★ 4 ⑂ 3 MIT 2026-06-28
LLM
GitHub
DermaGemma
Dermagemmaは、皮膚の色が濃い患者(スキントーンIV-VI)に対するAI皮膚科診断の精度低下という医療格差を解消するた…
★ 4 2026-05-23
LLM
GitHub
pbsm
PBSMは、従来のAIエージェントが抱える予測不能性、自己認識の欠如、非構造化された知識表現、脆弱なタスク計画とい…
★ 4 2026-05-26
画像生成
GitHub
mini-pi0
mini-pi0は、ロボットの動作ポリシーをフローマッチングにより学習するためのコンパクトな研究コードベースです。特…
★ 4 2026-05-24
画像生成
GitHub
SesquiLSR
SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…
★ 4 ⑂ 1 MIT 2026-06-29
ASR / 音声認識
GitHub
live-translation
Live Translationは、macOS上でシステムオーディオをリアルタイムでキャプション表示し、任意の言語へ翻訳して、半透…
★ 4 MIT 2026-06-25