3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

画像生成
GitHub
colored-noise-sampling
Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…
★ 37 ⑂ 3 MIT 2026-06-01
音声生成 / TTS
GitHub
voice-agents-from-scratch
「Voice agents from scratch」は、Pythonでリアルタイム音声エージェントをゼロから構築するための実践的なチュート…
★ 37 ⑂ 3 MIT 2026-05-03
マルチモーダル
GitHub
VL-Calibration
VL-Calibrationは、大規模視覚言語モデル(LVLMs)の推論における信頼性キャリブレーションを向上させるためのフレー…
★ 37 Apache-2.0 2026-04-13
マルチモーダル
GitHub
OmniAgent
OmniAgentは、動画コンテンツを効率的に理解するための革新的なオムニモーダルAIエージェントです。従来のモデルとは…
★ 36 ⑂ 3 Apache-2.0 2026-06-24
ASR / 音声認識
GitHub
arkiv
arkivは、AIセマンティック検索機能を備えたオープンソースのローカルファーストメディアアセットマネージャーです。…
★ 36 ⑂ 4 MIT 2026-06-24
画像生成
GitHub
codex-gpt-image
「Codex GPT Image Skill」は、OpenClaw、Claude Code、Codex、Hermes AgentといったAIエージェント向けに、GPT-Imag…
★ 36 ⑂ 1 MIT 2026-06-19
LLM
GitHub
spark-evals
このリポジトリは、DGX Sparkという特定のハードウェア環境で動作する、小規模な言語モデルや量子化モデルのベンチマ…
★ 36 ⑂ 1 2026-06-21
画像生成
GitHub
NeveAI
Neve AIは、プライバシーを最優先し、完全にデータ主権を保つローカルAIオーケストレーションエコシステムです。Fast…
★ 35 ⑂ 2 NOASSERTION 2026-06-18
LLM
GitHub
PersonaLingo
PersonaLingo v2は、AIを活用したIELTSスピーキング試験向けのパーソナライズされたコーパス生成ツールです。RAGとメ…
★ 34 ⑂ 2 MIT 2026-06-18
LLM
GitHub
TimeOmni-1
TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…
★ 34 ⑂ 3 Apache-2.0 2026-06-12
動画生成
GitHub
Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集に…
★ 34 2026-05-15
LLM
GitHub
FreeRideV3
FreeRideは、複数の無料AI推論プロバイダを1つのローカルOpenAI互換ゲートウェイにまとめるCLIツールです。OpenRoute…
★ 34 ⑂ 4 MIT 2026-05-29
音声生成 / TTS
GitHub
utmos-pytorch
UTMOS-PyTorchは、音声品質評価モデルUTMOSの非公式なPyTorch実装です。オリジナルのUTMOSが依存するfairseqのインス…
★ 34 ⑂ 1 MIT 2026-06-06
画像生成
GitHub
Micro-Diffusion
Micro Diffusionは、Pythonで実装されたテキスト拡散モデルの基礎を学習するためのプロジェクトです。KarpathyのMicr…
★ 33 ⑂ 2 MIT 2026-04-13
動画生成
GitHub
seedance-api
Seedance 2.0 APIは、ByteDanceが開発したAI動画生成エンジンへの非公式アクセスを提供するツールです。このAPIは、…
★ 33 ⑂ 5 2026-06-24
動画生成
GitHub
MaxVideoAi
MaxVideoAIは、Sora、Veo、Kling、Seedance、LTXといった複数のAIビデオモデルを比較・生成できるマルチエンジンAIビ…
★ 33 ⑂ 13 NOASSERTION 2026-06-25
3D / NeRF
GitHub
TRELLIS-AMD
このツールは、MicrosoftのImage-to-3D生成ツール「TRELLIS」を、AMD製GPU(特にROCm対応モデル)で動作するように修…
★ 33 ⑂ 3 MIT 2026-05-09
画像生成
GitHub
RTDMD
RTDMD(Reward-Tilted Distribution Matching Distillation)は、少ないステップ数で高品質な画像を生成する「few-st…
★ 32 ⑂ 1 Apache-2.0 2026-06-06
ASR / 音声認識
GitHub
vibeclip
VibeClipは、長い動画コンテンツ(ポッドキャスト、インタビュー、ライブストリームなど)を、キャプション付きの縦…
★ 32 ⑂ 6 AGPL-3.0 2026-06-25
AIエージェント
GitHub
skill-scanner-agent
Skill Scanner Agentは、LLMエージェントベースのセキュリティスキャンツールです。SKILLディレクトリ内のセキュリテ…
★ 32 ⑂ 1 MIT 2026-05-18
ComfyUI
GitHub
Comfyui-anima-sampler
ComfyUI Anima Flow Corrective Samplerは、ComfyUI用のカスタムサンプラーノードで、AnimaおよびCosmosスタイルの画…
★ 32 ⑂ 2 MIT 2026-06-10
マルチモーダル
GitHub
ARIS-Movie-Director
ARIS-Movie-Directorは、曖昧なストーリーの指示から、AIエージェントが生成と監査を行い、イメージベースのムービー…
★ 32 ⑂ 2 MIT 2026-06-26
画像生成
GitHub
comfyui-CleanFreak
ComfyUIのワークフローをワンクリックで役割ごとに整理するツール「CleanFreak」は、ローダー、エンコーダー、サンプ…
★ 32 ⑂ 4 2026-06-07
LLM
GitHub
dejavu
Deja Vuは、AIエージェントやアシスタント向けに設計されたローカルファーストのAI記憶システムです。AIツール間で失…
★ 32 ⑂ 3 Apache-2.0 2026-06-11