3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI
GitHub
ComfyUI-BS_Kokoro-onnx
「ComfyUI-BS_Kokoro-onnx」は、AI音声合成モデル「Kokoro-onnx」を人気のある画像生成UI「ComfyUI」で利用可能にす…
★ 37 ⑂ 4 MIT 2025-01-19
画像生成
GitHub
StyleExpert
StyleExpertは、HVision-NKUによって開発された、多様な画像スタイル変換を可能にするツールです。Mixture of Style …
★ 37 2026-03-19
マルチモーダル
GitHub
VL-Calibration
VL-Calibrationは、大規模視覚言語モデル(LVLMs)の推論における信頼性キャリブレーションを向上させるためのフレー…
★ 37 Apache-2.0 2026-04-13
画像生成
GitHub
agent-chat-selfie
Chat Selfieは、AIエージェントに感情豊かな「顔」と「心」を与えることで、単なるテキストのやり取りを超えた深い対…
★ 37 ⑂ 3 MIT 2026-03-26
画像生成
GitHub
colored-noise-sampling
Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…
★ 37 ⑂ 3 MIT 2026-06-01
音声生成 / TTS
GitHub
voice-agents-from-scratch
「Voice agents from scratch」は、Pythonでリアルタイム音声エージェントをゼロから構築するための実践的なチュート…
★ 37 ⑂ 3 MIT 2026-05-03
LLM
GitHub
Dokis
Dokisは、RAG(Retrieval-Augmented Generation)パイプラインにおいて、LLMが生成する応答に含まれる根拠のない主張…
★ 37 MIT 2026-04-28
マルチモーダル
GitHub
OmniAgent
OmniAgentは、動画コンテンツを効率的に理解するための革新的なオムニモーダルAIエージェントです。従来のモデルとは…
★ 36 ⑂ 3 Apache-2.0 2026-06-24
ComfyUI
GitHub
comfyui-floodgate
ComfyUI Floodgateは、ComfyUIのワークフローにおけるロジックフローを簡単に制御できるカスタムノードです。処理時…
★ 36 ⑂ 10 MIT 2025-08-12
3D / NeRF
GitHub
NeRAF
NeRAFは、ICLR 2025で発表された、3Dシーンの情報を統合したニューラルラディアンスフィールドとアコースティックフ…
★ 36 ⑂ 2 NOASSERTION 2026-03-11
ASR / 音声認識
GitHub
arkiv
arkivは、AIセマンティック検索機能を備えたオープンソースのローカルファーストメディアアセットマネージャーです。…
★ 36 ⑂ 4 MIT 2026-06-24
画像生成
GitHub
codex-gpt-image
「Codex GPT Image Skill」は、OpenClaw、Claude Code、Codex、Hermes AgentといったAIエージェント向けに、GPT-Imag…
★ 36 ⑂ 1 MIT 2026-06-19
ComfyUI
GitHub
Comfyui-anima-sampler
ComfyUI Anima Flow Corrective Samplerは、ComfyUI用のカスタムサンプラーノードで、AnimaおよびCosmosスタイルの画…
★ 36 ⑂ 2 MIT 2026-06-10
マルチモーダル
GitHub
synthvision
SynthVisionは、医療画像VQA(Visual Question Answering)データセットの生成と、それを用いたVLM(Vision Language…
★ 36 ⑂ 5 2026-03-23
LLM
GitHub
TimeOmni-1
TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…
★ 36 ⑂ 3 Apache-2.0 2026-06-12
画像生成
GitHub
NeveAI
Neve AIは、プライバシーを最優先し、完全にデータ主権を保つローカルAIオーケストレーションエコシステムです。Fast…
★ 35 ⑂ 2 NOASSERTION 2026-06-18
LLM
GitHub
OneEval
OneEvalは、オープンな大規模言語モデル(LLM)の評価結果における監査の難しさや再現性の低さという課題を解決する…
★ 35 2026-03-04
LLM
GitHub
FreeRideV3
FreeRideは、複数の無料AI推論プロバイダを1つのローカルOpenAI互換ゲートウェイにまとめるCLIツールです。OpenRoute…
★ 34 ⑂ 4 MIT 2026-05-29
3D / NeRF
GitHub
msplat
rayanht/msplatは、Apple Siliconデバイス向けにMetalをフル活用した3D Gaussian Splattingのトレーニングエンジンで…
★ 34 ⑂ 10 Apache-2.0 2026-03-10
動画生成
GitHub
Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集に…
★ 34 2026-05-15
音声生成 / TTS
GitHub
utmos-pytorch
UTMOS-PyTorchは、音声品質評価モデルUTMOSの非公式なPyTorch実装です。オリジナルのUTMOSが依存するfairseqのインス…
★ 34 ⑂ 1 MIT 2026-06-06
画像生成
GitHub
RTDMD
RTDMD(Reward-Tilted Distribution Matching Distillation)は、少ないステップ数で高品質な画像を生成する「few-st…
★ 34 ⑂ 1 Apache-2.0 2026-06-06
LLM
GitHub
polarity-agent
Polarity AIは、既存のAIの「中立性」に疑問を投げかける諷刺的なオープンソースAIエージェントフレームワークです。…
★ 34 MIT 2026-03-21
LLM
GitHub
PersonaLingo
PersonaLingo v2は、AIを活用したIELTSスピーキング試験向けのパーソナライズされたコーパス生成ツールです。RAGとメ…
★ 33 ⑂ 2 MIT 2026-06-18