3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
画像生成 GitHub colored-noise-sampling
Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…
★ 37 ⑂ 3 MIT 2026-06-01
音声生成 / TTS GitHub voice-agents-from-scratch
「Voice agents from scratch」は、Pythonでリアルタイム音声エージェントをゼロから構築するための実践的なチュート…
★ 37 ⑂ 3 MIT 2026-05-03
マルチモーダル GitHub VL-Calibration
VL-Calibrationは、大規模視覚言語モデル(LVLMs)の推論における信頼性キャリブレーションを向上させるためのフレー…
★ 37 Apache-2.0 2026-04-13
マルチモーダル GitHub OmniAgent
OmniAgentは、動画コンテンツを効率的に理解するための革新的なオムニモーダルAIエージェントです。従来のモデルとは…
★ 36 ⑂ 3 Apache-2.0 2026-06-24
ASR / 音声認識 GitHub arkiv
arkivは、AIセマンティック検索機能を備えたオープンソースのローカルファーストメディアアセットマネージャーです。…
★ 36 ⑂ 4 MIT 2026-06-24
画像生成 GitHub codex-gpt-image
「Codex GPT Image Skill」は、OpenClaw、Claude Code、Codex、Hermes AgentといったAIエージェント向けに、GPT-Imag…
★ 36 ⑂ 1 MIT 2026-06-19
LLM GitHub spark-evals
このリポジトリは、DGX Sparkという特定のハードウェア環境で動作する、小規模な言語モデルや量子化モデルのベンチマ…
★ 36 ⑂ 1 2026-06-21
画像生成 GitHub NeveAI
Neve AIは、プライバシーを最優先し、完全にデータ主権を保つローカルAIオーケストレーションエコシステムです。Fast…
★ 35 ⑂ 2 NOASSERTION 2026-06-18
LLM GitHub PersonaLingo
PersonaLingo v2は、AIを活用したIELTSスピーキング試験向けのパーソナライズされたコーパス生成ツールです。RAGとメ…
★ 34 ⑂ 2 MIT 2026-06-18
LLM GitHub TimeOmni-1
TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…
★ 34 ⑂ 3 Apache-2.0 2026-06-12
動画生成 GitHub Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集に…
★ 34 2026-05-15
LLM GitHub FreeRideV3
FreeRideは、複数の無料AI推論プロバイダを1つのローカルOpenAI互換ゲートウェイにまとめるCLIツールです。OpenRoute…
★ 34 ⑂ 4 MIT 2026-05-29
音声生成 / TTS GitHub utmos-pytorch
UTMOS-PyTorchは、音声品質評価モデルUTMOSの非公式なPyTorch実装です。オリジナルのUTMOSが依存するfairseqのインス…
★ 34 ⑂ 1 MIT 2026-06-06
画像生成 GitHub Micro-Diffusion
Micro Diffusionは、Pythonで実装されたテキスト拡散モデルの基礎を学習するためのプロジェクトです。KarpathyのMicr…
★ 33 ⑂ 2 MIT 2026-04-13
動画生成 GitHub seedance-api
Seedance 2.0 APIは、ByteDanceが開発したAI動画生成エンジンへの非公式アクセスを提供するツールです。このAPIは、…
★ 33 ⑂ 5 2026-06-24
動画生成 GitHub MaxVideoAi
MaxVideoAIは、Sora、Veo、Kling、Seedance、LTXといった複数のAIビデオモデルを比較・生成できるマルチエンジンAIビ…
★ 33 ⑂ 13 NOASSERTION 2026-06-25
3D / NeRF GitHub TRELLIS-AMD
このツールは、MicrosoftのImage-to-3D生成ツール「TRELLIS」を、AMD製GPU(特にROCm対応モデル)で動作するように修…
★ 33 ⑂ 3 MIT 2026-05-09
画像生成 GitHub RTDMD
RTDMD(Reward-Tilted Distribution Matching Distillation)は、少ないステップ数で高品質な画像を生成する「few-st…
★ 32 ⑂ 1 Apache-2.0 2026-06-06
ASR / 音声認識 GitHub vibeclip
VibeClipは、長い動画コンテンツ(ポッドキャスト、インタビュー、ライブストリームなど)を、キャプション付きの縦…
★ 32 ⑂ 6 AGPL-3.0 2026-06-25
AIエージェント GitHub skill-scanner-agent
Skill Scanner Agentは、LLMエージェントベースのセキュリティスキャンツールです。SKILLディレクトリ内のセキュリテ…
★ 32 ⑂ 1 MIT 2026-05-18
ComfyUI GitHub Comfyui-anima-sampler
ComfyUI Anima Flow Corrective Samplerは、ComfyUI用のカスタムサンプラーノードで、AnimaおよびCosmosスタイルの画…
★ 32 ⑂ 2 MIT 2026-06-10
マルチモーダル GitHub ARIS-Movie-Director
ARIS-Movie-Directorは、曖昧なストーリーの指示から、AIエージェントが生成と監査を行い、イメージベースのムービー…
★ 32 ⑂ 2 MIT 2026-06-26
画像生成 GitHub comfyui-CleanFreak
ComfyUIのワークフローをワンクリックで役割ごとに整理するツール「CleanFreak」は、ローダー、エンコーダー、サンプ…
★ 32 ⑂ 4 2026-06-07
LLM GitHub dejavu
Deja Vuは、AIエージェントやアシスタント向けに設計されたローカルファーストのAI記憶システムです。AIツール間で失…
★ 32 ⑂ 3 Apache-2.0 2026-06-11