3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
画像生成 GitHub colored-noise-sampling
Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…
★ 37 ⑂ 3 MIT 2026-06-01
マルチモーダル GitHub VL-Calibration
VL-Calibrationは、大規模視覚言語モデル(LVLMs)の推論における信頼性キャリブレーションを向上させるためのフレー…
★ 37 Apache-2.0 2026-04-13
画像生成 GitHub agent-chat-selfie
Chat Selfieは、AIエージェントに感情豊かな「顔」と「心」を与えることで、単なるテキストのやり取りを超えた深い対…
★ 37 ⑂ 3 MIT 2026-03-26
マルチモーダル GitHub PatentRadar
PatentRadarは、特許公開番号を入力するだけで、弁護士やエンジニアが直接レビュー可能なクレームチャート報告書を自…
★ 37 ⑂ 6 2026-06-11
音声生成 / TTS GitHub voice-agents-from-scratch
「Voice agents from scratch」は、Pythonでリアルタイム音声エージェントをゼロから構築するための実践的なチュート…
★ 37 ⑂ 3 MIT 2026-05-03
LLM GitHub spark-evals
このリポジトリは、DGX Sparkという特定のハードウェア環境で動作する、小規模な言語モデルや量子化モデルのベンチマ…
★ 36 ⑂ 1 2026-06-21
マルチモーダル GitHub OmniAgent
OmniAgentは、動画コンテンツを効率的に理解するための革新的なオムニモーダルAIエージェントです。従来のモデルとは…
★ 36 ⑂ 3 Apache-2.0 2026-06-24
3D / NeRF GitHub NeRAF
NeRAFは、ICLR 2025で発表された、3Dシーンの情報を統合したニューラルラディアンスフィールドとアコースティックフ…
★ 36 ⑂ 2 NOASSERTION 2026-03-11
ASR / 音声認識 GitHub arkiv
arkivは、AIセマンティック検索機能を備えたオープンソースのローカルファーストメディアアセットマネージャーです。…
★ 36 ⑂ 4 MIT 2026-06-24
ComfyUI GitHub comfyui-floodgate
ComfyUI Floodgateは、ComfyUIのワークフローにおけるロジックフローを簡単に制御できるカスタムノードです。処理時…
★ 36 ⑂ 10 MIT 2025-08-12
画像生成 GitHub codex-gpt-image
「Codex GPT Image Skill」は、OpenClaw、Claude Code、Codex、Hermes AgentといったAIエージェント向けに、GPT-Imag…
★ 36 ⑂ 1 MIT 2026-06-19
マルチモーダル GitHub synthvision
SynthVisionは、医療画像VQA(Visual Question Answering)データセットの生成と、それを用いたVLM(Vision Language…
★ 36 ⑂ 5 2026-03-23
画像生成 GitHub NeveAI
Neve AIは、プライバシーを最優先し、完全にデータ主権を保つローカルAIオーケストレーションエコシステムです。Fast…
★ 35 ⑂ 2 NOASSERTION 2026-06-18
LLM GitHub OneEval
OneEvalは、オープンな大規模言語モデル(LLM)の評価結果における監査の難しさや再現性の低さという課題を解決する…
★ 35 2026-03-04
LLM GitHub FreeRideV3
FreeRideは、複数の無料AI推論プロバイダを1つのローカルOpenAI互換ゲートウェイにまとめるCLIツールです。OpenRoute…
★ 34 ⑂ 4 MIT 2026-05-29
3D / NeRF GitHub msplat
rayanht/msplatは、Apple Siliconデバイス向けにMetalをフル活用した3D Gaussian Splattingのトレーニングエンジンで…
★ 34 ⑂ 10 Apache-2.0 2026-03-10
LLM GitHub TimeOmni-1
TimeOmni-1は、ICLR 2026に採択された研究に基づく、大規模言語モデルが時系列データを用いた複雑な推論を行うことを…
★ 34 ⑂ 3 Apache-2.0 2026-06-12
音声生成 / TTS GitHub utmos-pytorch
UTMOS-PyTorchは、音声品質評価モデルUTMOSの非公式なPyTorch実装です。オリジナルのUTMOSが依存するfairseqのインス…
★ 34 ⑂ 1 MIT 2026-06-06
LLM GitHub polarity-agent
Polarity AIは、既存のAIの「中立性」に疑問を投げかける諷刺的なオープンソースAIエージェントフレームワークです。…
★ 34 MIT 2026-03-21
LLM GitHub PersonaLingo
PersonaLingo v2は、AIを活用したIELTSスピーキング試験向けのパーソナライズされたコーパス生成ツールです。RAGとメ…
★ 34 ⑂ 2 MIT 2026-06-18
動画生成 GitHub Lightning-Unified-Video-Editor-via-In-Context-Sparse-Attention
LIVEditor-14Bは、文脈に即したスパースアテンション(In-Context Sparse Attention)を活用することで、動画編集に…
★ 34 2026-05-15
音声生成 / TTS GitHub xRIR_code
xRIRは、CVPR 2025で発表された論文「Hearing Anywhere in Any Environment」をPyTorchで実装したもので、部屋を跨ぐ…
★ 33 ⑂ 1 NOASSERTION 2025-09-18
LLM GitHub attn_res
このプロジェクトは、Kimi TeamとMoonshotAIによる「Attention Residuals」のPyTorch実装です。Grouped Query Attent…
★ 33 ⑂ 3 Apache-2.0 2026-03-16
動画生成 GitHub MaxVideoAi
MaxVideoAIは、Sora、Veo、Kling、Seedance、LTXといった複数のAIビデオモデルを比較・生成できるマルチエンジンAIビ…
★ 33 ⑂ 13 NOASSERTION 2026-06-25