3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

LLM
GitHub
ThinkJEPA
ThinkJEPAは、ビジョン-言語モデル(VLM)とJEPA(Joint Embedding Predictive Architecture)を統合したデュアルパス具…
★ 42 ⑂ 5 NOASSERTION 2026-04-30
音声生成 / TTS
GitHub
call-translator
「Realtime Call Translator」は、ビデオ/音声通話中にリアルタイムで音声を翻訳するツールです。あなたが話す言語は…
★ 42 ⑂ 11 MIT 2026-04-04
ASR / 音声認識
GitHub
echoic
Echoicは、AIを活用した発話練習ツールです。任意の音声ファイルをインポートし、文章ごとに発話練習を行い、音素レ…
★ 41 ⑂ 5 MIT 2026-05-19
3D / NeRF
GitHub
OVGGT
OVGGTは、トレーニング不要で、任意に長いビデオストリームからリアルタイムで3D再構成を可能にする革新的なフレーム…
★ 41 ⑂ 1 NOASSERTION 2026-06-15
LLM
GitHub
grok-dreamcore
このツールは、感情状態、記憶の固定点、象徴的な原型に基づいて超現実的な夢のシーケンスを生成するエンジンです。…
★ 41 ⑂ 6 NOASSERTION 2026-05-26
音声生成 / TTS
GitHub
Irodori-TTS-Server
「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Spe…
★ 41 ⑂ 10 MIT 2026-06-22
ComfyUI
GitHub
ComfyUI-Grounding
ComfyUI-Groundingは、ComfyUI上でテキスト指定による物体検出・領域マスク生成・SAM2セグメンテーションをまとめて…
★ 41 ⑂ 3 MIT 2026-06-22
LLM
GitHub
bit-brain
BitBrainは、最小限のGPUリソース(RTX 3090以上)で独自の小型LLM(miniLLM)を学習できるプロジェクトです。Qwen3-…
★ 41 ⑂ 2 Apache-2.0 2026-05-04
音楽生成
GitHub
latentscore
LatentScoreは、テキスト記述からアンビエントミュージックを生成するPythonライブラリです。GPU不要でローカル環境…
★ 40 ⑂ 4 Apache-2.0 2026-05-29
ASR / 音声認識
GitHub
voiceInput
「VoiceInput」は、Windows OS向けのAI音声入力ツールです。指定されたショートカットキーを押すだけで、話した内容…
★ 40 ⑂ 7 MIT 2026-06-25
画像生成
GitHub
image2-ads-studio
Image2 Ads Studioは、Image2向けの広告プロンプト生成エージェントです。顧客のビジネス要件、コピー、参考画像を分…
★ 39 ⑂ 3 Apache-2.0 2026-05-06
動画生成
GitHub
PhyMotion
PhyMotionは、人間のビデオ生成におけるリアルなモーション生成の課題を解決するために提案された、構造化された詳細…
★ 39 ⑂ 5 MIT 2026-05-15
音声生成 / TTS
GitHub
voice-zero
Voice-Zeroは、ゼロショットテキスト音声合成エンジン(Chatterbox、Pocket TTSなど)で利用可能な、高品質なオープ…
★ 39 ⑂ 7 NOASSERTION 2026-05-14
画像生成
GitHub
AHD
このリポジトリは、拡散大規模言語モデル(dLLM)向けのトレーニング不要でプラグアンドプレイな動的デコーディング…
★ 38 2026-04-13
AIエージェント
GitHub
Workspace-Bench
Workspace-Benchは、大規模なファイル依存関係を持つワークスペースタスクにおいてAIエージェントの能力を評価するた…
★ 38 ⑂ 3 MIT 2026-06-25
LLM
GitHub
rag-zero-hallucinations
このプロジェクトは、1,000万件以上の大規模なドキュメント群に対応し、幻覚(Hallucination)をほぼゼロに抑えるこ…
★ 38 ⑂ 16 MIT 2026-06-08
3D / NeRF
GitHub
vggt-factor-refinement
このプロジェクトは、ビデオから3D再構築を効率的に行うためのツールです。VGGT(Video-based General-purpose Geome…
★ 38 ⑂ 2 2026-06-16
AIエージェント
GitHub
1rok
1rokは、OpenAI、Anthropic、Geminiなどの多様なLLMプロバイダーと、Alpaca、Yahoo Finance、FREDといった金融ツール…
★ 38 ⑂ 9 MIT 2026-05-13
ComfyUI
GitHub
nd-super-nodes
ND Super Nodesは、人気の画像生成AIツールComfyUI向けに設計された、モダンで使いやすいカスタムノード群です。特に…
★ 38 ⑂ 4 MIT 2026-06-16
LLM
GitHub
ai-flow-architect
「AI Flow Architect」は、単一のAI出力に依存することなく、LLM(大規模言語モデル)のハルシネーション(誤情報生…
★ 38 ⑂ 3 Apache-2.0 2026-05-30
画像生成
GitHub
colored-noise-sampling
Colored Noise Diffusion Sampling (CNS)は、拡散モデルの画像生成プロセスを最適化するプラグアンドプレイ型のSDEサ…
★ 37 ⑂ 3 MIT 2026-06-01
音声生成 / TTS
GitHub
voice-agents-from-scratch
「Voice agents from scratch」は、Pythonでリアルタイム音声エージェントをゼロから構築するための実践的なチュート…
★ 37 ⑂ 3 MIT 2026-05-03
マルチモーダル
GitHub
VL-Calibration
VL-Calibrationは、大規模視覚言語モデル(LVLMs)の推論における信頼性キャリブレーションを向上させるためのフレー…
★ 37 Apache-2.0 2026-04-13
マルチモーダル
GitHub
PatentRadar
PatentRadarは、特許公開番号を入力するだけで、弁護士やエンジニアが直接レビュー可能なクレームチャート報告書を自…
★ 37 ⑂ 6 2026-06-11