3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
GPT-SoVITS-ko
このツールは、韓国語に特化した音声複製TTS(Text-to-Speech)サービスです。既存のGPT-SoVITSプロジェクトを基盤と…
★ 2 ⑂ 1 MIT 2026-05-27
画像生成
GitHub
SesquiLSR
SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…
★ 2 ⑂ 1 MIT 2026-06-16
音声生成 / TTS
GitHub
HiggsAudio-Studio-pinokio
本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…
★ 2 ⑂ 1 MIT 2026-06-14
3D / NeRF
GitHub
splatfastk1
SplatfastK1は、スマートフォンで撮影した動画をGPU不要で3D Gaussian splatに変換できる無料のWindowsデスクトップ…
★ 2 MIT 2026-06-08
3D / NeRF
GitHub
diff-4d-gaussian-rasterization
このリポジトリは、IROS 2025で発表されたD4DGS-SLAMで利用される、微分可能な4Dガウススプラッティングラスタライザ…
★ 2 NOASSERTION 2026-05-13
LLM
GitHub
memtest
MemTestは、AIメモリシステムの評価に特化したユニバーサルなベンチマーク生成ツールです。手続き型生成により依存性…
★ 2 MIT 2026-06-13
LLM
GitHub
lumen
Lumenは、オンライン記事をAIが生成したスワイプ可能な要約カードに変換するマルチエージェントAIプラットフォームで…
★ 2 2026-06-19
LLM
GitHub
production-rag-assistant
この「Production RAG Assistant」は、FastAPI、Postgres/pgvector、ハイブリッド検索、評価ゲート、可観測性などを…
★ 2 2026-05-28
ASR / 音声認識
GitHub
parley
Parleyは、音声指示型Vision-Language-Action(VLA)パイプライン向けのベンチマークツールキットです。このツールは…
★ 2 MIT 2026-06-23
LLM
GitHub
AegisRAG
AegisRAGは、アクセス制御、トレーサビリティ、ガバナンスを重視するチーム向けの、セキュリティを最優先した監査可…
★ 2 2026-06-18
AIエージェント
GitHub
neon-shadows
「NEON SHADOWS: Chrome & Blood」は、2087年のサイバーパンク世界を舞台にしたPython製のテキストベースRPGです。プ…
★ 2 2026-05-18
動画生成
GitHub
sora-api
Mountsea AIが提供するSora 2 APIは、OpenAIの最新AIビデオ生成モデル「Sora 2 (Sora Pro, Sora2)」への安価で簡単な…
★ 2 MIT 2026-05-27
ASR / 音声認識
GitHub
hotkeys
Hotkeysは、AIを活用してあらゆるアプリケーションでのテキスト編集作業を劇的に効率化するホットキーアプリです。選…
★ 2 NOASSERTION 2026-06-15
ComfyUI
GitHub
semcanvas-ai
SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…
★ 2 MIT 2026-05-13
LLM
GitHub
flash-opd
FlashOPDは、わずか650行のコアコードでOn-Policy Distillation (OPD) を完全に実装した軽量なツールです。既存の複…
★ 2 2026-04-22
画像生成
GitHub
DiffVMB-pub
本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…
★ 2 ⑂ 1 2026-05-04
マルチモーダル
GitHub
omni-retrieval
omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…
★ 2 Apache-2.0 2026-06-08
ASR / 音声認識
GitHub
speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-26
画像生成
GitHub
rainfield-diffusion-models
本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…
★ 2 NOASSERTION 2026-05-21
ASR / 音声認識
GitHub
voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
LLM
GitHub
AGENT33-PUBLIC
AGENT-33は、ローカルファーストのマルチエージェントオーケストレーションプラットフォームです。複数のAIエージェ…
★ 2 Apache-2.0 2026-05-28
音声生成 / TTS
GitHub
saaki-audios
このツールは、Unitree G1ロボットと互換性のある音声ファイルを生成するためのPythonスクリプトです。システムのTex…
★ 2 MIT 2026-06-11
ComfyUI
GitHub
DemonAlone-nodes-ComfyUI
このリポジトリは、ComfyUI用の軽量ユーティリティノード群を提供します。これらは元々XYZプロットパイプラインをサ…
★ 2 ⑂ 1 MIT 2026-06-18