3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2208 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音楽生成

GitHub

SynthBridge

SynthBridgeは、ユーザーが入力したコード進行やメロディをリアルタイムで生成し、即座に演奏できる音楽生成Webアプ…

#Flask #Python #Web UI

★ 52 MIT 2026-05-27

ComfyUI

GitHub

comfyui-aeon-spark

このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…

#ComfyUI対応 #Docker #GPU必須

★ 52 ⑂ 15 2026-06-28

ASR / 音声認識

GitHub

youtube-to-knowledge

このツール「youtube-to-knowledge」は、YouTube動画を文字起こし、要約、そしてインタラクティブな知識グラフへと変…

#Claude Code #CLI #Knowledge Graph

★ 51 ⑂ 9 MIT 2026-04-16

3D / NeRF

GitHub

metaquest-3d-reconstruction

本ツールは、Meta Questデバイスでキャプチャされたパススルー画像と深度データを用いて3Dシーンを再構築するための…

#3D再構築 #CLI #COLMAP

★ 51 ⑂ 11 MIT 2026-06-23

3D / NeRF

GitHub

wanderland

Wanderlandは、オープンワールドの具現化されたAI向けに、幾何学的に根拠のあるシミュレーションを提供する包括的な…

#3Dシミュレーション #AI/ML #CLI

★ 51 Apache-2.0 2026-07-02

画像生成

GitHub

RvR

RvR (Refinement via Regeneration) は、清華大学とTencent Hunyuanが開発した、画像リファインメントのための革新的…

#CLI #GPU必須 #Hugging Face

★ 50 ⑂ 1 MIT 2026-05-26

3D / NeRF

GitHub

MuGS

MuGSは、MuJoCo物理シミュレーションと3D Gaussian Splatting (3DGS) を組み合わせたハイブリッドレンダリングパイプ…

#3D Gaussian Splatting対応 #GPU必須 #MuJoCo対応

★ 50 ⑂ 1 NOASSERTION 2026-05-14

音声生成 / TTS

GitHub

Higgs_v3-TTS-ComfyUI

このツールは、ComfyUI用のノード集であり、bosonai/higgs-audio-v3-tts-4bモデルを活用して、多言語（100言語対応）…

#ComfyUI対応 #GPU推奨 #Hugging Face

★ 50 ⑂ 10 MIT 2026-06-20

画像生成

GitHub

gpic

GPIC（Giant Permissive Image Corpus）は、視覚生成モデリング研究のための巨大で許容性の高い画像コーパスです。約…

#GPU必須 #Hugging Face #Python

★ 49 ⑂ 2 MIT 2026-06-04

ComfyUI

GitHub

ComfyUI-AceStep_SFT

ComfyUI-AceStep SFTは、最先端の音楽生成モデル「AceStep 1.5 SFT」をComfyUIに実装するためのモジュラーノードスイ…

#AI/LLM #ComfyUI対応 #Python

★ 49 ⑂ 11 MIT 2026-05-11

LLM

GitHub

Epstein_Files_RAG

「Epstein Files RAG Explorer」は、非密封のジェフリー・エプスタイン裁判記録を探索・分析するためのオープンソー…

#CLI #LangChain #LLM

★ 49 ⑂ 13 MIT 2026-05-29

LLM

GitHub

temporal-rag

この「temporal-rag」は、RAG（Retrieval-Augmented Generation）システムのための、検索後の「時間的な層」を提供す…

#CLI #MIT License #Numpy

★ 48 ⑂ 7 MIT 2026-05-15

LLM

GitHub

ATM-Bench

ATM-Benchは、画像、動画、メールなどのマルチモーダルデータに対し、約4年間にわたる長期的なパーソナライズされた…

#AI/ML #CLI #Multimodal

★ 48 ⑂ 2 MIT 2026-06-28

音声生成 / TTS

GitHub

LightTTS

LightTTSは、Pythonベースの軽量かつ高性能なテキスト読み上げ（TTS）推論・サービスフレームワークです。CosyVoice2…

#CLI #Docker #GPU必須

★ 47 ⑂ 7 Apache-2.0 2026-04-14

音声生成 / TTS

GitHub

Emoji-TTS

このプロジェクトは、Irodori-TTSをフォークし、echo-TTSのWeb UIとして機能する、Flow Matchingベースの高性能なテ…

#CLI #GPU対応 #LLM連携

★ 47 ⑂ 5 MIT 2026-05-29

音声生成 / TTS

GitHub

Audio-Oscar

Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…

#CLI #FFmpeg #GPU必須

★ 47 ⑂ 5 Apache-2.0 2026-06-08

画像生成

GitHub

Fizgig

Fizgigは、Flux 2 Klein 9B LoRAに特化した統合スタジオです。LoRAのトレーニング、プロファイリング、修復、抽出を…

#ComfyUI対応 #GPU必須 #Linux対応

★ 46 ⑂ 3 Apache-2.0 2026-06-07

画像生成

GitHub

MagicBokeh

MagicBokehは、高ズームで撮影された写真に対し、フォトリアリスティックで高品質なボケ効果を効率的に生成するため…

#CLI #GPU必須 #Python

★ 46 ⑂ 1 2026-06-17

3D / NeRF

GitHub

ULF-Loc

ULF-Locは、CVPR 2026 Highlight論文として発表された、3D Gaussian Splattingを用いた堅牢な視覚ローカライゼーショ…

#3D Gaussian Splatting #CLI #CUDA (GPU)

★ 46 ⑂ 6 2026-06-16

3D / NeRF

GitHub

gaussiancar

GaussianCaRは、自律走行車向けの効率的なカメラとレーダー融合技術です。このツールは、Gaussian Splattingをユニバ…

#Docker #GPU必須 #Python

★ 46 ⑂ 2 Apache-2.0 2026-05-07

動画生成

GitHub

awesome-ai-media-cn

このリポジトリは、AIを活用した動画制作およびセルフメディア運営のための厳選されたツール集です。テキストからの…

#CLI #Docker #LLM連携

★ 45 ⑂ 6 2026-06-23

ASR / 音声認識

GitHub

noisekit

noisekitは、自動音声認識（ASR）システムのロバスト性ベンチマークのために、ノイズ層別化された音声データセットを…

#ASRベンチマーク #CLI #HuggingFace対応

★ 45 MIT 2026-06-09

マルチモーダル

GitHub

ScreenClaw

ScreenClaw（睇虾）は、AIアプリケーションとデスクトップソフトウェアを連携させるためのローカル実行型ミドルウェ…

#AI Agent対応 #CLI #HTTP API

★ 45 ⑂ 11 MIT 2026-06-23

LLM

GitHub

AlphaAnalyst-open-source-autonomous-equity-research-agent

AlphaAnalystは、米国株のティッカーから、DCF評価、ピア比較、ニュースセンチメント、決算コールのトーン分析などを…

#FastAPI #LLM #Next.js

★ 44 ⑂ 8 Apache-2.0 2026-04-29