3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2208 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音楽生成 GitHub SynthBridge
SynthBridgeは、ユーザーが入力したコード進行やメロディをリアルタイムで生成し、即座に演奏できる音楽生成Webアプ…
★ 52 MIT 2026-05-27
ComfyUI GitHub comfyui-aeon-spark
このツールは、NVIDIA DGX Spark (GB10 / Blackwell / sm_121a) に特化して最適化された、最先端のComfyUIディストリ…
★ 52 ⑂ 15 2026-06-28
ASR / 音声認識 GitHub youtube-to-knowledge
このツール「youtube-to-knowledge」は、YouTube動画を文字起こし、要約、そしてインタラクティブな知識グラフへと変…
★ 51 ⑂ 9 MIT 2026-04-16
3D / NeRF GitHub metaquest-3d-reconstruction
本ツールは、Meta Questデバイスでキャプチャされたパススルー画像と深度データを用いて3Dシーンを再構築するための…
★ 51 ⑂ 11 MIT 2026-06-23
3D / NeRF GitHub wanderland
Wanderlandは、オープンワールドの具現化されたAI向けに、幾何学的に根拠のあるシミュレーションを提供する包括的な…
★ 51 Apache-2.0 2026-07-02
画像生成 GitHub RvR
RvR (Refinement via Regeneration) は、清華大学とTencent Hunyuanが開発した、画像リファインメントのための革新的…
★ 50 ⑂ 1 MIT 2026-05-26
3D / NeRF GitHub MuGS
MuGSは、MuJoCo物理シミュレーションと3D Gaussian Splatting (3DGS) を組み合わせたハイブリッドレンダリングパイプ…
★ 50 ⑂ 1 NOASSERTION 2026-05-14
音声生成 / TTS GitHub Higgs_v3-TTS-ComfyUI
このツールは、ComfyUI用のノード集であり、bosonai/higgs-audio-v3-tts-4bモデルを活用して、多言語(100言語対応)…
★ 50 ⑂ 10 MIT 2026-06-20
画像生成 GitHub gpic
GPIC(Giant Permissive Image Corpus)は、視覚生成モデリング研究のための巨大で許容性の高い画像コーパスです。約…
★ 49 ⑂ 2 MIT 2026-06-04
ComfyUI GitHub ComfyUI-AceStep_SFT
ComfyUI-AceStep SFTは、最先端の音楽生成モデル「AceStep 1.5 SFT」をComfyUIに実装するためのモジュラーノードスイ…
★ 49 ⑂ 11 MIT 2026-05-11
LLM GitHub Epstein_Files_RAG
「Epstein Files RAG Explorer」は、非密封のジェフリー・エプスタイン裁判記録を探索・分析するためのオープンソー…
★ 49 ⑂ 13 MIT 2026-05-29
LLM GitHub temporal-rag
この「temporal-rag」は、RAG(Retrieval-Augmented Generation)システムのための、検索後の「時間的な層」を提供す…
★ 48 ⑂ 7 MIT 2026-05-15
LLM GitHub ATM-Bench
ATM-Benchは、画像、動画、メールなどのマルチモーダルデータに対し、約4年間にわたる長期的なパーソナライズされた…
★ 48 ⑂ 2 MIT 2026-06-28
音声生成 / TTS GitHub LightTTS
LightTTSは、Pythonベースの軽量かつ高性能なテキスト読み上げ(TTS)推論・サービスフレームワークです。CosyVoice2…
★ 47 ⑂ 7 Apache-2.0 2026-04-14
音声生成 / TTS GitHub Emoji-TTS
このプロジェクトは、Irodori-TTSをフォークし、echo-TTSのWeb UIとして機能する、Flow Matchingベースの高性能なテ…
★ 47 ⑂ 5 MIT 2026-05-29
音声生成 / TTS GitHub Audio-Oscar
Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…
★ 47 ⑂ 5 Apache-2.0 2026-06-08
画像生成 GitHub Fizgig
Fizgigは、Flux 2 Klein 9B LoRAに特化した統合スタジオです。LoRAのトレーニング、プロファイリング、修復、抽出を…
★ 46 ⑂ 3 Apache-2.0 2026-06-07
画像生成 GitHub MagicBokeh
MagicBokehは、高ズームで撮影された写真に対し、フォトリアリスティックで高品質なボケ効果を効率的に生成するため…
★ 46 ⑂ 1 2026-06-17
3D / NeRF GitHub ULF-Loc
ULF-Locは、CVPR 2026 Highlight論文として発表された、3D Gaussian Splattingを用いた堅牢な視覚ローカライゼーショ…
★ 46 ⑂ 6 2026-06-16
3D / NeRF GitHub gaussiancar
GaussianCaRは、自律走行車向けの効率的なカメラとレーダー融合技術です。このツールは、Gaussian Splattingをユニバ…
★ 46 ⑂ 2 Apache-2.0 2026-05-07
動画生成 GitHub awesome-ai-media-cn
このリポジトリは、AIを活用した動画制作およびセルフメディア運営のための厳選されたツール集です。テキストからの…
★ 45 ⑂ 6 2026-06-23
ASR / 音声認識 GitHub noisekit
noisekitは、自動音声認識(ASR)システムのロバスト性ベンチマークのために、ノイズ層別化された音声データセットを…
★ 45 MIT 2026-06-09
マルチモーダル GitHub ScreenClaw
ScreenClaw(睇虾)は、AIアプリケーションとデスクトップソフトウェアを連携させるためのローカル実行型ミドルウェ…
★ 45 ⑂ 11 MIT 2026-06-23
LLM GitHub AlphaAnalyst-open-source-autonomous-equity-research-agent
AlphaAnalystは、米国株のティッカーから、DCF評価、ピア比較、ニュースセンチメント、決算コールのトーン分析などを…
★ 44 ⑂ 8 Apache-2.0 2026-04-29