3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2211 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub mlx-indextts
MLX-IndexTTSは、Apple Silicon向けに最適化された高品質なテキスト読み上げ(TTS)ツールで、IndexTTS 1.5および2.0…
★ 6 ⑂ 1 MIT 2026-04-15
画像生成 GitHub kimodo-houdini-bridge
このツールは、NVIDIA Kimodo(テキスト駆動の3D人体モーション生成AIモデル)をSideFX Houdiniに連携させるブリッジ…
★ 6 ⑂ 1 2026-06-10
画像生成 GitHub dbmsolver
DBMSolverは、高品質な画像間変換(Image-to-Image Translation)を実現するための、トレーニング不要な拡散ブリッジ…
★ 6 2026-06-05
ASR / 音声認識 GitHub Clippos
Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…
★ 6 ⑂ 1 MIT 2026-04-26
音声生成 / TTS GitHub BridgeSpeak
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…
★ 6 ⑂ 2 MIT 2026-05-10
ASR / 音声認識 GitHub game_voice_trans
VoxGoは、PCゲームプレイヤー向けに開発されたオープンソースのリアルタイム音声翻訳フロートウィンドウツールです。…
★ 6 GPL-3.0 2026-06-11
音声生成 / TTS GitHub HiggsAudiov2TokenizerUnofficial
本ツールは、HuBERTのセマンティック特徴量を用いたHiggs Audio V2 Tokenizerの非公式PyTorch実装です。960倍ダウン…
★ 6 ⑂ 2 2025-10-08
音声生成 / TTS GitHub uttera-tts-hotcold
uttera-tts-hotcoldは、ハイブリッドな「Hot/Cold」ワーカーアーキテクチャとプラグ可能なバックエンド(Coqui XTTS-…
★ 6 ⑂ 2 Apache-2.0 2026-05-15
画像生成 GitHub comfyui-lighthouse
ComfyUI用のLighthouseは、ノード間の接続関係を視覚的に明確にする非破壊的なオーバーレイツールです。クリックした…
★ 6 ⑂ 2 2026-06-07
3D / NeRF GitHub SLAM-X
SLAM-Xは、NeRF-SLAMおよびGaussian Splatting SLAMシステムの動的なシーンにおけるロバスト性を向上させるためのプ…
★ 6 ⑂ 1 GPL-3.0 2025-12-09
3D / NeRF GitHub higs
HiGSは、SIGGRAPH Asia 2025で発表された「Inverse Radiative Transport for Infrared Scenes with Gaussian Primiti…
★ 6 ⑂ 1 2026-06-09
動画生成 GitHub seedance-superprompt
Seedance 2.0 Superpromptは、ByteDance Seedance 2.0の動画生成プロンプト作成を支援するポータブルなプロンプトス…
★ 6 ⑂ 2 MIT 2026-05-23
LLM GitHub agent-engineering-roadmap
このリポジトリは、プロンプトやRAGの段階を超え、本番環境で利用可能なAIエージェントの構築を目指す開発者向けの、…
★ 6 ⑂ 1 MIT 2026-06-26
画像生成 GitHub M2GenCO
M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…
★ 6 2026-05-26
LLM GitHub 3GPP-Everything
「3GPP-Everything」は、Rel-18/19を含む全ての3GPP 5G仕様書(1270篇、約39万段落)を網羅する生産級RAG(検索拡張…
★ 5 AGPL-3.0 2026-06-05
動画生成 GitHub sana-video-local-ui
「SANA Video Local UI」は、ReactとFastAPIを基盤としたワークベンチで、SANA-Video 2B diffusersモデルを一般的な…
★ 5 ⑂ 2 MIT 2026-05-25
画像生成 GitHub FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01
画像生成 GitHub CUIG
CUIGは、テキストから画像を生成する拡散モデルにおける概念忘却の研究コードベースです。本リポジトリは、独立、シ…
★ 5 MIT 2026-06-12
ComfyUI GitHub ComfyUI-Flow-Assistor
ComfyUI-Flow-Assistorは、ComfyUIのワークフローを効率化するための必須ユーティリティノード集です。このツールは…
★ 5 ⑂ 2 MIT 2026-05-14
3D / NeRF GitHub wavelet-splatting
WIPES(Wavelet-based Visual Primitives)は、多次元視覚信号の効率的な表現を目的としたウェーブレットベースの視…
★ 5 MIT 2026-06-04
ASR / 音声認識 GitHub PARSE
PARSEは、記述言語学のフィールドワークと、それに続く比較分析を支援するブラウザベースのワークステーションです。…
★ 5 MIT 2026-06-27
LLM GitHub spark-1822
このリポジトリは、NVIDIA DGX Sparkワークステーション向けの包括的な設定を提供します。Caddyリバースプロキシ、Op…
★ 5 ⑂ 1 MIT 2026-06-08
音声生成 / TTS GitHub voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
AIエージェント GitHub shard-siem
SHARD Enterprise SIEMは、自律型AIを搭載した次世代のSIEMプラットフォームです。リアルタイムの脅威検知、自律的な…
★ 5 ⑂ 3 MIT 2026-06-17