3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub f5-tts-hotkey
このツールは、任意のアプリケーションで選択したテキストを、Alt+Xのホットキー操作でF5-TTSによる音声合成で読み上…
★ 1 2026-06-02
マルチモーダル GitHub MultiModal-from-scratch
このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル(VLM)をゼロから構築するための詳細なステップ…
★ 1 2026-06-06
3D / NeRF GitHub comfyui-splat-loader
Splat Loaderは、人気のある画像生成UIであるComfyUI用のカスタムノードです。このツールは、Gaussian Splatting形式…
★ 1 ⑂ 1 MIT 2026-06-11
画像生成 GitHub reel-forge
reel-forgeは、AIを活用したInstagram Reels動画生成ツールです。人物の静止画と参照となるダンスリール動画を入力す…
★ 1 ⑂ 5 MIT 2026-05-19
画像生成 GitHub image-to-prompt
このツールは、AIを活用したデスクトップアプリケーションで、画像からAI画像生成のための構造化されたプロンプトを…
★ 1 MIT 2026-06-15
3D / NeRF GitHub gmnerf
このリポジトリは、ICLR 2026で発表された「Weight Space Representation Learning on Diverse NeRF Architectures」…
★ 1 MIT 2026-04-03
ComfyUI GitHub ConfyUI_Post_Processing_PRO
「Post_Processing_PRO for ComfyUI」は、ComfyUI向けにキュレーションされたプロフェッショナルかつ高忠実度の後処…
★ 1 ⑂ 1 GPL-3.0 2026-04-14
LLM GitHub multi-agent-recovery-pipeline
この「Multi-Agent Failure Recovery Pipeline」は、大規模言語モデル(LLM)が自身の誤答を自動で検知し、修正する…
★ 1 2026-05-23
音楽生成 GitHub musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
音声生成 / TTS GitHub omnivoice-gfx1150
このリポジトリは、k2-fsa/OmniVoiceの音声クローンTTSを、AMD Radeon 890M統合GPU(gfx1150/Strix Point)上で動作…
★ 1 MIT 2026-05-30
LLM GitHub rag-chatbot-university
UniMindは、大学生向けのAIを活用したRAG(検索拡張生成)チャットボットで、大学のノートに関する質問に即座に答え…
★ 1 2026-05-30
ASR / 音声認識 GitHub AI-Voice-Receptionist
AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…
★ 1 2026-06-04
動画生成 GitHub ai-avatar-video-generator
このツールは、スクリプトとアバターから音声同期されたトーキングヘッドビデオを生成するオープンソースのAIアバタ…
★ 1 ⑂ 1 MIT 2026-06-25
LLM GitHub rag-radar
RAG Radarは、新しいRAG(Retrieval-Augmented Generation)の実装、ツール、およびパターンをリアルタイムで追跡す…
★ 1 2026-06-26
音声生成 / TTS GitHub echotwin
EchoTwinは、Discordで利用できるAI音声ボットで、ユーザーの発言にクローンされた声でリアルタイムに返答します。Fi…
★ 1 MIT 2026-06-12
ASR / 音声認識 GitHub mixpeek-extractors
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…
★ 1 MIT 2026-06-16
画像生成 GitHub diffusion-models-from-scratch
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNIS…
★ 1 MIT 2026-05-08
マルチモーダル GitHub ControlFoley_test
ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…
★ 1 Apache-2.0 2026-04-17
音声生成 / TTS GitHub SoviaMate
SoviaMateは、エンドツーエンドの音声対話システム(SDS)構築に向けたオープンな研究プロジェクトです。特に、大規…
★ 1 Apache-2.0 2026-05-18
LLM GitHub argus-ai
Argusは、サプライチェーン、金融、ヘルスケアなどの高リスクな意思決定を支援する、多角的で説明可能、不確実性を考…
★ 1 Apache-2.0 2026-05-18
画像生成 GitHub windowed-minority-guidance
この研究は、拡散デノイジングにおける「マイノリティガイダンス」がどの時間ステップで効果を発揮するかを検証しま…
★ 1 2026-06-04
画像生成 GitHub TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
LLM GitHub FraudGuard
FraudGuardは、銀行取引の不正調査を効率化するツールです。取引IDを入力すると、ルールベースで不正リスクをスコア…
★ 1 2026-05-27
画像生成 GitHub xhs-ai-content-studio
「AIAI Hub」は、GitHub上のAI関連オープンソースソフトウェアを自動的に発見し、WordPressサイトにカタログとして公…
★ 1 ⑂ 1 2026-06-05