3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI
GitHub
ConfyUI_Post_Processing_PRO
「Post_Processing_PRO for ComfyUI」は、ComfyUI向けにキュレーションされたプロフェッショナルかつ高忠実度の後処…
★ 1 ⑂ 1 GPL-3.0 2026-04-14
LLM
GitHub
multi-agent-recovery-pipeline
この「Multi-Agent Failure Recovery Pipeline」は、大規模言語モデル(LLM)が自身の誤答を自動で検知し、修正する…
★ 1 2026-05-23
音楽生成
GitHub
musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
音声生成 / TTS
GitHub
claude-speech-skill
「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…
★ 1 MIT 2026-06-21
画像生成
GitHub
comfyui-amd-plug-and-play
miradorventus/comfyui-amd-plug-and-play は、AMD GPU(Ubuntu/Mint)上でComfyUIのセットアップと実行を大幅に簡素…
★ 1 2026-05-31
LLM
GitHub
whiskershelf
AI WhiskerShelfは、ローカルで動作するLLM(大規模言語モデル)駆動の論文ライブラリマネージャーです。PDFファイル…
★ 1 MIT 2026-06-07
ASR / 音声認識
GitHub
livekit-starter
LiveKit Voice AI Starterは、ブラウザ上でAIエージェントとリアルタイムで音声対話を行うためのフルスタックなスタ…
★ 1 MIT 2026-06-18
画像生成
GitHub
diffusion-models-from-scratch
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNIS…
★ 1 MIT 2026-05-08
マルチモーダル
GitHub
ControlFoley_test
ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…
★ 1 Apache-2.0 2026-04-17
音声生成 / TTS
GitHub
SoviaMate
SoviaMateは、エンドツーエンドの音声対話システム(SDS)構築に向けたオープンな研究プロジェクトです。特に、大規…
★ 1 Apache-2.0 2026-05-18
LLM
GitHub
argus-ai
Argusは、サプライチェーン、金融、ヘルスケアなどの高リスクな意思決定を支援する、多角的で説明可能、不確実性を考…
★ 1 Apache-2.0 2026-05-18
画像生成
GitHub
windowed-minority-guidance
この研究は、拡散デノイジングにおける「マイノリティガイダンス」がどの時間ステップで効果を発揮するかを検証しま…
★ 1 2026-06-04
画像生成
GitHub
TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
LLM
GitHub
FraudGuard
FraudGuardは、銀行取引の不正調査を効率化するツールです。取引IDを入力すると、ルールベースで不正リスクをスコア…
★ 1 2026-05-27
マルチモーダル
GitHub
qwen-visual-training-lab
「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…
★ 1 2026-05-15
画像生成
GitHub
anime-sd-mcp
anime-sd-mcpは、MCP(Model Context Protocol)サーバーとして機能し、AIクライアント(Claude Desktop、Claude Cod…
★ 1 MIT 2026-05-30
音楽生成
GitHub
Melodic-Intelligence-Layer
MIL(Melodic Intelligence Layer)は、ニューラルネットワークを使わずに数学理論に基づいたアルゴリズムによるピア…
★ 1 Apache-2.0 2026-04-05
動画生成
GitHub
drama-cc
「drama-cc」は、Claude Codeのスラッシュコマンドとして機能するAIツールです。40秒の短編AIソープオペラ動画を生成…
★ 1 MIT 2026-05-13
ASR / 音声認識
GitHub
Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
ASR / 音声認識
GitHub
voiceintake
「VoiceIntake」は、AIを活用して患者の音声問診を自動化するシステムです。患者が話すだけでAIが問診内容を瞬時に文…
★ 1 2026-06-16
マルチモーダル
GitHub
easycomputewithgemma
このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン(iOS/Android)から自然言…
★ 1 2026-05-24
LLM
GitHub
local-ai-lab
「local-ai-lab」は、RAG (Retrieval Augmented Generation)、MCP (Model Context Protocol)、LangChain、LangGraph…
★ 1 MIT 2026-06-20
LLM
GitHub
FrameScope
FrameScopeは、Redditやニュース記事におけるAI言説の比喩表現とスタンスを、LLMを用いて収集、ラベリング、分析する…
★ 1 MIT 2026-05-07
音声生成 / TTS
GitHub
echome
ECHOMEは、ユーザーの思考、音声、行動を高精度にクローンし自動化するオープンソースの個人AIミラーエンジンです。…
★ 1 MIT 2026-05-07