3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI

GitHub

ConfyUI_Post_Processing_PRO

「Post_Processing_PRO for ComfyUI」は、ComfyUI向けにキュレーションされたプロフェッショナルかつ高忠実度の後処…

#ComfyUI対応 #Python #カメラシミュレーション

★ 1 ⑂ 1 GPL-3.0 2026-04-14

LLM

GitHub

multi-agent-recovery-pipeline

この「Multi-Agent Failure Recovery Pipeline」は、大規模言語モデル（LLM）が自身の誤答を自動で検知し、修正する…

#AI #CLI #Gemini

★ 1 2026-05-23

音楽生成

GitHub

musicgen-api

「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…

#AI音楽生成 #Docker #GPU対応

★ 1 ⑂ 1 MIT 2026-06-04

音声生成 / TTS

GitHub

claude-speech-skill

「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…

#Claude Code対応 #Python #TTS

★ 1 MIT 2026-06-21

画像生成

GitHub

comfyui-amd-plug-and-play

miradorventus/comfyui-amd-plug-and-play は、AMD GPU（Ubuntu/Mint）上でComfyUIのセットアップと実行を大幅に簡素…

#AMD ROCm #CLI #ComfyUI対応

★ 1 2026-05-31

LLM

GitHub

whiskershelf

AI WhiskerShelfは、ローカルで動作するLLM（大規模言語モデル）駆動の論文ライブラリマネージャーです。PDFファイル…

#API連携 #CLI #LLM

★ 1 MIT 2026-06-07

ASR / 音声認識

GitHub

livekit-starter

LiveKit Voice AI Starterは、ブラウザ上でAIエージェントとリアルタイムで音声対話を行うためのフルスタックなスタ…

#Docker #FastAPI #Python

★ 1 MIT 2026-06-18

画像生成

GitHub

diffusion-models-from-scratch

NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル（DDPM、U-Net、CFG、CLIPコサイン類似度）をFashionMNIS…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-08

マルチモーダル

GitHub

ControlFoley_test

ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…

#CLI #GPU必須 #Hugging Face

★ 1 Apache-2.0 2026-04-17

音声生成 / TTS

GitHub

SoviaMate

SoviaMateは、エンドツーエンドの音声対話システム（SDS）構築に向けたオープンな研究プロジェクトです。特に、大規…

#CLI #Hugging Face #Python

★ 1 Apache-2.0 2026-05-18

LLM

GitHub

argus-ai

Argusは、サプライチェーン、金融、ヘルスケアなどの高リスクな意思決定を支援する、多角的で説明可能、不確実性を考…

#FastAPI #Python #Web UI

★ 1 Apache-2.0 2026-05-18

画像生成

GitHub

windowed-minority-guidance

この研究は、拡散デノイジングにおける「マイノリティガイダンス」がどの時間ステップで効果を発揮するかを検証しま…

#Kaggle実験 #Python #拡散モデル

★ 1 2026-06-04

画像生成

GitHub

TBAF

TBAF（Triangle Based Activation Function）は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…

#AI/ML #CLI #GPU必須

★ 1 MIT 2026-05-25

LLM

GitHub

FraudGuard

FraudGuardは、銀行取引の不正調査を効率化するツールです。取引IDを入力すると、ルールベースで不正リスクをスコア…

#FastAPI #LLM #Python

★ 1 2026-05-27

マルチモーダル

GitHub

qwen-visual-training-lab

「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…

#AMD GPU #CLI #DirectML

★ 1 2026-05-15

画像生成

GitHub

anime-sd-mcp

anime-sd-mcpは、MCP（Model Context Protocol）サーバーとして機能し、AIクライアント（Claude Desktop、Claude Cod…

#AIクライアント対応 #CLI #GPU必須

★ 1 MIT 2026-05-30

音楽生成

GitHub

Melodic-Intelligence-Layer

MIL（Melodic Intelligence Layer）は、ニューラルネットワークを使わずに数学理論に基づいたアルゴリズムによるピア…

#API #CLI #MIDI出力

★ 1 Apache-2.0 2026-04-05

動画生成

GitHub

drama-cc

「drama-cc」は、Claude Codeのスラッシュコマンドとして機能するAIツールです。40秒の短編AIソープオペラ動画を生成…

#AI #Claude Code #CLI

★ 1 MIT 2026-05-13

ASR / 音声認識

GitHub

Multimodal-Emotion-Recognition-System

このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…

#CLI #Machine Learning #Python

★ 1 2026-06-08

ASR / 音声認識

GitHub

voiceintake

「VoiceIntake」は、AIを活用して患者の音声問診を自動化するシステムです。患者が話すだけでAIが問診内容を瞬時に文…

#AI活用 #GDPR準拠 #Python

★ 1 2026-06-16

マルチモーダル

GitHub

easycomputewithgemma

このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン（iOS/Android）から自然言…

#Android #CLI #GPU必須

★ 1 2026-05-24

LLM

GitHub

local-ai-lab

「local-ai-lab」は、RAG (Retrieval Augmented Generation)、MCP (Model Context Protocol)、LangChain、LangGraph…

#C# #CLI #Node.js

★ 1 MIT 2026-06-20

LLM

GitHub

FrameScope

FrameScopeは、Redditやニュース記事におけるAI言説の比喩表現とスタンスを、LLMを用いて収集、ラベリング、分析する…

#CLI #LLM利用 #Python

★ 1 MIT 2026-05-07

音声生成 / TTS

GitHub

echome

ECHOMEは、ユーザーの思考、音声、行動を高精度にクローンし自動化するオープンソースの個人AIミラーエンジンです。…

#CLI #Docker #GPU必須

★ 1 MIT 2026-05-07