3,639 repos GH 3,524 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2217 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
awesome-ai-media
JuneYaooo/awesome-ai-mediaは、AIを活用した動画作成、ソーシャルメディア自動化、コンテンツ作成ツールを150以上厳…
★ 1 ⑂ 3 2026-06-23
マルチモーダル
GitHub
zero-shot-video-classifier
このツールは、ビジョン言語基盤モデル(CLIP、SigLIP 2、X-CLIP)を用いたゼロショット動画分類器です。タスク固有…
★ 1 2026-06-09
LLM
GitHub
ChatPDF
このプロジェクトは、Streamlitで構築された軽量かつ強力なRAG(検索拡張生成)ベースのPDFチャットアプリケーション…
★ 1 MIT 2026-05-20
AIエージェント
GitHub
ninja-harness
Ninja Harnessは、AIエージェントのプロダクション環境での信頼性、安全性、効率性を評価するための、トレースを重視…
★ 1 NOASSERTION 2026-06-06
音声生成 / TTS
GitHub
voiceclone-guard
「VoiceClone Guard」は、AI音声ディープフェイクを無料で検出するオープンソースのツールです。Webブラウザから音声…
★ 1 MIT 2026-05-23
AIエージェント
GitHub
mq-agent
mq-agentは、mqエコシステム向けに設計された、ターミナルネイティブなAIエージェントオーケストレーターです。計画…
★ 1 MIT 2026-06-23
音声生成 / TTS
GitHub
minimax-hub
このツールは、MiniMaxのAI生成機能をCodex CLIに統合するためのスキルです。画像生成、動画生成、音声合成(多言語…
★ 1 MIT 2026-05-29
ASR / 音声認識
GitHub
spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
音声生成 / TTS
GitHub
md-tts
md-ttsは、技術的なMarkdownファイルを音声で読み上げ、コードブロック、テーブル、フラッシュカードで再生をインタ…
★ 1 MIT 2026-06-04
3D / NeRF
GitHub
splat-slim
splat-slimは、3D Gaussian Splatting(3DGS)モデルを再トレーニングせずに軽量化するためのツールです。既存の.ply…
★ 1 MIT 2026-06-14
画像生成
GitHub
generative-modeling-scientific
このリポジトリは、科学計算タスクに適用されるスコアベースの生成モデルの研究用ベンチマークフレームワークです。…
★ 1 2026-06-13
音楽生成
GitHub
MAZ-MUSIC
MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…
★ 1 ⑂ 1 MIT 2026-06-15
音声生成 / TTS
GitHub
mlx-indextts-webui
このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…
★ 1 NOASSERTION 2026-05-20
LLM
GitHub
langgraph
Roco Kingdomは、多エージェント協力に基づく『洛克王国』ゲームの精霊百科システムです。自然言語で精霊情報、属性…
★ 1 2026-05-22
音楽生成
GitHub
musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
画像生成
GitHub
my-lm
My-LMは、オープンウェイトのLLM実行、SDXL画像生成、RAG、QLoRAファインチューニングといった高度なAIタスクを、単…
★ 1 MIT 2026-05-09
ComfyUI
GitHub
comfyui-prompt-editor
「comfyui-prompt-editor」は、ComfyUIの複数行プロンプトウィジェットをフルスクリーンでタッチ操作可能にするエデ…
★ 1 ⑂ 1 MIT 2026-06-13
ComfyUI
GitHub
vram8gb_comfyui_wan2.2
vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2(14…
★ 1 2026-06-25
画像生成
GitHub
Brain-MRI-Generation-and-Segmentation
このリポジトリは、膠芽腫セグメンテーションのための合成T1c脳MRIスキャン生成に関する修士論文に付随するものです…
★ 1 2026-06-09
マルチモーダル
GitHub
mlx-mtp
mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…
★ 1 Apache-2.0 2026-06-16
音声生成 / TTS
GitHub
speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
音楽生成
GitHub
synt-audio
Auratuneは、Lofi Girlのような没入型体験にインスパイアされた、Lo-fiスタイルのデジタルコンテンツ作成システムで…
★ 1 2026-04-21
画像生成
GitHub
TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
音声生成 / TTS
GitHub
ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26