3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル

GitHub

uitars-mcp

UI-TARS MCPは、AIエージェントがデスクトップとウェブブラウザを操作するための「目と手」を提供するサーバーツール…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-06-07

音声生成 / TTS

GitHub

mlx-indextts-webui

このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…

#Apple Silicon対応 #FastAPI #GPU必須

★ 1 NOASSERTION 2026-05-20

LLM

GitHub

langgraph

Roco Kingdomは、多エージェント協力に基づく『洛克王国』ゲームの精霊百科システムです。自然言語で精霊情報、属性…

#Docker #LangGraph #Milvus

★ 1 2026-05-22

音楽生成

GitHub

musicgen-api

「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…

#AI音楽生成 #Docker #GPU対応

★ 1 ⑂ 1 MIT 2026-06-04

画像生成

GitHub

my-lm

My-LMは、オープンウェイトのLLM実行、SDXL画像生成、RAG、QLoRAファインチューニングといった高度なAIタスクを、単…

#Electron #GPU必須 #LLM対応

★ 1 MIT 2026-05-09

ComfyUI

GitHub

comfyui-prompt-editor

「comfyui-prompt-editor」は、ComfyUIの複数行プロンプトウィジェットをフルスクリーンでタッチ操作可能にするエデ…

#ComfyUI対応 #Python #Web UI

★ 1 ⑂ 1 MIT 2026-06-13

ComfyUI

GitHub

vram8gb_comfyui_wan2.2

vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2（14…

#AI / 機械学習 #ComfyUI対応 #GPU必須

★ 1 2026-06-25

画像生成

GitHub

Brain-MRI-Generation-and-Segmentation

このリポジトリは、膠芽腫セグメンテーションのための合成T1c脳MRIスキャン生成に関する修士論文に付随するものです…

#CLI #GPU必須 #Python

★ 1 2026-06-09

マルチモーダル

GitHub

mlx-mtp

mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…

#Apple Silicon対応 #CLI #Python

★ 1 Apache-2.0 2026-06-16

音声生成 / TTS

GitHub

speech-mcp

Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…

#CLI #GPU必須 #Python

★ 1 ⑂ 1 2026-06-17

マルチモーダル

GitHub

clip-from-scratch

このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-12

音楽生成

GitHub

synt-audio

Auratuneは、Lofi Girlのような没入型体験にインスパイアされた、Lo-fiスタイルのデジタルコンテンツ作成システムで…

#AI生成 #CLI #MIDI対応

★ 1 2026-04-21

画像生成

GitHub

TBAF

TBAF（Triangle Based Activation Function）は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…

#AI/ML #CLI #GPU必須

★ 1 MIT 2026-05-25

音声生成 / TTS

GitHub

ai-google-voice-agent

「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…

#AI #Groq AI #Python

★ 1 2026-05-26

画像生成

GitHub

Pic2Pic

EGFanTuan/Pic2Picは、Stable DiffusionとControlNetを基盤とした対話型の「草図から画像」生成ツールです。手書きの…

#ControlNet #GPU推奨 #Python

★ 1 2026-06-11

画像生成

GitHub

neural-flow-surrogates

「neural-flow-surrogates」は、多孔質媒体におけるCO₂/ブラインの二相流シミュレーションを高速化するためのニュー…

#CLI #Julia #Python

★ 1 MIT 2026-05-26

動画生成

GitHub

NAVA-Text-to-Video

NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …

#GPU必須 #Image-to-Video #Python

★ 1 ⑂ 1 Apache-2.0 2026-06-05

ASR / 音声認識

GitHub

AKIRA-AI-Voice-Assistant

AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…

#AIアシスタント #CLI #Python

★ 1 2026-06-08

動画生成

GitHub

automate_me

「automate_me」は、YouTube動画制作を完全に自動化するフルスタックのウェブアプリケーションです。単一のダッシュ…

#AI活用 #Node.js #Python

★ 1 MIT 2026-06-12

ASR / 音声認識

GitHub

voxtral-journal

このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…

#GPU必須 #Python #Web UI

★ 1 NOASSERTION 2026-05-14

LLM

GitHub

Enterprise-RAG-Intelligence

Enterprise RAG Intelligenceは、ゼロトラスト検索、RBAC強制、および根拠に基づいた生成を提供するセキュアなエンタ…

#Docker/Kubernetes #Python #RAG

★ 1 MIT 2026-05-31

ASR / 音声認識

GitHub

Elderly-Care-Companion

Elderly Care Companionは、AIを活用した高齢者向けのヘルスアシスタントです。主な機能として、音声による症状記録…

#AI #Gradio #Python

★ 1 2026-06-09

AIエージェント

GitHub

pi-context-pruner

pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…

#AI/LLM #CLI #Pi

★ 1 2026-05-30

音声生成 / TTS

GitHub

hermes-weixin-voice

hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…

#CLI #Python #WeChat連携

★ 1 MIT 2026-05-25