3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

動画生成

GitHub

happy-horse-api

Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…

#AI動画生成 #API #Node.js

★ 1 MIT 2026-05-25

LLM

GitHub

model-monitor

「模型 API 监控工具」は、OpenAI、DeepSeek、MiMoなど、複数のモデルAPIの利用状況をリアルタイムで監視・管理する…

#API Monitoring #CLI #FastAPI

★ 1 MIT 2026-06-25

ComfyUI

GitHub

ComfyUI-Voice

ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…

#ComfyUI対応 #GPU推奨 #Python

★ 1 Apache-2.0 2026-06-18

3D / NeRF

GitHub

sam-3d-spark

sam-3d-sparkは、MetaのSAM 3D（BodyおよびObjects）モデルをNVIDIA DGX Spark環境（aarch64/CUDA 13）でローカル実…

#ComfyUI対応 #Docker #FastAPI

★ 1 NOASSERTION 2026-05-03

3D / NeRF

GitHub

classic_multiview_3d_recon

このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…

#3D再構成 #CLI #CUDA

★ 1 MIT 2026-05-10

動画生成

GitHub

ComfyUI-AceStep_SFT

ComfyUI-AceStep_SFTは、ComfyUI内でAceStep 1.5 SFTの音楽生成を可能にする単一ノードです。テキストプロンプトから…

#ComfyUI対応 #GPU推奨 #Python

★ 1 MIT 2026-07-01

ComfyUI

GitHub

comfy-moneta-bridge

comfy-moneta-bridgeは、Comfy-Cozyの自律型ComfyUIエージェントとMonetaのコグニティブ基盤を連携させ、ComfyUIの生…

#AIワークフロー #CLI #ComfyUI対応

★ 1 2026-05-27

ASR / 音声認識

GitHub

resilient-stt

Resilient STTは、OpenAI互換のASR（自動音声認識）エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…

#CLI #LLM連携 #OpenAI互換ASR

★ 1 ⑂ 1 GPL-3.0 2026-06-25

LLM

GitHub

contextcontrol

ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル（LLM）の利用、およびパッチワークフ…

#CLI #LLM #Ollama

★ 1 ⑂ 2 NOASSERTION 2026-05-31

マルチモーダル

GitHub

PrismRAG

PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…

#CLI #GPU必須 #Multimodal

★ 1 MIT 2026-06-20

音楽生成

GitHub

Conditional-Music-Generation

このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…

#Audio Analysis #CLI #MIDI

★ 1 MIT 2026-05-12

AIエージェント

GitHub

orchestrate-skill

「orchestrate」は、Claude Code向けの脳と身体のオーケストレーションスキルです。Claudeを主要な推論者（脳）とし…

#AI / LLM #Claude Code #CLI

★ 1 MIT 2026-06-13

音声生成 / TTS

GitHub

meloie

Meloieは、リアルタイムで動作するRVC（Retrieval-based Voice Conversion）ボイスチェンジャーのバージョン2です。…

#CLI #GPU必須 #GUI

★ 1 MIT 2026-06-15

ASR / 音声認識

GitHub

VoxCore

VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR（自動音声認識）、LLM（…

#Docker #FastAPI #OpenAI互換

★ 1 ⑂ 1 Apache-2.0 2026-05-28

3D / NeRF

GitHub

gaussian-splat-based-anomaly-detection

本ツールは、UAVで撮影した高層構造物（携帯電話基地局、風力タービン、電柱など）の画像を3D Gaussian Splatting (3…

#CLI #GPU必須 #Python

★ 1 2026-05-17

動画生成

GitHub

awesome-ai-media

JuneYaooo/awesome-ai-mediaは、AIを活用した動画作成、ソーシャルメディア自動化、コンテンツ作成ツールを150以上厳…

#AI #Python #Web UI

★ 1 ⑂ 3 2026-06-23

マルチモーダル

GitHub

zero-shot-video-classifier

このツールは、ビジョン言語基盤モデル（CLIP、SigLIP 2、X-CLIP）を用いたゼロショット動画分類器です。タスク固有…

#Docker #HuggingFace Transformers #Python

★ 1 2026-06-09

LLM

GitHub

ChatPDF

このプロジェクトは、Streamlitで構築された軽量かつ強力なRAG（検索拡張生成）ベースのPDFチャットアプリケーション…

#Python #RAG #Web UI

★ 1 MIT 2026-05-20

AIエージェント

GitHub

pi-context-pruner

pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…

#AI/LLM #CLI #Pi

★ 1 2026-06-24

LLM

GitHub

tesm

TESM（Token-Entangled State Machine）は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革…

#CLI #CUDA #GPU必須

★ 1 MIT 2026-06-08

ASR / 音声認識

GitHub

tiktok-extractor

このツールは、TikTokのURLから動画のメタデータ、完全な文字起こし、シーンのキーフレーム、画面上のOCRテキストを…

#AIアシスタント対応 #CLI #OCR

★ 1 MIT 2026-05-24

ASR / 音声認識

GitHub

VoiceAgentAI

このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識（STT）と音声合成（TTS）をシー…

#CLI #OpenAI API連携 #Python

★ 1 MIT 2026-05-25

マルチモーダル

GitHub

vision-bridge

Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…

#CLI #GPU/CPU対応 #LLM連携

★ 1 NOASSERTION 2026-06-12

LLM

GitHub

seas

SEASとArgoは、AIの最前線で働くための補完的なシステムです。SEASはフロンティアのシグナルから「何が真実か」を探…

#AI Research Engine #CLI #Decision Engine

★ 1 NOASSERTION 2026-06-26