3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

echome

ECHOMEは、ユーザーの思考、音声、行動を高精度にクローンし自動化するオープンソースの個人AIミラーエンジンです。…

#CLI #Docker #GPU必須

★ 1 MIT 2026-05-07

マルチモーダル

GitHub

clip-from-scratch

このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-12

LLM

GitHub

argus-ai

Argusは、サプライチェーン、金融、ヘルスケアなどの高リスクな意思決定を支援する、多角的で説明可能、不確実性を考…

#FastAPI #Python #Web UI

★ 1 Apache-2.0 2026-05-18

音楽生成

GitHub

musicgen-api

「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…

#AI音楽生成 #Docker #GPU対応

★ 1 ⑂ 1 MIT 2026-06-04

ASR / 音声認識

GitHub

AI-Vision-Assistant-for-Real-Time-Face-Recognition

このツールは、AIを活用したリアルタイム顔認識アシスタントです。ウェブカメラを通じて既知の人物を識別し、音声フ…

#CLI #Python #Webcam対応

★ 1 2026-05-10

マルチモーダル

GitHub

vision-bridge

Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…

#CLI #GPU/CPU対応 #LLM連携

★ 1 NOASSERTION 2026-06-12

動画生成

GitHub

Comic-drama

「Comic Drama Workflow」は、AIを活用してスクリプトからコミックドラマを制作するオープンソースのツールです。ス…

#CLI #ComfyUI対応 #FastAPI

★ 1 MIT 2026-06-07

マルチモーダル

GitHub

gaze

このツールは、AIにPC画面の「目」を与えるPython製アプリケーションです。ローカルで動作し、スクリーンショット、…

#AIプラットフォーム非依存 #CLI #OCR

★ 1 MIT 2026-06-20

マルチモーダル

GitHub

vision-bridge-skill

「vision-bridge-skill」は、多モーダル対応ではないAIモデルに対し、画像、PDF、スクリーンショット、図表などの視…

#AI-to-AI通信 #CLI #OCR

★ 1 2026-06-11

ASR / 音声認識

GitHub

funasr-whisper-api

このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…

#CLI #GPU必須 #OpenAI Whisper API互換

★ 1 MIT 2026-06-14

音楽生成

GitHub

SunoCli

Suno CLIは、Suno AIの音楽生成機能をAceDataCloud API経由でコマンドラインから利用できるPython製ツールです。プロ…

#AI音楽生成 #API連携 #CLI

★ 1 ⑂ 1 MIT 2026-06-26

ASR / 音声認識

GitHub

carefulWhisper

carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識（Speech-to-Text）バッ…

#API #CLI #FastAPI

★ 1 2026-05-24

ComfyUI

GitHub

Comfy_Storyboard

「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…

#ComfyUI対応 #Python #Web UI

★ 1 MIT 2026-04-13

3D / NeRF

GitHub

gaussian-splat-based-anomaly-detection

本ツールは、UAVで撮影した高層構造物（携帯電話基地局、風力タービン、電柱など）の画像を3D Gaussian Splatting (3…

#CLI #GPU必須 #Python

★ 1 2026-05-17

画像生成

GitHub

anime-sd-mcp

anime-sd-mcpは、MCP（Model Context Protocol）サーバーとして機能し、AIクライアント（Claude Desktop、Claude Cod…

#AIクライアント対応 #CLI #GPU必須

★ 1 MIT 2026-05-30

画像生成

GitHub

comfyui-amd-plug-and-play

miradorventus/comfyui-amd-plug-and-play は、AMD GPU（Ubuntu/Mint）上でComfyUIのセットアップと実行を大幅に簡素…

#AMD ROCm #CLI #ComfyUI対応

★ 1 2026-05-31

画像生成

GitHub

raman-open-ml

このリポジトリは、ラマンスペクトル分析のための信頼性の高い再現可能な機械学習ツールキットです。分類、定量化に…

#CLI #Python #データサイエンス

★ 1 AGPL-3.0 2026-06-02

AIエージェント

GitHub

yamtam-engine

YAMTAM ENGINEは、AIコーディングエージェントがリポジトリに損害を与えるのを防ぐための個人用エージェントOSです。…

#AIエージェント統合 #CLI #Python

★ 1 Apache-2.0 2026-06-25

3D / NeRF

GitHub

telemetry-frame-mapper

本ツールは、DJIドローンで撮影された動画をGPS情報付きの3Dガウシアンスプラットへ変換する完全なパイプラインを提…

#CLI #FastAPI #Python

★ 1 MIT 2026-06-26

ASR / 音声認識

GitHub

Jarvis

Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…

#AI / 機械学習 #CLI #OpenCV

★ 1 2026-06-17

動画生成

GitHub

seedance-2.0-api

Seedance 2.0 APIは、fal.aiを通じて提供されるByteDanceの最先端AI動画生成モデルです。テキスト、画像、または参照…

#AI #API #fal.ai

★ 1 ⑂ 2 MIT 2026-04-16

画像生成

GitHub

EdgeDiffusion

EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…

#CLI #GPU必須 #Python

★ 1 2026-06-07

3D / NeRF

GitHub

project_slam_gs3lam

GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM（…

#CLI #GPU必須 #Python

★ 1 2026-04-04

ASR / 音声認識

GitHub

language-violence-intervention-system

本プロジェクトは、プライバシーを重視したエッジAIによる言語暴力検出および能動的介入システムです。Raspberry Pi …

#Python #Raspberry Pi対応 #Web UI

★ 1 ⑂ 1 Apache-2.0 2026-06-25