3,627 repos GH 3,512 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2212 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
マルチモーダル
GitHub
DeepNumberVision
DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…
★ 1 2026-05-30
マルチモーダル
GitHub
mlx-mtp
mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…
★ 1 Apache-2.0 2026-06-16
マルチモーダル
GitHub
blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
音声生成 / TTS
GitHub
echome
ECHOMEは、ユーザーの思考、音声、行動を高精度にクローンし自動化するオープンソースの個人AIミラーエンジンです。…
★ 1 MIT 2026-05-07
マルチモーダル
GitHub
clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
LLM
GitHub
argus-ai
Argusは、サプライチェーン、金融、ヘルスケアなどの高リスクな意思決定を支援する、多角的で説明可能、不確実性を考…
★ 1 Apache-2.0 2026-05-18
音楽生成
GitHub
musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
3D / NeRF
GitHub
yolov5-orbslam3-dynamic-scene
このプロジェクトは、YOLOv5とORB-SLAM3を組み合わせることで、高動的な交通シーンにおける視覚SLAM(Simultaneous L…
★ 1 2026-03-01
マルチモーダル
GitHub
esp32-cam-with-gemma
ESP32-CAMオフラインAIビジョンアシスタントは、IoT、コンピュータビジョン、ローカル大規模言語モデルを組み合わせ…
★ 1 MIT 2026-05-31
画像生成
GitHub
Pic2Pic
EGFanTuan/Pic2Picは、Stable DiffusionとControlNetを基盤とした対話型の「草図から画像」生成ツールです。手書きの…
★ 1 2026-06-11
音声生成 / TTS
GitHub
PromptWave
PromptWaveは、テキストベースのAIプロンプトからオーディオを生成するPythonベースのシステムです。プロンプトエン…
★ 1 2025-11-29
音楽生成
GitHub
code-music
「code-music」はPythonを使ってプログラムで音楽を生成するためのライブラリおよびツールセットです。単一のスケー…
★ 1 MIT 2026-05-07
動画生成
GitHub
web
x402-video.comは、x402決済プロトコルとBase上のUSDCを利用して、AIビデオを生成できるWebストアフロントです。アカ…
★ 1 2026-06-24
動画生成
GitHub
nano-xDiT
Nano-xDiTは、シングルGPU向けに最適化された軽量なWanビデオDiT推論エンジンです。TeaCacheやFirst-Block-Cacheとい…
★ 1 Apache-2.0 2026-06-14
画像生成
GitHub
image-to-prompt
このツールは、AIを活用したデスクトップアプリケーションで、画像からAI画像生成のための構造化されたプロンプトを…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
ComfyUI
GitHub
Comfy_Storyboard
「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…
★ 1 MIT 2026-04-13
3D / NeRF
GitHub
gaussian-splat-based-anomaly-detection
本ツールは、UAVで撮影した高層構造物(携帯電話基地局、風力タービン、電柱など)の画像を3D Gaussian Splatting (3…
★ 1 2026-05-17
ComfyUI
GitHub
ComfyUI-ZMongo
ComfyUI-ZMongoは、ComfyUIのワークフローデータをZMongo形式で保存、読み込み、閲覧、マスク、再利用するためのカス…
★ 1 ⑂ 1 Apache-2.0 2026-06-20
マルチモーダル
GitHub
ReceiptIQ
このツールは、レシートの画像から支出データを自動的に抽出し、その内容について自然言語で質問できる領収書解析AI…
★ 1 2026-06-03
AIエージェント
GitHub
antigravity-ralph
antigravity-ralphは、Google AntigravityのヘッドレスCLI `agy` を活用し、Gitリポジトリの継続的な自己改善を目的…
★ 1 MIT 2026-06-04
動画生成
GitHub
yt-automation
このツールは、YouTube Shortsのコンテンツ作成からアップロードまでを完全に自動化します。Groq LLMを用いて動画ス…
★ 1 ⑂ 1 2026-06-22
ComfyUI
GitHub
saya-comfy-couple-plus
「Saya Comfy Couple+」は、ComfyUIの既存のComfy Coupleノードを改良したものです。主に、2人以上のキャラクターが…
★ 1 2026-06-11