3,627 repos GH 3,512 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2212 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
マルチモーダル GitHub DeepNumberVision
DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…
★ 1 2026-05-30
マルチモーダル GitHub mlx-mtp
mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…
★ 1 Apache-2.0 2026-06-16
マルチモーダル GitHub blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
音声生成 / TTS GitHub echome
ECHOMEは、ユーザーの思考、音声、行動を高精度にクローンし自動化するオープンソースの個人AIミラーエンジンです。…
★ 1 MIT 2026-05-07
マルチモーダル GitHub clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
LLM GitHub argus-ai
Argusは、サプライチェーン、金融、ヘルスケアなどの高リスクな意思決定を支援する、多角的で説明可能、不確実性を考…
★ 1 Apache-2.0 2026-05-18
音楽生成 GitHub musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
3D / NeRF GitHub yolov5-orbslam3-dynamic-scene
このプロジェクトは、YOLOv5とORB-SLAM3を組み合わせることで、高動的な交通シーンにおける視覚SLAM(Simultaneous L…
★ 1 2026-03-01
マルチモーダル GitHub esp32-cam-with-gemma
ESP32-CAMオフラインAIビジョンアシスタントは、IoT、コンピュータビジョン、ローカル大規模言語モデルを組み合わせ…
★ 1 MIT 2026-05-31
画像生成 GitHub Pic2Pic
EGFanTuan/Pic2Picは、Stable DiffusionとControlNetを基盤とした対話型の「草図から画像」生成ツールです。手書きの…
★ 1 2026-06-11
音声生成 / TTS GitHub PromptWave
PromptWaveは、テキストベースのAIプロンプトからオーディオを生成するPythonベースのシステムです。プロンプトエン…
★ 1 2025-11-29
音楽生成 GitHub code-music
「code-music」はPythonを使ってプログラムで音楽を生成するためのライブラリおよびツールセットです。単一のスケー…
★ 1 MIT 2026-05-07
動画生成 GitHub web
x402-video.comは、x402決済プロトコルとBase上のUSDCを利用して、AIビデオを生成できるWebストアフロントです。アカ…
★ 1 2026-06-24
動画生成 GitHub nano-xDiT
Nano-xDiTは、シングルGPU向けに最適化された軽量なWanビデオDiT推論エンジンです。TeaCacheやFirst-Block-Cacheとい…
★ 1 Apache-2.0 2026-06-14
画像生成 GitHub image-to-prompt
このツールは、AIを活用したデスクトップアプリケーションで、画像からAI画像生成のための構造化されたプロンプトを…
★ 1 MIT 2026-06-15
ASR / 音声認識 GitHub carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
ComfyUI GitHub Comfy_Storyboard
「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…
★ 1 MIT 2026-04-13
3D / NeRF GitHub gaussian-splat-based-anomaly-detection
本ツールは、UAVで撮影した高層構造物(携帯電話基地局、風力タービン、電柱など)の画像を3D Gaussian Splatting (3…
★ 1 2026-05-17
ComfyUI GitHub ComfyUI-ZMongo
ComfyUI-ZMongoは、ComfyUIのワークフローデータをZMongo形式で保存、読み込み、閲覧、マスク、再利用するためのカス…
★ 1 ⑂ 1 Apache-2.0 2026-06-20
マルチモーダル GitHub ReceiptIQ
このツールは、レシートの画像から支出データを自動的に抽出し、その内容について自然言語で質問できる領収書解析AI…
★ 1 2026-06-03
AIエージェント GitHub antigravity-ralph
antigravity-ralphは、Google AntigravityのヘッドレスCLI `agy` を活用し、Gitリポジトリの継続的な自己改善を目的…
★ 1 MIT 2026-06-04
動画生成 GitHub yt-automation
このツールは、YouTube Shortsのコンテンツ作成からアップロードまでを完全に自動化します。Groq LLMを用いて動画ス…
★ 1 ⑂ 1 2026-06-22
ComfyUI GitHub saya-comfy-couple-plus
「Saya Comfy Couple+」は、ComfyUIの既存のComfy Coupleノードを改良したものです。主に、2人以上のキャラクターが…
★ 1 2026-06-11