3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub echome
ECHOMEは、ユーザーの思考、音声、行動を高精度にクローンし自動化するオープンソースの個人AIミラーエンジンです。…
★ 1 MIT 2026-05-07
マルチモーダル GitHub clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
LLM GitHub argus-ai
Argusは、サプライチェーン、金融、ヘルスケアなどの高リスクな意思決定を支援する、多角的で説明可能、不確実性を考…
★ 1 Apache-2.0 2026-05-18
音楽生成 GitHub musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
ASR / 音声認識 GitHub AI-Vision-Assistant-for-Real-Time-Face-Recognition
このツールは、AIを活用したリアルタイム顔認識アシスタントです。ウェブカメラを通じて既知の人物を識別し、音声フ…
★ 1 2026-05-10
マルチモーダル GitHub vision-bridge
Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…
★ 1 NOASSERTION 2026-06-12
動画生成 GitHub Comic-drama
「Comic Drama Workflow」は、AIを活用してスクリプトからコミックドラマを制作するオープンソースのツールです。ス…
★ 1 MIT 2026-06-07
マルチモーダル GitHub gaze
このツールは、AIにPC画面の「目」を与えるPython製アプリケーションです。ローカルで動作し、スクリーンショット、…
★ 1 MIT 2026-06-20
マルチモーダル GitHub vision-bridge-skill
「vision-bridge-skill」は、多モーダル対応ではないAIモデルに対し、画像、PDF、スクリーンショット、図表などの視…
★ 1 2026-06-11
ASR / 音声認識 GitHub funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14
音楽生成 GitHub SunoCli
Suno CLIは、Suno AIの音楽生成機能をAceDataCloud API経由でコマンドラインから利用できるPython製ツールです。プロ…
★ 1 ⑂ 1 MIT 2026-06-26
ASR / 音声認識 GitHub carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
ComfyUI GitHub Comfy_Storyboard
「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…
★ 1 MIT 2026-04-13
3D / NeRF GitHub gaussian-splat-based-anomaly-detection
本ツールは、UAVで撮影した高層構造物(携帯電話基地局、風力タービン、電柱など)の画像を3D Gaussian Splatting (3…
★ 1 2026-05-17
画像生成 GitHub anime-sd-mcp
anime-sd-mcpは、MCP(Model Context Protocol)サーバーとして機能し、AIクライアント(Claude Desktop、Claude Cod…
★ 1 MIT 2026-05-30
画像生成 GitHub comfyui-amd-plug-and-play
miradorventus/comfyui-amd-plug-and-play は、AMD GPU(Ubuntu/Mint)上でComfyUIのセットアップと実行を大幅に簡素…
★ 1 2026-05-31
画像生成 GitHub raman-open-ml
このリポジトリは、ラマンスペクトル分析のための信頼性の高い再現可能な機械学習ツールキットです。分類、定量化に…
★ 1 AGPL-3.0 2026-06-02
AIエージェント GitHub yamtam-engine
YAMTAM ENGINEは、AIコーディングエージェントがリポジトリに損害を与えるのを防ぐための個人用エージェントOSです。…
★ 1 Apache-2.0 2026-06-25
3D / NeRF GitHub telemetry-frame-mapper
本ツールは、DJIドローンで撮影された動画をGPS情報付きの3Dガウシアンスプラットへ変換する完全なパイプラインを提…
★ 1 MIT 2026-06-26
ASR / 音声認識 GitHub Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
動画生成 GitHub seedance-2.0-api
Seedance 2.0 APIは、fal.aiを通じて提供されるByteDanceの最先端AI動画生成モデルです。テキスト、画像、または参照…
★ 1 ⑂ 2 MIT 2026-04-16
画像生成 GitHub EdgeDiffusion
EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…
★ 1 2026-06-07
3D / NeRF GitHub project_slam_gs3lam
GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM(…
★ 1 2026-04-04
ASR / 音声認識 GitHub language-violence-intervention-system
本プロジェクトは、プライバシーを重視したエッジAIによる言語暴力検出および能動的介入システムです。Raspberry Pi …
★ 1 ⑂ 1 Apache-2.0 2026-06-25