3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

Voice-RAG-Assistant

このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…

#AIアシスタント #CLI #LLM連携

★ 1 2026-06-18

マルチモーダル

GitHub

blind-vision-mcp

blind-vision-mcpは、テキストベースのLLM（大規模言語モデル）に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…

#CLI #GPU必須 #Python

★ 1 MIT 2026-06-15

3D / NeRF

GitHub

gaussian-splatter

「Gaussian Splatter / Particle Generator」は、ブラウザベースのThree.jsとGPGPUを活用したパーティクルビューアお…

#CLI #GPGPU #macOS

★ 1 MIT 2026-06-15

ASR / 音声認識

GitHub

carefulWhisper

carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識（Speech-to-Text）バッ…

#API #CLI #FastAPI

★ 1 2026-05-24

マルチモーダル

GitHub

ENOSES

「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…

#IoT #Multimodal AI #Python

★ 1 MIT 2026-05-17

画像生成

GitHub

sonauto-ai-music-gen-saas

Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…

#AI生成 #GPU必須 #Next.js

★ 1 Apache-2.0 2026-05-14

音声生成 / TTS

GitHub

ai-google-voice-agent

「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…

#AI #Groq AI #Python

★ 1 2026-05-26

画像生成

GitHub

image_generations

「Partial Image」は、OpenAI GPT-image-2のストリーミング部分画像APIのデバッグとデモンストレーションを目的とし…

#OpenAI API #Python #Web UI

★ 1 MIT 2026-06-05

音楽生成

GitHub

suede-sdk-python

Suede AIのx402サーフェス向けPython SDKです。APIキーやサブスクリプションが不要で、Base上のUSDCで決済される17種…

#AI #Python #SDK

★ 1 MIT 2026-06-17

ASR / 音声認識

GitHub

ae-auto-subtitles

AED Subtitlesは、Adobe After Effects向けにDescriptスタイルのローカルWhisperキャプションを提供するツールです。…

#Adobe After Effects対応 #macOS対応 #Python

★ 1 2026-06-15

LLM

GitHub

transformer-roofline-analyzer

Transformer Roofline Analyzerは、Hugging FaceのTransformerモデル設定ファイルから、計算量（FLOPs）、メモリ帯域…

#CLI #Hugging Face #Python

★ 1 MIT 2026-05-30

動画生成

GitHub

web

x402-video.comは、x402決済プロトコルとBase上のUSDCを利用して、AIビデオを生成できるWebストアフロントです。アカ…

#Blockchain #CLI #Python

★ 1 2026-06-24

マルチモーダル

GitHub

residuos_yolov11m_gemma3

このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…

#AI/ML #CLI #Gemma

★ 1 2026-06-13

音声生成 / TTS

GitHub

voxtral-fastapi

voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…

#CLI #GPU必須 #GUI

★ 1 2026-05-17

音楽生成

GitHub

CodeBeats

「CodeBeats」は、ソースコードを音楽へと変換する革新的なツールです。独自の解析エンジンが関数のメロディ、ループ…

#JavaScript #Python #React

★ 1 MIT 2026-04-16

マルチモーダル

GitHub

multimodal-clinical-ai

このマルチモーダル臨床AIプロジェクトは、胸部X線画像と臨床ノートを統合し、ViT、BioBERT、時系列エンコーダ、クロ…

#CLI #Docker #GPU必須

★ 1 NOASSERTION 2026-05-20

画像生成

GitHub

ComfyUI_SparkVSR_SM

ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…

#AI/機械学習 #ComfyUI対応 #GPU必須

★ 1 Apache-2.0 2026-07-01

LLM

GitHub

yuri-os

Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー（DAG）を設計し、…

#Generative AI #Python #Web UI

★ 1 2026-06-04

動画生成

GitHub

HappyHorse-1.0

Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…

#AIビデオ生成 #GPU必須 #Python

★ 1 2026-04-11

音声生成 / TTS

GitHub

f5-tts-hotkey

このツールは、任意のアプリケーションで選択したテキストを、Alt+Xのホットキー操作でF5-TTSによる音声合成で読み上…

#CLI #Python #Windows

★ 1 2026-06-02

マルチモーダル

GitHub

MultiModal-from-scratch

このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル（VLM）をゼロから構築するための詳細なステップ…

#CLI #GPU必須 #Python

★ 1 2026-06-06

3D / NeRF

GitHub

comfyui-splat-loader

Splat Loaderは、人気のある画像生成UIであるComfyUI用のカスタムノードです。このツールは、Gaussian Splatting形式…

#ComfyUI対応 #Gaussian Splat #GPU推奨

★ 1 ⑂ 1 MIT 2026-06-11

画像生成

GitHub

reel-forge

reel-forgeは、AIを活用したInstagram Reels動画生成ツールです。人物の静止画と参照となるダンスリール動画を入力す…

#AI #AWS #CLI

★ 1 ⑂ 5 MIT 2026-05-19

画像生成

GitHub

image-to-prompt

このツールは、AIを活用したデスクトップアプリケーションで、画像からAI画像生成のための構造化されたプロンプトを…

#GUI #OpenAI API互換 #Python

★ 1 MIT 2026-06-15