3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
マルチモーダル
GitHub
blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
3D / NeRF
GitHub
gaussian-splatter
「Gaussian Splatter / Particle Generator」は、ブラウザベースのThree.jsとGPGPUを活用したパーティクルビューアお…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
マルチモーダル
GitHub
ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
画像生成
GitHub
sonauto-ai-music-gen-saas
Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…
★ 1 Apache-2.0 2026-05-14
音声生成 / TTS
GitHub
ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26
画像生成
GitHub
image_generations
「Partial Image」は、OpenAI GPT-image-2のストリーミング部分画像APIのデバッグとデモンストレーションを目的とし…
★ 1 MIT 2026-06-05
音楽生成
GitHub
suede-sdk-python
Suede AIのx402サーフェス向けPython SDKです。APIキーやサブスクリプションが不要で、Base上のUSDCで決済される17種…
★ 1 MIT 2026-06-17
ASR / 音声認識
GitHub
ae-auto-subtitles
AED Subtitlesは、Adobe After Effects向けにDescriptスタイルのローカルWhisperキャプションを提供するツールです。…
★ 1 2026-06-15
LLM
GitHub
transformer-roofline-analyzer
Transformer Roofline Analyzerは、Hugging FaceのTransformerモデル設定ファイルから、計算量(FLOPs)、メモリ帯域…
★ 1 MIT 2026-05-30
動画生成
GitHub
web
x402-video.comは、x402決済プロトコルとBase上のUSDCを利用して、AIビデオを生成できるWebストアフロントです。アカ…
★ 1 2026-06-24
マルチモーダル
GitHub
residuos_yolov11m_gemma3
このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…
★ 1 2026-06-13
音声生成 / TTS
GitHub
voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-17
音楽生成
GitHub
CodeBeats
「CodeBeats」は、ソースコードを音楽へと変換する革新的なツールです。独自の解析エンジンが関数のメロディ、ループ…
★ 1 MIT 2026-04-16
マルチモーダル
GitHub
multimodal-clinical-ai
このマルチモーダル臨床AIプロジェクトは、胸部X線画像と臨床ノートを統合し、ViT、BioBERT、時系列エンコーダ、クロ…
★ 1 NOASSERTION 2026-05-20
画像生成
GitHub
ComfyUI_SparkVSR_SM
ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…
★ 1 Apache-2.0 2026-07-01
LLM
GitHub
yuri-os
Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー(DAG)を設計し、…
★ 1 2026-06-04
動画生成
GitHub
HappyHorse-1.0
Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…
★ 1 2026-04-11
音声生成 / TTS
GitHub
f5-tts-hotkey
このツールは、任意のアプリケーションで選択したテキストを、Alt+Xのホットキー操作でF5-TTSによる音声合成で読み上…
★ 1 2026-06-02
マルチモーダル
GitHub
MultiModal-from-scratch
このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル(VLM)をゼロから構築するための詳細なステップ…
★ 1 2026-06-06
3D / NeRF
GitHub
comfyui-splat-loader
Splat Loaderは、人気のある画像生成UIであるComfyUI用のカスタムノードです。このツールは、Gaussian Splatting形式…
★ 1 ⑂ 1 MIT 2026-06-11
画像生成
GitHub
reel-forge
reel-forgeは、AIを活用したInstagram Reels動画生成ツールです。人物の静止画と参照となるダンスリール動画を入力す…
★ 1 ⑂ 5 MIT 2026-05-19
画像生成
GitHub
image-to-prompt
このツールは、AIを活用したデスクトップアプリケーションで、画像からAI画像生成のための構造化されたプロンプトを…
★ 1 MIT 2026-06-15