3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

動画生成

GitHub

HappyHorse-1.0

Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…

#AIビデオ生成 #GPU必須 #Python

★ 1 2026-04-11

LLM

GitHub

opencode-research-mcp

このツールは、学術研究プロセスを効率化するために設計された軽量な研究用MCP（Modular Cognitive Processor）サー…

#API連携 #CLI #LLM連携

★ 1 MIT 2026-06-02

マルチモーダル

GitHub

Tri-Sentinel-XAI

Tri-Sentinel XAIは、フィッシングURL、スパムテキスト、AI生成ディープフェイク画像を検出するマルチモーダルな説明…

#CPU対応 #Python #Streamlit

★ 1 MIT 2026-06-13

音楽生成

GitHub

suede-sdk-python

Suede AIのx402サーフェス向けPython SDKです。APIキーやサブスクリプションが不要で、Base上のUSDCで決済される17種…

#AI #Python #SDK

★ 1 MIT 2026-06-17

マルチモーダル

GitHub

ai-chef-multimodal-assistant

AI Chefは、自宅にある食材からレシピを生成するAI搭載のマルチモーダル料理アシスタントです。テキスト入力または食…

#CLI #OpenAI API #Python

★ 1 2026-06-09

動画生成

GitHub

multimodal-ai-content-pipeline

このツールは、単一のテキストプロンプトから、ポスター画像、ビデオクリップ、ナレーションを含むプロモーションコ…

#AI #Azure #CLI

★ 1 MIT 2026-06-10

画像生成

GitHub

badhands_scorer

「Bad Hands Scorer」は、拡散モデルが生成する「奇妙な手」の画像を識別し、美的スコアを付与するための軽量な概念…

#Aesthetic Scoring #CLI #ComfyUI対応

★ 1 2026-06-03

ASR / 音声認識

GitHub

Voice-RAG-Assistant

このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…

#AIアシスタント #CLI #LLM連携

★ 1 2026-06-18

ComfyUI

GitHub

comfyui_maya1_tts_alun

Maya1モデルを利用して、ComfyUI上で高品質な英語音声を生成できるカスタムTTSノードです。5種類の音声プリセットに…

#ComfyUI対応 #GPU推奨 #Python

★ 1 ⑂ 1 MIT 2025-11-11

ASR / 音声認識

GitHub

voxtral-journal

このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…

#GPU必須 #Python #Web UI

★ 1 NOASSERTION 2026-05-14

LLM

GitHub

local-ai-research-assistant

このツールは、OllamaなどのローカルLLM、ウェブ検索、コンテンツ抽出、および構造化レポート生成を活用した自律的な…

#Ollama #PDF出力 #Python

★ 1 MIT 2026-05-14

3D / NeRF

GitHub

mobile-gs-scan

Pebbleは、高価な3Dスキャンサービスに代わる、NVIDIA製GPUユーザー向けのセルフホスト型3Dスキャンスタジオです。We…

#3Dスキャン #Android対応 #Docker

★ 1 2026-05-15

ASR / 音声認識

GitHub

AdversialQA

本ツールは、AIを活用した模擬試験シミュレーターであり、論文のPDFや履歴書をアップロードすることで、AIが厳しい質…

#FastAPI #Google Gemini API #Python

★ 1 2026-05-19

マルチモーダル

GitHub

multimodal-clinical-ai

このマルチモーダル臨床AIプロジェクトは、胸部X線画像と臨床ノートを統合し、ViT、BioBERT、時系列エンコーダ、クロ…

#CLI #Docker #GPU必須

★ 1 NOASSERTION 2026-05-20

ASR / 音声認識

GitHub

voxi

Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…

#AIアシスタント連携 (MCP) #CLI #Python

★ 1 MIT 2026-05-25

音楽生成

GitHub

musicgen-api

「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…

#AI音楽生成 #Docker #GPU対応

★ 1 ⑂ 1 MIT 2026-06-04

ASR / 音声認識

GitHub

zox-ai

Zox AIは、OllamaとLlama 3.1 8Bモデルを基盤とした、完全にオフラインで動作するWindows向けのAIデスクトップアシス…

#GUI #LLM #Python

★ 1 NOASSERTION 2026-06-10

3D / NeRF

GitHub

3DGS-Runpod

3DGS-Runpodは、RunPod GPUインフラストラクチャを活用し、画像セットから3D Gaussian Splatting（.ply形式）を生成…

#3D Gaussian Splatting #API #CLI

★ 1 Apache-2.0 2026-03-11

ASR / 音声認識

GitHub

VoiceBlogger

VoiceBloggerは、音声録音を洗練されたブログ記事やInstagramのキャプションに変換するツールです。全てオフラインで…

#Apple Silicon対応 #CLI #iOSアプリ

★ 1 Apache-2.0 2026-06-24

マルチモーダル

GitHub

MultiModal-from-scratch

このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル（VLM）をゼロから構築するための詳細なステップ…

#CLI #GPU必須 #Python

★ 1 2026-06-06

ComfyUI

GitHub

comfyui-navigator

comfyui-navigatorは、ComfyUIのワークフロー内のグループを一覧表示するフローティングパネルです。大規模なワーク…

#ComfyUI対応 #Python #rgthree-comfy対応

★ 1 ⑂ 1 MIT 2026-06-05

3D / NeRF

GitHub

MultiBEST—Multiscale-Multiphase-Bridging-Experiment-and-Simulation-Toolkit

MultiBESTは、実験で得られた2D顕微鏡写真、2D/3D EBSDデータ、またはユーザーのスケッチから、原子レベルおよび連続…

#CLI #Python #Web UI

★ 1 GPL-3.0 2026-06-09

音声生成 / TTS

GitHub

logica-voice

Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…

#AI/ML #CLI #Python

★ 1 ⑂ 1 MIT 2026-06-04

LLM

GitHub

agentguard

AgentGuardは、RAGやエージェントAIアプリケーション向けの自己ホスト型AI信頼性プラットフォームです。AIアプリケー…

#CLI #Python #RAG対応

★ 1 Apache-2.0 2026-06-18