3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
HappyHorse-1.0
Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…
★ 1 2026-04-11
LLM
GitHub
opencode-research-mcp
このツールは、学術研究プロセスを効率化するために設計された軽量な研究用MCP(Modular Cognitive Processor)サー…
★ 1 MIT 2026-06-02
マルチモーダル
GitHub
Tri-Sentinel-XAI
Tri-Sentinel XAIは、フィッシングURL、スパムテキスト、AI生成ディープフェイク画像を検出するマルチモーダルな説明…
★ 1 MIT 2026-06-13
音楽生成
GitHub
suede-sdk-python
Suede AIのx402サーフェス向けPython SDKです。APIキーやサブスクリプションが不要で、Base上のUSDCで決済される17種…
★ 1 MIT 2026-06-17
マルチモーダル
GitHub
ai-chef-multimodal-assistant
AI Chefは、自宅にある食材からレシピを生成するAI搭載のマルチモーダル料理アシスタントです。テキスト入力または食…
★ 1 2026-06-09
動画生成
GitHub
multimodal-ai-content-pipeline
このツールは、単一のテキストプロンプトから、ポスター画像、ビデオクリップ、ナレーションを含むプロモーションコ…
★ 1 MIT 2026-06-10
画像生成
GitHub
badhands_scorer
「Bad Hands Scorer」は、拡散モデルが生成する「奇妙な手」の画像を識別し、美的スコアを付与するための軽量な概念…
★ 1 2026-06-03
ASR / 音声認識
GitHub
Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
ComfyUI
GitHub
comfyui_maya1_tts_alun
Maya1モデルを利用して、ComfyUI上で高品質な英語音声を生成できるカスタムTTSノードです。5種類の音声プリセットに…
★ 1 ⑂ 1 MIT 2025-11-11
ASR / 音声認識
GitHub
voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14
LLM
GitHub
local-ai-research-assistant
このツールは、OllamaなどのローカルLLM、ウェブ検索、コンテンツ抽出、および構造化レポート生成を活用した自律的な…
★ 1 MIT 2026-05-14
3D / NeRF
GitHub
mobile-gs-scan
Pebbleは、高価な3Dスキャンサービスに代わる、NVIDIA製GPUユーザー向けのセルフホスト型3Dスキャンスタジオです。We…
★ 1 2026-05-15
ASR / 音声認識
GitHub
AdversialQA
本ツールは、AIを活用した模擬試験シミュレーターであり、論文のPDFや履歴書をアップロードすることで、AIが厳しい質…
★ 1 2026-05-19
マルチモーダル
GitHub
multimodal-clinical-ai
このマルチモーダル臨床AIプロジェクトは、胸部X線画像と臨床ノートを統合し、ViT、BioBERT、時系列エンコーダ、クロ…
★ 1 NOASSERTION 2026-05-20
ASR / 音声認識
GitHub
voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-25
音楽生成
GitHub
musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
ASR / 音声認識
GitHub
zox-ai
Zox AIは、OllamaとLlama 3.1 8Bモデルを基盤とした、完全にオフラインで動作するWindows向けのAIデスクトップアシス…
★ 1 NOASSERTION 2026-06-10
3D / NeRF
GitHub
3DGS-Runpod
3DGS-Runpodは、RunPod GPUインフラストラクチャを活用し、画像セットから3D Gaussian Splatting(.ply形式)を生成…
★ 1 Apache-2.0 2026-03-11
ASR / 音声認識
GitHub
VoiceBlogger
VoiceBloggerは、音声録音を洗練されたブログ記事やInstagramのキャプションに変換するツールです。全てオフラインで…
★ 1 Apache-2.0 2026-06-24
マルチモーダル
GitHub
MultiModal-from-scratch
このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル(VLM)をゼロから構築するための詳細なステップ…
★ 1 2026-06-06
ComfyUI
GitHub
comfyui-navigator
comfyui-navigatorは、ComfyUIのワークフロー内のグループを一覧表示するフローティングパネルです。大規模なワーク…
★ 1 ⑂ 1 MIT 2026-06-05
3D / NeRF
GitHub
MultiBEST—Multiscale-Multiphase-Bridging-Experiment-and-Simulation-Toolkit
MultiBESTは、実験で得られた2D顕微鏡写真、2D/3D EBSDデータ、またはユーザーのスケッチから、原子レベルおよび連続…
★ 1 GPL-3.0 2026-06-09
音声生成 / TTS
GitHub
logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
LLM
GitHub
agentguard
AgentGuardは、RAGやエージェントAIアプリケーション向けの自己ホスト型AI信頼性プラットフォームです。AIアプリケー…
★ 1 Apache-2.0 2026-06-18