3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

画像生成

GitHub

comfyui-lighthouse

ComfyUI用のLighthouseは、ノード間の接続関係を視覚的に明確にする非破壊的なオーバーレイツールです。クリックした…

#ComfyUI対応 #Python #Web UI

★ 6 ⑂ 2 2026-06-07

動画生成

GitHub

Awesome-Gemini-Omni-API-Prompts

このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…

#API連携 #Gemini Omni #Python

★ 6 ⑂ 2 CC0-1.0 2026-06-15

ASR / 音声認識

GitHub

Clippos

Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…

#Claude Code対応 #CLI #Codex対応

★ 6 ⑂ 1 MIT 2026-04-26

AIエージェント

GitHub

Local-Model

このツールは、Kali Linux上でQwen 2.5-7Bモデル（LM Studio経由）を活用する、完全にローカルで自律的なサイバーセ…

#CLI #Kali Linux #LLM

★ 6 ⑂ 2 MIT 2026-06-17

画像生成

GitHub

spade

SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…

#CLI #GPU必須 #Python

★ 6 MIT 2026-06-09

音声生成 / TTS

GitHub

the-muser

The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…

#CLI #Docker対応 #GPU必須

★ 6 ⑂ 1 MIT 2026-05-27

ASR / 音声認識

GitHub

ai_interview

このツールは、リアルタイム音声対話、多段階面接、ライブ採点、詳細レポート生成機能を備えたAI駆動型模擬面接プラ…

#AI-powered #Docker #Python

★ 6 2026-06-15

音声生成 / TTS

GitHub

claude-code-audio-recap

このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…

#Claude Code Plugin #CLI #macOS

★ 6 Apache-2.0 2026-06-18

ComfyUI

GitHub

WavTTS-ComfyUI

WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…

#ComfyUI対応 #GPU必須 #Python

★ 6 ⑂ 1 MIT 2026-06-04

画像生成

GitHub

M2GenCO

M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…

#CLI #GPU必須 #Python

★ 6 2026-05-26

3D / NeRF

GitHub

StoryCore-Engine

StoryCore Engineは、スクリプトから一貫性のある画像、動画、ストーリー、対話、空間オーディオを生成する、ローカ…

#ComfyUI対応 #Python #React

★ 6 ⑂ 1 MIT 2026-06-23

音声生成 / TTS

GitHub

ScriptSmith-Engine

ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…

#AI活用 #CLI #FFmpeg

★ 6 ⑂ 1 MIT 2026-06-23

マルチモーダル

GitHub

multimodal-docs-public

M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…

#GPU必須 #Python #データセット

★ 5 2026-06-09

3D / NeRF

GitHub

Spatial-Intelligence-Handbook

この「Spatial Intelligence Handbook」は、SLAM、VIO、3D表現、センサー、デプロイメントの課題を、ロボットアーム…

#3DGS #AI #Handbook

★ 5 NOASSERTION 2026-06-14

AIエージェント

GitHub

fablize-for-hermes

fablize-for-hermesは、fablizeの検証済み手順をHermes Agentエコシステムに適合させたプロジェクトです。検証の根拠…

#CLI #Hermes Agent #Python

★ 5 MIT 2026-06-17

LLM

GitHub

tensor-serve

tensor-serveは、OpenAI互換AI向けのZIMベースの検索拡張プロキシです。KiwixのOPDSカタログからZIMドキュメントをダ…

#CLI #Kiwix対応 #OpenAI互換

★ 5 MIT 2026-05-11

マルチモーダル

GitHub

JoyCapture-UR5

JoyCapture-UR5は、Xboxコントローラーを使用してUR5ロボットを遠隔操作し、多モーダルなデモンストレーションデータ…

#CLI #Python #RealSenseカメラ対応

★ 5 MIT 2026-05-24

ASR / 音声認識

GitHub

wisprflow-sdk

WisprFlow SDKは、Wispr Flowデスクトップクライアントの非公式Python SDKです。Wispr Flowの音声APIをリバースエン…

#CLI #Python #SDK

★ 5 ⑂ 1 MIT 2026-06-09

音声生成 / TTS

GitHub

openvoice-cloning

OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…

#AI/ML #Python #多言語対応

★ 5 MIT 2026-06-13

動画生成

GitHub

seedance-superprompt

Seedance 2.0 Superpromptは、ByteDance Seedance 2.0の動画生成プロンプト作成を支援するポータブルなプロンプトス…

#Claude Code対応 #CLI不要 #LLM対応

★ 5 ⑂ 2 MIT 2026-05-23

ASR / 音声認識

GitHub

ANARCHY

ANARCHYは、クラウドやテレメトリーに依存しない、完全ローカルかつオフラインファーストのWindows向けAIアシスタン…

#CLI #Git連携 #Ollama

★ 5 MIT 2026-06-08

マルチモーダル

GitHub

Auto_Translator

Auto-Translatorは、複数のエージェントを活用したPDFコンテンツの自動翻訳ツールです。原文のフォーマットを完璧に…

#CLI #Docker #LLM利用

★ 5 ⑂ 1 2026-04-16

LLM

GitHub

OpenMetaMate

MetaMateは、LLM（大規模言語モデル）を活用し、PDFからのデータ抽出を効率化するAIアシストツールです。系統的レビ…

#Docker対応 #LLM対応 #Python

★ 5 NOASSERTION 2026-06-20

LLM

GitHub

Customer-Support-Chatbot-102

このツールは、RAG（Retrieval-Augmented Generation）、高度なプロンプトエンジニアリング、ハイブリッド検索、リラ…

#Docker #FastAPI #OpenAI

★ 5 MIT 2026-06-04