3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
SubForge
SubForgeは、AIを駆使した高機能な動画字幕ツールです。音声のテキスト化、意味に基づいたスマートな断句、誤字修正…
★ 8 GPL-3.0 2026-06-18
ASR / 音声認識
GitHub
Seam-LocalFirstMinutes
Seamは、会議の録音・文字起こし・要約をローカル環境中心で完結させるmacOS向けアプリです。マイク録音とシステム音…
★ 8 Apache-2.0 2026-07-01
動画生成
GitHub
bony-agent
「Bony Agent」は「AI Media Agent」として、AIを活用したフルスタックのコンテンツ制作・配信プラットフォームです…
★ 8 ⑂ 1 2026-06-17
音声生成 / TTS
GitHub
Kokoro-82M-ONNX-German-Martin
本リポジトリは、ドイツ語のKokoro音声モデル「Martin」を用いたテキスト読み上げ(TTS)システムのDockerおよびHome…
★ 7 ⑂ 1 2026-05-22
ASR / 音声認識
GitHub
Fast-Sub
Fast Subは、動画および音声ファイル用のローカルファーストの字幕ツールです。字幕の生成と翻訳を、ユーザーのデバ…
★ 7 MIT 2026-06-30
画像生成
GitHub
lora-block-weight-neo
このツールは、Stable Diffusion WebUI Forge - Neo向けの拡張機能であり、LoRAのブロックレベルでの重み付けを詳細…
★ 7 MIT 2026-05-22
ComfyUI
GitHub
ideogram4_prompter-ComfyUI
このComfyUIカスタムノードは、Ideogram 4のMagic Prompt APIを活用し、ユーザーが入力した簡単なプロンプトを、Ideo…
★ 7 ⑂ 1 MIT 2026-06-04
ASR / 音声認識
GitHub
tastebench
Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…
★ 7 ⑂ 1 MIT 2026-05-19
LLM
GitHub
a-agent
a-agentは、ターミナルベースのワークフロー向けに最適化された、単一ファイルのAIコーディングエージェントです。特…
★ 7 MIT 2026-05-19
3D / NeRF
GitHub
interactive-website-navigator
このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…
★ 7 MIT 2026-05-17
画像生成
GitHub
Ollama-UI
Local AIは、Ollamaを搭載した完全にオフラインでポータブルなAIワークスペースです。ユーザーは直感的なインターフ…
★ 7 ⑂ 2 MIT 2026-05-27
ASR / 音声認識
GitHub
voice-input
本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。ショート…
★ 7 MIT 2026-06-15
ASR / 音声認識
GitHub
meet-transcription
このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…
★ 7 MIT 2026-06-22
ASR / 音声認識
GitHub
MavKa
MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…
★ 7 ⑂ 1 MIT 2026-05-10
画像生成
GitHub
sd-faceswap
このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…
★ 7 MIT 2026-05-19
画像生成
GitHub
comfyui-lance-aio
ComfyUI Lance AIOは、ByteDance Lance-3BモデルをComfyUIで実行するためのカスタムノードを提供するリポジトリです…
★ 7 ⑂ 2 MIT 2026-06-08
音声生成 / TTS
GitHub
okay-hermes-voice
「Okay Hermes Voice」は、既存の「Hermes Agent」に「Okay Hermes」というウェイクフレーズを追加し、常に音声で操…
★ 7 NOASSERTION 2026-06-29
動画生成
GitHub
Awesome-Gemini-Omni-API-Prompts
このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…
★ 7 ⑂ 1 CC0-1.0 2026-07-01
音声生成 / TTS
GitHub
Local-TTS-studio
Open TTSは、サーバーやAPIキーなしでデバイス上で完結する、ローカルファーストのテキスト読み上げ(TTS)スタジオ…
★ 7 Apache-2.0 2026-06-23
LLM
GitHub
CRIMENET
CRIMENETは、世界中の犯罪組織間の同盟と敵対関係をマッピングしたオープンソースのデータベースおよびインタラクテ…
★ 7 MIT 2026-06-28
画像生成
GitHub
ltx2-vidgen-skill
この「ltx2-vidgen-skill」は、AIビデオ生成パイプラインを自社で所有・運用できるClaude Codeスキルです。写真一枚…
★ 7 ⑂ 1 NOASSERTION 2026-06-11
LLM
GitHub
RAG-Roadmap-with-Notes-and-Projects
このリポジトリは、Retrieval-Augmented Generation(RAG)の学習に特化した、基礎から本番環境でのエージェントRAG…
★ 7 MIT 2026-06-21
音声生成 / TTS
GitHub
book-v2-audio
このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…
★ 7 ⑂ 4 MIT 2026-05-24