3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

Narracast

Narracastは、macOSユーザー向けのオフライン音声コンテンツ生成ツールです。任意のテキストを貼り付けるだけで、ク…

#F5-TTS #macOS #PySide6

★ 1 MIT 2026-06-09

LLM

GitHub

knowshelf

「Knowshelf」は、Go言語で書かれた個人用Markdown書籍知識ベース管理ツールです。Markdown形式の書籍をローカルのSQ…

#CLI #Go #Markdown

★ 1 Apache-2.0 2026-05-18

音声生成 / TTS

GitHub

narrateflow

NarrateFlowは、PPTやドキュメントを音声クローン、タイムライン調整、リタイムド動画合成機能を備えたナレーション…

#CLI #FFmpeg #Gemini API

★ 1 ⑂ 1 Apache-2.0 2026-06-14

ComfyUI

GitHub

comfyui-vsco-scraper

このcomfyui-vsco-scraperは、ComfyUI用のカスタムノードパックで、公開されているVSCOプロフィールから画像をスクレ…

#Chrome必須 #ComfyUI対応 #Playwright

★ 1 ⑂ 1 MIT 2026-03-29

LLM

GitHub

ontorag

ontoragは、RDF/OWLオントロジーを真の情報源として活用する、オントロジー対応RAG（Retrieval-Augmented Generation…

#CLI #Docker #LLM連携

★ 1 ⑂ 1 MIT 2026-06-16

ComfyUI

GitHub

ComfyUI-Smart-Metadata-Reader

ComfyUI-Smart-Metadata-Readerは、ComfyUIで生成された画像のメタデータをインテリジェントに読み取るPython製のカ…

#ComfyUI対応 #Python #カスタムノード

★ 1 2026-05-28

動画生成

GitHub

Agentic-video-pipeline

このプロジェクトは、テキストプロンプトからプラットフォーム対応のビデオを自動生成する自律型マルチエージェントA…

#CLI #Gemini API #Python

★ 1 2026-06-13

画像生成

GitHub

comfyui-character-picker

「ComfyUI Character Picker」は、ComfyUIのカスタムノードとして機能し、9500以上の膨大なアニメ/ゲームキャラクタ…

#ComfyUI対応 #Danbooruタグ #Python

★ 1 ⑂ 1 MIT 2026-06-04

音声生成 / TTS

GitHub

agentic-podcast

このツールは、データ駆動型のポッドキャストを人間が介入することなく毎日自動で生成し、ナレーションを付け、Spoti…

#AWS #Claude #CLI

★ 1 MIT 2026-06-10

3D / NeRF

GitHub

SparseNeRF-pytorch

本ツールは、SparseNeRFに触発された、スパースビュー（少数の視点からの画像）からの新しい視点合成を目的とした非…

#GPU必須 #Python #PyTorch

★ 1 MIT 2026-06-07

LLM

GitHub

KnowledgeBase

KnowledgeBaseは、ばらばらのメモを構造化された個人用Wikiに変換し、知識管理を支援するツールです。LLMを活用して…

#CLI #LLM連携 #Obsidian連携

★ 1 Apache-2.0 2026-06-26

マルチモーダル

GitHub

whatfirst-small

whatfirst · smallは、タスクの優先順位付けを支援する、ローカルで動作する小型のビジョン言語モデル（Qwen2.5-VL-3…

#Docker #Python #Web UI

★ 1 Apache-2.0 2026-06-19

音声生成 / TTS

GitHub

meloie

Meloieは、リアルタイムで動作するRVC（Retrieval-based Voice Conversion）ボイスチェンジャーのバージョン2です。…

#CLI #GPU必須 #GUI

★ 1 MIT 2026-06-15

ComfyUI

GitHub

ComfyUI-Voice

ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…

#ComfyUI対応 #GPU推奨 #Python

★ 1 Apache-2.0 2026-06-18

マルチモーダル

GitHub

uitars-mcp

UI-TARS MCPは、AIエージェントがデスクトップとウェブブラウザを操作するための「目と手」を提供するサーバーツール…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-06-07

ComfyUI

GitHub

ConfyUI_Post_Processing_PRO

「Post_Processing_PRO for ComfyUI」は、ComfyUI向けにキュレーションされたプロフェッショナルかつ高忠実度の後処…

#ComfyUI対応 #Python #カメラシミュレーション

★ 1 ⑂ 1 GPL-3.0 2026-04-14

音声生成 / TTS

GitHub

NeuralSoundForge

NeuralSoundForgeは、StyleGAN2とセマンティック因数分解を駆使した高度な深層学習プラットフォームです。このツール…

#Docker #GPU必須 #Python

★ 1 2026-02-06

ASR / 音声認識

GitHub

Welcome-to-the-Narthex-Transcripts

このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト（文字…

#CLI #GPU必須 #LLM活用

★ 1 NOASSERTION 2026-05-27

ASR / 音声認識

GitHub

Lumina-AI

Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…

#FastAPI #GPU必須 #Next.js

★ 1 2026-06-05

音楽生成

GitHub

Conditional-Music-Generation

このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…

#Audio Analysis #CLI #MIDI

★ 1 MIT 2026-05-12

マルチモーダル

GitHub

-deepseek-skills

このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識（OCR機能を含む）と音声認識（…

#AI Skills 套装 #CLI #GPU必須

★ 1 2026-06-04

LLM

GitHub

RoboGuard-RLAIF

このRoboGuardは、産業用ロボットUR10eのマニュアルに基づいた技術サポートを提供するエンタープライズRAGエージェン…

#ChromaDB #Gemini #LangGraph

★ 1 2026-06-24

AIエージェント

GitHub

pi-context-pruner

pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…

#AI/LLM #CLI #Pi

★ 1 2026-05-30

動画生成

GitHub

WaveSpeedAI-Skills

WaveSpeedAI Skillsは、700以上のメディアモデルと290以上のOpenAI互換LLMを統合したWaveSpeedAI推論プラットフォー…

#AIエージェント連携 #CLI #LLM対応

★ 1 MIT 2026-05-21