3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

LLM

GitHub

AeroGraph

AeroGraphは、航空安全インシデントレポートを対象としたグラフ拡張RAG（Retrieval-Augmented Generation）のベンチ…

#CLI #LLM #Python

★ 8 MIT 2026-05-07

LLM

GitHub

durag

Du-RAG (Durable RAG)は、AIエージェント向けに Retrieval-Augmented Generation (RAG) を基盤とした永続的な記憶層…

#AIエージェント #CLI #Google Gemini対応

★ 8 ⑂ 1 Apache-2.0 2026-06-05

ASR / 音声認識

GitHub

Seam-LocalFirstMinutes

Seamは、会議の録音・文字起こし・要約をローカル環境中心で完結させるmacOS向けアプリです。マイク録音とシステム音…

#macOS #Python #クラウドAPI連携

★ 8 Apache-2.0 2026-07-01

ASR / 音声認識

GitHub

Fast-Sub

Fast Subは、動画および音声ファイル用のローカルファーストの字幕ツールです。字幕の生成と翻訳を、ユーザーのデバ…

#CLI #Python #デスクトップアプリ

★ 7 MIT 2026-06-30

ASR / 音声認識

GitHub

tastebench

Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…

#CLI #GPU不要 #Python

★ 7 ⑂ 1 MIT 2026-05-19

ComfyUI

GitHub

comfyui-clippy-reloaded

Clippy Reloaded for ComfyUIは、クリップボードから画像を直接ComfyUIのワークフローに読み込むためのツールです。…

#ComfyUI対応 #Linux対応 (推定) #macOS対応 (推定)

★ 7 ⑂ 3 2026-06-07

LLM

GitHub

a-agent

a-agentは、ターミナルベースのワークフロー向けに最適化された、単一ファイルのAIコーディングエージェントです。特…

#AI #CLI #iOS

★ 7 MIT 2026-05-19

3D / NeRF

GitHub

interactive-website-navigator

このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…

#Docker #Gemini API #GPU不要

★ 7 MIT 2026-05-17

マルチモーダル

GitHub

CaptionEvalKit-for-VLMs

CaptionEvalKit-for-VLMsは、VLM（Visual Language Model）向け画像キャプション評価を再現性高く、オールインワンで…

#CLI #Docker #GPU必須

★ 7 BSD-3-Clause-Clear 2026-06-22

音声生成 / TTS

GitHub

lora-cosyvoice123-chanting

このリポジトリは、中国語の古詩詞吟誦に特化したCosyVoice 1/2/3 LoRA微調整実験フレームワークです。CosyVoiceの三…

#CLI #Hugging Face対応 #LoRA対応

★ 7 2026-06-18

音声生成 / TTS

GitHub

Leva-TTS

Leva-TTSは、リアルタイム会話エージェント向けに最適化された、プロダクション志向のレバント・アラビア語と英語の…

#CLI #GPU必須 #Python

★ 7 ⑂ 1 Apache-2.0 2026-06-02

音声生成 / TTS

GitHub

Kokoro-82M-ONNX-German-Martin

本リポジトリは、ドイツ語のKokoro音声モデル「Martin」を用いたテキスト読み上げ（TTS）システムのDockerおよびHome…

#Docker #FastAPI #Home Assistant

★ 7 ⑂ 1 2026-05-22

3D / NeRF

GitHub

stechdrive-3dgs-utils

このツールは、360度カメラで撮影した動画を、3D Gaussian Splatting（3DGS）のトレーニングに利用できる画像、マス…

#360°動画 #3DGS #GUI

★ 7 MIT 2026-05-31

ComfyUI

GitHub

ideogram4_prompter-ComfyUI

このComfyUIカスタムノードは、Ideogram 4のMagic Prompt APIを活用し、ユーザーが入力した簡単なプロンプトを、Ideo…

#API利用 #ComfyUI対応 #Python

★ 7 ⑂ 1 MIT 2026-06-04

ASR / 音声認識

GitHub

MavKa

MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…

#AIボット #CLI #Linux

★ 7 ⑂ 1 MIT 2026-05-10

画像生成

GitHub

sd-faceswap

このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…

#CLI #GPU必須 #Python

★ 7 MIT 2026-05-19

画像生成

GitHub

Ollama-UI

Local AIは、Ollamaを搭載した完全にオフラインでポータブルなAIワークスペースです。ユーザーは直感的なインターフ…

#GPU対応 #Ollama #Python

★ 7 ⑂ 2 MIT 2026-05-27

音声生成 / TTS

GitHub

okay-hermes-voice

「Okay Hermes Voice」は、既存の「Hermes Agent」に「Okay Hermes」というウェイクフレーズを追加し、常に音声で操…

#CLI #Linux対応 #Python

★ 7 NOASSERTION 2026-06-29

動画生成

GitHub

Awesome-Gemini-Omni-API-Prompts

このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…

#API連携 #Gemini Omni #Python

★ 7 ⑂ 1 CC0-1.0 2026-07-01

LLM

GitHub

CRIMENET

CRIMENETは、世界中の犯罪組織間の同盟と敵対関係をマッピングしたオープンソースのデータベースおよびインタラクテ…

#CLI #LLM #Python

★ 7 MIT 2026-06-28

ASR / 音声認識

GitHub

voice-input

本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。ショート…

#GPU対応 #Linux対応 #macOS対応

★ 7 MIT 2026-06-15

ASR / 音声認識

GitHub

meet-transcription

このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…

#Deepgram #Docker #Google Meet対応

★ 7 MIT 2026-06-22

音声生成 / TTS

GitHub

book-v2-audio

このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…

#AI活用 #CLI #Python

★ 7 ⑂ 4 MIT 2026-05-24

動画生成

GitHub

firered-director

firered-directorは、自然言語の指示に基づいてビデオ編集とディレクションを行うAIエージェントです。ユーザーは「…

#AI #CLI #LLM

★ 7 MIT 2026-05-20