3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

crashout-buddy

Crashout Buddyは、Vision AgentsとStream Video上に構築された、リアルタイムで感情認識を行う音声AIエージェントの…

#CLI #Gemini対応 #Python

★ 3 MIT 2026-05-15

マルチモーダル

GitHub

opencode-vision

opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。ユーザーが…

#CLI #MiniMax VLM #Node.js

★ 3 MIT 2026-06-24

画像生成

GitHub

CTGMWorkshop

このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…

#CLI #GPU必須 #Jupyter Notebook

★ 3 Unlicense 2026-06-23

音声生成 / TTS

GitHub

Audicle

Audicleは、保存した記事をパーソナルポッドキャストフィードに変換する自己ホスト型サービスです。記事のURLを貼り…

#Docker #GPU/CPU対応 #Podcasting 2.0

★ 3 NOASSERTION 2026-06-26

ASR / 音声認識

GitHub

jp2zh-video-subs

このプロジェクトは、ローカルの日本語動画ファイルから簡体字中国語のSRT字幕を生成するCLIツールです。Qwen3-ASRと…

#CLI #GPU必須 #Python

★ 3 2026-06-14

音声生成 / TTS

GitHub

epubvoice

EpubVoiceは、自己ホスト型の個人用EPUBリーダーで、テキスト読み上げ（TTS）機能を備えています。購読や制限がなく…

#Android #EPUBリーダー #Flutter

★ 3 ⑂ 1 2026-06-21

LLM

GitHub

financebench-rag-agent

本ツールは、役割ベースのアクセス制御を備えた金融文書Q&A向けマルチエージェントRAGシステムです。FinanceBenchで7…

#LangGraph #LLM連携 #Python

★ 3 MIT 2026-06-09

LLM

GitHub

provenance-energy-rag-chatbot

本ツールは、太陽光発電やエネルギー機器のマニュアルに対応した、信頼性の高いドキュメント指向型RAGチャットボット…

#Docker #FastAPI #Python

★ 3 MIT 2026-06-08

音声生成 / TTS

GitHub

supertonic3-book-reader

「EPUB TTS Reader API」は、EPUBファイルをテキストに変換し、Supertonic-3モデルを使用してテキスト読み上げ（TTS…

#CLI #Docker #FastAPI

★ 3 MIT 2026-05-15

マルチモーダル

GitHub

AI-Book-Discovery-App

Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…

#CLI #Docker #GPU必須

★ 3 GPL-3.0 2026-05-10

LLM

GitHub

Llaboratory

Llaboratoryは、LLMが架空のツールを使用する際の挙動を研究するための、自己ホスト可能なオープンソースの実験プラ…

#CLI #Docker Compose #Python

★ 3 ⑂ 1 MIT 2026-06-26

動画生成

GitHub

volcengine-hermes-plugin

このプラグインは、Hermes Agentに火山引擎（Volcengine）のDoubao LLM（大規模言語モデル）、Doubao Seedream（画像…

#API連携 #Hermes Agent対応 #LLM

★ 3 ⑂ 1 2026-06-30

LLM

GitHub

openmodels

OpenModels Registryは、大規模言語モデル（LLM）とその推論プロバイダー、および両者のマッピングに関する情報を集…

#CLI #LLM #Python

★ 3 ⑂ 1 2026-06-30

画像生成

GitHub

awesome-ai-image-prompts

このリポジトリは、GPT-Image-2、Nano Banana、Seedance、Qwen-VL、Gemini ImagenなどのAI画像生成モデル向けの、955…

#AI画像生成 #CLI #Python

★ 3 ⑂ 2 Apache-2.0 2026-05-26

ASR / 音声認識

GitHub

athena-whisper

Athena Whisperは、ローカル環境で動作するデスクトップ向け音声入力ウィジェットです。faster-whisperを利用した高…

#CLI #Linux対応 #Python

★ 3 ⑂ 2 2026-06-06

動画生成

GitHub

ai-video-skill

このツールは、Claude Code向けに設計されたAIビデオ生成スキルです。プロンプトから最終的な編集まで、エンドツーエ…

#AIビデオ生成 #Claude Code対応 #Python

★ 3 MIT 2026-06-09

ASR / 音声認識

GitHub

smart-meeting-assistant

「拼好会-智能会議辅助系统」は、AIを活用したリアルタイム会議支援ソフトウェアです。PCの音声とマイク入力を同時に…

#AI/LLM #GUI #Python

★ 3 2026-05-25

音楽生成

GitHub

AuraDev

AuraDevは、開発者のリアルタイムの認知状態（集中、行き詰まり、デバッグなど）に適応してアンビエント音楽を生成す…

#AI #CLI #GCP

★ 3 GPL-3.0 2026-05-31

音声生成 / TTS

GitHub

fiona-anne

Fiona Anneは、プライバシーを最優先に考え、外部APIを一切使用せずに自身のマシン上で動作する、自己ホスト型の音声…

#CLI #Docker #Ollama

★ 3 2026-04-09

音声生成 / TTS

GitHub

voice-to-text

CogNativeは、既存の声をクローンし、その声で別の言語の音声を生成できる翻訳音声合成ツールです。GUIとCLIの両方を…

#CLI #Google Cloud #GPU対応

★ 3 2026-05-13

3D / NeRF

GitHub

lichtfeld-tensorboard-export

このツールは、LichtFeld Studio用のプラグインであり、トレーニング中の詳細なメトリクスをTensorBoardイベントファ…

#CLI #LichtFeld Studio #Python

★ 3 GPL-3.0 2026-05-15

ASR / 音声認識

GitHub

hexy

HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…

#AI搭載 #GPU必須 #Python

★ 3 ⑂ 1 2026-05-10

動画生成

GitHub

paper2video

「paper2video」は、あらゆる技術記事や論文を、著名な「3Blue1Brown」スタイルに倣った2〜5分間の解説動画へと自動…

#CLI #LLM活用 #Manim

★ 3 Apache-2.0 2026-04-13

マルチモーダル

GitHub

loci-db

LOCIはAIワールドモデル向けの4次元時空間ベクトルデータベースです。埋め込みベクトルの位置と時間情報（x,y,z,t）…

#AI/ML #Docker対応 #Python

★ 3 Apache-2.0 2026-06-11