3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub jp2zh-video-subs
このプロジェクトは、ローカルの日本語動画ファイルから簡体字中国語のSRT字幕を生成するCLIツールです。Qwen3-ASRと…
★ 3 2026-06-14
音声生成 / TTS GitHub epubvoice
EpubVoiceは、自己ホスト型の個人用EPUBリーダーで、テキスト読み上げ(TTS)機能を備えています。購読や制限がなく…
★ 3 ⑂ 1 2026-06-21
LLM GitHub Llaboratory
Llaboratoryは、LLMが架空のツールを使用する際の挙動を研究するための、自己ホスト可能なオープンソースの実験プラ…
★ 3 ⑂ 1 MIT 2026-06-26
動画生成 GitHub manudesign
Manu Designは、チーム向けのオープンソースAIデザインワークフローエンジンです。ブランディングに沿った高品質な画…
★ 3 MIT 2026-05-19
ASR / 音声認識 GitHub athena-whisper
Athena Whisperは、ローカル環境で動作するデスクトップ向け音声入力ウィジェットです。faster-whisperを利用した高…
★ 3 ⑂ 2 2026-06-06
音楽生成 GitHub AuraDev
AuraDevは、開発者のリアルタイムの認知状態(集中、行き詰まり、デバッグなど)に適応してアンビエント音楽を生成す…
★ 3 GPL-3.0 2026-05-31
音声生成 / TTS GitHub fiona-anne
Fiona Anneは、プライバシーを最優先に考え、外部APIを一切使用せずに自身のマシン上で動作する、自己ホスト型の音声…
★ 3 2026-04-09
音声生成 / TTS GitHub PocketClaude
Pocket Claudeは、AnthropicのClaudeを自己ホストできるチャットフロントエンドです。ユーザー自身のPro/Maxサブスク…
★ 3 ⑂ 1 MIT 2026-06-22
動画生成 GitHub paper2video
「paper2video」は、あらゆる技術記事や論文を、著名な「3Blue1Brown」スタイルに倣った2〜5分間の解説動画へと自動…
★ 3 Apache-2.0 2026-04-13
マルチモーダル GitHub loci-db
LOCIはAIワールドモデル向けの4次元時空間ベクトルデータベースです。埋め込みベクトルの位置と時間情報(x,y,z,t)…
★ 3 Apache-2.0 2026-06-11
音声生成 / TTS GitHub AutoShorts-Studio
AutoReelは、AIを活用してソーシャルメディア向けの魅力的な短尺動画コンテンツを自動生成する、先進的なコンテナ化…
★ 3 ⑂ 1 2026-06-25
動画生成 GitHub ai-video-creator
このツールは、Claude Agent Skillとして機能し、生活の知恵に関するアイデアを、AIナレーション付きで直接公開可能…
★ 3 MIT 2026-06-11
音声生成 / TTS GitHub seshat-tts
Seshat TTSは、Windows向けのGUIユーティリティで、ゲームやアプリケーション向けにリアルタイムの音声ストリーミン…
★ 3 ⑂ 1 NOASSERTION 2026-06-19
マルチモーダル GitHub SmolVLM2-Edge-Vision-Agent
SmolVLM2-2.2Bを搭載したエッジ展開可能なビジョンエージェントで、CPUのみのハードウェア(16GB RAM)で動作します…
★ 3 2026-04-27
動画生成 GitHub video-distillation
video-distillationは、動画、キーフレーム、スクリーンショット、ナレーションスクリプト、プロット概要などを、動…
★ 3 ⑂ 1 MIT 2026-06-24
マルチモーダル GitHub tamart
このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…
★ 3 2026-05-25
LLM GitHub ring-fenced-rag
Ring-Fenced RAG (RFR)は、自己ホスト型でゼロトラストの検索拡張生成(RAG)システムです。特徴は、データベースレ…
★ 3 ⑂ 1 MIT 2026-06-23
ASR / 音声認識 GitHub claude-eyes
claude-eyesは、Claude Codeに動画処理能力を付与するためのプラグインです。主な機能として、ビデオ(URLまたはロー…
★ 3 NOASSERTION 2026-06-02
音声生成 / TTS GitHub MiniBox
MiniBoxは、GPT-SoVITSによる高品質な音声合成とクラウドLLMを組み合わせた、キャラクターボイスチャットボットです…
★ 3 ⑂ 2 MIT 2026-06-08
AIエージェント GitHub ironclad
Ironcladは、大規模言語モデル(LLM)エージェントの信頼性を、モデルサイズではなく厳格な制約と強制によって実現す…
★ 3 Apache-2.0 2026-06-26
画像生成 GitHub gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 3 MIT 2026-05-08
音声生成 / TTS GitHub jarvis-ai
J.A.R.V.I.S.は、Linux上で動作するローカルの音声駆動型AIオペレーターです。Claude Pro、OpenRouter、またはOllama…
★ 3 ⑂ 2 MIT 2026-06-17
音声生成 / TTS GitHub ComfyUI_RH_VoxCPM
ComfyUI_RH_VoxCPMは、ComfyUIのノードベースワークフロー内でVoxCPMの機能を統合するプラグインです。これにより、…
★ 3 Apache-2.0 2026-06-28
LLM GitHub Summer-inland-waterway-communication-dataset
LLIPSEは、内陸水路における船と陸間の通信のEnd-to-End遅延を予測するための軽量なLLM(大規模言語モデル)ベースの…
★ 3 ⑂ 2 MIT 2026-05-27