3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2208 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

Edu_Omni_MyMind

EduMINDは、ベトナム語と英語が混在する学術環境向けに設計された、多モーダルなバイリンガル講義アシスタントおよび…

#CLI #Python #Web UI

★ 8 ⑂ 3 MIT 2026-06-23

ASR / 音声認識

GitHub

douyin-living

「Douyin Live AI Clipper」は、抖音（Douyin）ライブ配信を自動で録画し、AIがハイライトシーンを自動で切り出すシ…

#AI #CLI #GPU対応

★ 8 ⑂ 3 MIT 2026-07-04

音声生成 / TTS

GitHub

Local-TTS-studio

Open TTSは、サーバーやAPIキーなしでデバイス上で完結する、ローカルファーストのテキスト読み上げ（TTS）スタジオ…

#Electron #Python #Web UI

★ 8 Apache-2.0 2026-07-01

LLM

GitHub

DAYA

DAYAは、イラスト豊富なドキュメント（プレゼンテーション資料など）に特化した、ドキュメント認識型ハイブリッドア…

#ChromaDB #Docling #Groq

★ 8 Apache-2.0 2026-06-04

音声生成 / TTS

GitHub

mlx-indextts

MLX-IndexTTSは、Apple Silicon向けに最適化された高品質なテキスト読み上げ（TTS）ツールで、IndexTTS 1.5および2.0…

#Apple Silicon対応 #CLI #macOS

★ 8 ⑂ 1 MIT 2026-04-15

音声生成 / TTS

GitHub

SubForge

SubForgeは、AIを駆使した高機能な動画字幕ツールです。音声のテキスト化、意味に基づいたスマートな断句、誤字修正…

#AI駆動 #CLI #Python

★ 8 GPL-3.0 2026-07-03

ASR / 音声認識

GitHub

florilegium

このツールは「Florilegium（フロリレギウム）・他山之石」と名付けられ、YouTubeやBilibiliなどの動画リンク、また…

#Agent Workflow #CLI #Obsidian連携

★ 8 ⑂ 1 MIT 2026-06-06

音声生成 / TTS

GitHub

Kokoro-82M-ONNX-German-Martin

本リポジトリは、ドイツ語のKokoro音声モデル「Martin」を用いたテキスト読み上げ（TTS）システムのDockerおよびHome…

#Docker #FastAPI #Home Assistant

★ 8 ⑂ 1 2026-05-22

画像生成

GitHub

DisPOSE

この「DisPOSE」は、自己教師ありマルチビュー3D人体ポーズ推定のための実装です。離散的なクロスビュー人物割り当て…

#3Dポーズ推定 #CLI #GPU必須

★ 8 ⑂ 1 MIT 2026-07-03

AIエージェント

GitHub

AutoPilot-DevAgent

AutoPilot Devは、GitHubのプルリクエストURLを入力として受け取り、AIがコードレビュー、バグ修正の提案、テスト検…

#CrewAI #Docker #FastAPI

★ 8 2026-06-09

3D / NeRF

GitHub

SEAR

SEARは、RGB画像と熱画像を組み合わせてカメラのポーズを推定する3D再構築プロジェクトです。Visual Geometric Trans…

#3D再構築 #CLI #GPU必須

★ 8 NOASSERTION 2026-05-07

AIエージェント

GitHub

career-forges

CareerForgesは、AIエージェントをローカルで実行することで、求職活動を自動化・最適化するためのオープンソースの…

#AI #Python #Web UI

★ 8 ⑂ 1 MIT 2026-06-11

マルチモーダル

GitHub

modalformer-lowlight

このプロジェクト「modalformer-lowlight」は、低照度環境で撮影された画像のノイズ、色の歪み、細部喪失を改善する…

#GPU必須 #Python #Transformerモデル

★ 8 ⑂ 2 MIT 2026-05-01

ComfyUI

GitHub

OpenShot-ComfyUI

OpenShot-ComfyUIは、人気動画編集ソフトOpenShot向けに開発されたComfyUIノードのセットです。OpenShotとAIモデルの…

#AIモデル活用 #ComfyUI対応 #OpenShot連携

★ 8 ⑂ 2 GPL-3.0 2026-04-16

動画生成

GitHub

KIVI

KIVIは、テキストから動画を生成するAIモデルの評価に特化したツールです。従来の「動画の見栄え」ではなく、「動画…

#CLI #GPU必須 #LLM連携

★ 8 MIT 2026-06-05

LLM

GitHub

LLMs-Tutorials-Projects

このリポジトリは、LLM（大規模言語モデル）に関する実践的なチュートリアルと実装コード集を提供します。ファインチ…

#Evaluation #Fine-tuning #Google Colab

★ 8 ⑂ 3 2026-06-23

ComfyUI

GitHub

Comfy-Launcher-MultiOS

Comfy-Launcher-MultiOSは、LinuxおよびmacOS環境でComfyUIのインストール、起動、更新、管理を簡素化するシェルスク…

#CLI #ComfyUI対応 #GPU対応

★ 8 ⑂ 3 2026-06-17

画像生成

GitHub

Ollama-UI

Local AIは、Ollamaを搭載した完全にオフラインでポータブルなAIワークスペースです。ユーザーは直感的なインターフ…

#GPU対応 #Ollama #Python

★ 8 ⑂ 2 MIT 2026-05-27

音声生成 / TTS

GitHub

book-v2-audio

このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…

#AI活用 #CLI #Python

★ 7 ⑂ 4 MIT 2026-05-24

ASR / 音声認識

GitHub

meet-transcription

このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…

#Deepgram #Docker #Google Meet対応

★ 7 MIT 2026-06-22

マルチモーダル

GitHub

AlignedNorm

AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…

#ICML論文 #Python #Vision-Language Models

★ 7 MIT 2026-06-27

動画生成

GitHub

firered-director

firered-directorは、自然言語の指示に基づいてビデオ編集とディレクションを行うAIエージェントです。ユーザーは「…

#AI #CLI #LLM

★ 7 MIT 2026-05-20

ASR / 音声認識

GitHub

Live-Church-Captions

Church Capは、教会向けに開発されたオープンソースかつローカルファーストのリアルタイムキャプションアプリです。…

#CLI #Python #Web UI

★ 7 MIT 2026-07-01

音声生成 / TTS

GitHub

Jarvis-MT67

JARVIS-MT67は、映画「アイアンマン」のJ.A.R.V.I.S.にインスパイアされた、常に稼働し続ける自律型AIパーソナルアシ…

#Gemini対応 #Python #カメラビジョン

★ 7 ⑂ 4 MIT 2026-04-29