3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2208 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
Edu_Omni_MyMind
EduMINDは、ベトナム語と英語が混在する学術環境向けに設計された、多モーダルなバイリンガル講義アシスタントおよび…
★ 8 ⑂ 3 MIT 2026-06-23
ASR / 音声認識
GitHub
douyin-living
「Douyin Live AI Clipper」は、抖音(Douyin)ライブ配信を自動で録画し、AIがハイライトシーンを自動で切り出すシ…
★ 8 ⑂ 3 MIT 2026-07-04
音声生成 / TTS
GitHub
Local-TTS-studio
Open TTSは、サーバーやAPIキーなしでデバイス上で完結する、ローカルファーストのテキスト読み上げ(TTS)スタジオ…
★ 8 Apache-2.0 2026-07-01
LLM
GitHub
DAYA
DAYAは、イラスト豊富なドキュメント(プレゼンテーション資料など)に特化した、ドキュメント認識型ハイブリッドア…
★ 8 Apache-2.0 2026-06-04
音声生成 / TTS
GitHub
mlx-indextts
MLX-IndexTTSは、Apple Silicon向けに最適化された高品質なテキスト読み上げ(TTS)ツールで、IndexTTS 1.5および2.0…
★ 8 ⑂ 1 MIT 2026-04-15
音声生成 / TTS
GitHub
SubForge
SubForgeは、AIを駆使した高機能な動画字幕ツールです。音声のテキスト化、意味に基づいたスマートな断句、誤字修正…
★ 8 GPL-3.0 2026-07-03
ASR / 音声認識
GitHub
florilegium
このツールは「Florilegium(フロリレギウム)・他山之石」と名付けられ、YouTubeやBilibiliなどの動画リンク、また…
★ 8 ⑂ 1 MIT 2026-06-06
音声生成 / TTS
GitHub
Kokoro-82M-ONNX-German-Martin
本リポジトリは、ドイツ語のKokoro音声モデル「Martin」を用いたテキスト読み上げ(TTS)システムのDockerおよびHome…
★ 8 ⑂ 1 2026-05-22
画像生成
GitHub
DisPOSE
この「DisPOSE」は、自己教師ありマルチビュー3D人体ポーズ推定のための実装です。離散的なクロスビュー人物割り当て…
★ 8 ⑂ 1 MIT 2026-07-03
AIエージェント
GitHub
AutoPilot-DevAgent
AutoPilot Devは、GitHubのプルリクエストURLを入力として受け取り、AIがコードレビュー、バグ修正の提案、テスト検…
★ 8 2026-06-09
3D / NeRF
GitHub
SEAR
SEARは、RGB画像と熱画像を組み合わせてカメラのポーズを推定する3D再構築プロジェクトです。Visual Geometric Trans…
★ 8 NOASSERTION 2026-05-07
AIエージェント
GitHub
career-forges
CareerForgesは、AIエージェントをローカルで実行することで、求職活動を自動化・最適化するためのオープンソースの…
★ 8 ⑂ 1 MIT 2026-06-11
マルチモーダル
GitHub
modalformer-lowlight
このプロジェクト「modalformer-lowlight」は、低照度環境で撮影された画像のノイズ、色の歪み、細部喪失を改善する…
★ 8 ⑂ 2 MIT 2026-05-01
ComfyUI
GitHub
OpenShot-ComfyUI
OpenShot-ComfyUIは、人気動画編集ソフトOpenShot向けに開発されたComfyUIノードのセットです。OpenShotとAIモデルの…
★ 8 ⑂ 2 GPL-3.0 2026-04-16
動画生成
GitHub
KIVI
KIVIは、テキストから動画を生成するAIモデルの評価に特化したツールです。従来の「動画の見栄え」ではなく、「動画…
★ 8 MIT 2026-06-05
LLM
GitHub
LLMs-Tutorials-Projects
このリポジトリは、LLM(大規模言語モデル)に関する実践的なチュートリアルと実装コード集を提供します。ファインチ…
★ 8 ⑂ 3 2026-06-23
ComfyUI
GitHub
Comfy-Launcher-MultiOS
Comfy-Launcher-MultiOSは、LinuxおよびmacOS環境でComfyUIのインストール、起動、更新、管理を簡素化するシェルスク…
★ 8 ⑂ 3 2026-06-17
画像生成
GitHub
Ollama-UI
Local AIは、Ollamaを搭載した完全にオフラインでポータブルなAIワークスペースです。ユーザーは直感的なインターフ…
★ 8 ⑂ 2 MIT 2026-05-27
音声生成 / TTS
GitHub
book-v2-audio
このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…
★ 7 ⑂ 4 MIT 2026-05-24
ASR / 音声認識
GitHub
meet-transcription
このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…
★ 7 MIT 2026-06-22
マルチモーダル
GitHub
AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 7 MIT 2026-06-27
動画生成
GitHub
firered-director
firered-directorは、自然言語の指示に基づいてビデオ編集とディレクションを行うAIエージェントです。ユーザーは「…
★ 7 MIT 2026-05-20
ASR / 音声認識
GitHub
Live-Church-Captions
Church Capは、教会向けに開発されたオープンソースかつローカルファーストのリアルタイムキャプションアプリです。…
★ 7 MIT 2026-07-01
音声生成 / TTS
GitHub
Jarvis-MT67
JARVIS-MT67は、映画「アイアンマン」のJ.A.R.V.I.S.にインスパイアされた、常に稼働し続ける自律型AIパーソナルアシ…
★ 7 ⑂ 4 MIT 2026-04-29