3,625 repos GH 3,510 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2212 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

3D / NeRF
GitHub
Mono-HDR-3D
Mono-HDR-3Dは、ICML 2025で発表された、単一露光の低ダイナミックレンジ(LDR)画像から高ダイナミックレンジ(HDR…
★ 3 Apache-2.0 2026-04-27
画像生成
GitHub
mlx-lm-server
Ar9av/mlx-lm-serverは、Apple Siliconを搭載したMac向けに開発された、OpenAI互換のローカル推論サーバーです。LLM…
★ 3 MIT 2026-06-23
音楽生成
GitHub
music-agent
music-agentは、ターミナル中心のワークフローのために設計されたオープンソースのAI音楽エージェントです。Hermesや…
★ 3 MIT 2026-04-16
音声生成 / TTS
GitHub
auto-audiobook
「Auto-Audiobook」は、EPUB、MOBI、PDF形式の電子書籍を、構造化されたMP3オーディオブックに自動変換するエンジン…
★ 3 MIT 2026-06-27
AIエージェント
GitHub
ai-agent-stack
このGitHubリポジトリは、AIエージェント、オーケストレーション、およびLLM開発ツールに関する優れたオープンソース…
★ 3 MIT 2026-06-16
マルチモーダル
GitHub
tamart
このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…
★ 3 2026-06-29
3D / NeRF
GitHub
TGS-SLAM
TGS-SLAMは、IEEE Robotics and Automation Letters (RA-L) に採択されたセマンティックRGB-D SLAMシステムです。本…
★ 3 2026-05-28
画像生成
GitHub
pixeltamer-gpt-image-skill
「pixeltamer」は、Claude Code、Codex CLI、OpenCode、Cursorなど50以上のAIコーディングエージェント向けに設計さ…
★ 3 MIT 2026-06-17
ASR / 音声認識
GitHub
doublage
「Doublage(ドゥブラージュ)」は、任意の動画の好きなシーンをオンラインで友達と一緒に吹き替えできる革新的なツ…
★ 3 MIT 2026-06-12
LLM
GitHub
Learn-RAG-from-scratch
本プロジェクトは、Retrieval-Augmented Generation (RAG) システムをゼロから手動で構築し、学習することに特化して…
★ 3 2026-06-14
AIエージェント
GitHub
HEPHAESTUS
HEPHAESTUSは、開発目標を与えるとAIエージェントが自律的にタスクを分解、実行、検証し、最終的にクリーンなコード…
★ 3 MIT 2026-06-23
LLM
GitHub
Summer-inland-waterway-communication-dataset
LLIPSEは、内陸水路における船と陸間の通信のEnd-to-End遅延を予測するための軽量なLLM(大規模言語モデル)ベースの…
★ 3 ⑂ 2 MIT 2026-05-27
音声生成 / TTS
GitHub
kokoro-server
「kokoro-infer」は、高速で軽量なKokoro-82M TTS(Text-to-Speech)推論エンジンおよびサーバーです。CPU、CUDA、そ…
★ 3 2026-05-31
3D / NeRF
GitHub
spz
.SPZファイル形式のRust実装を提供し、この形式を扱うためのCLIツールです。PythonとC言語のバインディングも利用で…
★ 3 ⑂ 2 Apache-2.0 2026-06-20
ASR / 音声認識
GitHub
tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
動画生成
GitHub
manudesign
Manu Designは、チーム向けのオープンソースAIデザインワークフローエンジンです。ブランディングに沿った高品質な画…
★ 3 MIT 2026-05-19
動画生成
GitHub
ComfyUI-MediaHub
ComfyUI MediaHubは、クラウドベースの画像および動画生成APIを、構成可能でクリーンなComfyUIワークフローに統合す…
★ 3 ⑂ 1 MIT 2026-06-13
ASR / 音声認識
GitHub
harry-ai
Harryは、macOS向けに設計された音声のみのAIアシスタントです。映画「JARVIS / FRIDAY」のような体験を提供し、洗練…
★ 3 MIT 2026-05-26
音声生成 / TTS
GitHub
gemini-khmer-translator
このオープンソースツールは、GoogleのGemini 2.5と3.1 TTSを活用し、英語の動画コンテンツを高品質なクメール語に自…
★ 3 ⑂ 3 MIT 2026-05-15
マルチモーダル
GitHub
langchain-content-normalizer
langchain-content-normalizerは、LangChain、MCPツール、Anthropicコンテンツブロック、およびマルチモーダルチャッ…
★ 3 MIT 2026-06-03
LLM
GitHub
mdrouter
mdrouterは、OpenAI、Ollama、Anthropicといった複数のLLMプロバイダーに対応したルーターです。低コスト、低遅延、…
★ 3 MIT 2026-06-21
音声生成 / TTS
GitHub
PocketClaude
Pocket Claudeは、AnthropicのClaudeを自己ホストできるチャットフロントエンドです。ユーザー自身のPro/Maxサブスク…
★ 3 ⑂ 1 MIT 2026-06-22
動画生成
GitHub
prvod
PRVODは、GitHubのプルリクエストをナレーション付きのウォークスルービデオに自動変換するツールです。大規模な差分…
★ 3 ⑂ 3 NOASSERTION 2026-06-22
音声生成 / TTS
GitHub
ovos-tts-plugin-kokoro
ovos-tts-plugin-kokoroは、Open Voice OS (OVOS) 音声アシスタント向けに開発された、多言語テキスト読み上げ(TTS…
★ 3 NOASSERTION 2026-05-03