3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

LLM
GitHub
awesome-opd
「Awesome On-Policy Distillation」は、強化学習におけるOn-Policy Distillation (OPD) に関する厳選されたリソース…
★ 1 2026-05-15
ASR / 音声認識
GitHub
panakoes
Panakoesは、音声のキャプチャ、文字起こし、AIによるインサイト抽出を提供するオープンソースのクラウドプラットフ…
★ 1 MIT 2026-06-29
動画生成
GitHub
awesome-ai-api-plus
このプロジェクト「Awesome AI API Plus」は、AIビルダー向けの厳選されたAI APIリストです。一般的なAIツールリスト…
★ 1 MIT 2026-05-27
ASR / 音声認識
GitHub
AI-VERSE
「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…
★ 1 2026-05-21
音声生成 / TTS
GitHub
ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26
画像生成
GitHub
my-lm
My-LMは、オープンウェイトのLLM実行、SDXL画像生成、RAG、QLoRAファインチューニングといった高度なAIタスクを、単…
★ 1 MIT 2026-05-09
画像生成
GitHub
DESIGNOSFORGE
DESIGNOSFORGEは、AIデザインにおける視覚的な問題を解決し、統制されたデザインワークフローを実現するオープンソー…
★ 1 MIT 2026-06-19
画像生成
GitHub
ComfyUI-Mutantwork
ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…
★ 1 ⑂ 1 2026-06-12
ASR / 音声認識
GitHub
voice-prompt-tool
「Voice Prompt Tool」は、Windows環境で動作する音声入力ツールです。ホットキーを押すだけで、任意のテキスト入力…
★ 1 2026-06-23
ComfyUI
GitHub
comfyui_gr85
comfyui_gr85 は、ComfyUI向けに作られた軽量なカスタムノード集です。画像サイズやアスペクト比の計算、シードベー…
★ 1 ⑂ 2 2025-11-28
音声生成 / TTS
GitHub
SoviaMate
SoviaMateは、エンドツーエンドの音声対話システム(SDS)構築に向けたオープンな研究プロジェクトです。特に、大規…
★ 1 Apache-2.0 2026-05-18
マルチモーダル
GitHub
zero-shot-video-classifier
このツールは、ビジョン言語基盤モデル(CLIP、SigLIP 2、X-CLIP)を用いたゼロショット動画分類器です。タスク固有…
★ 1 2026-06-09
LLM
GitHub
visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20
3D / NeRF
GitHub
Lid-Lab-NeRF
Lid-Lab-NeRFは、LiDAR点群の新しいスキャンを生成するためのPyTorchベースのNeRFフレームワークです。このツールは…
★ 1 Apache-2.0 2025-11-28
LLM
GitHub
TOKEN_BANK-manage-your-token-usage
TOKENBANKは、AIコーディングアシスタントのトークン使用量と費用を詳細に統計・管理するためのデスクトップアプリケ…
★ 1 2026-06-01
LLM
GitHub
contextcontrol
ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル(LLM)の利用、およびパッチワークフ…
★ 1 ⑂ 2 NOASSERTION 2026-05-31
音声生成 / TTS
GitHub
Open-Vox
OpenVoxは、選択したテキストをグローバルショートカットで読み上げる、オープンソースかつマルチOS対応のデスクトッ…
★ 1 NOASSERTION 2026-06-02
ASR / 音声認識
GitHub
BaltiVoice-ASR
BaltiVoice ASRは、バルティ語(チベット語族の低リソース言語)の音声をテキストに変換する初のAI音声認識(ASR)シ…
★ 1 MIT 2026-06-12
LLM
GitHub
teaching_llm_applications
本リポジトリは、ヨーク大学コンピュータサイエンス学部が提供する12週間の修士課程コース「大規模言語モデル — 内部…
★ 1 GPL-3.0 2026-06-25
ASR / 音声認識
GitHub
Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
マルチモーダル
GitHub
DeepNumberVision
DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…
★ 1 2026-05-30
マルチモーダル
GitHub
mlx-mtp
mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…
★ 1 Apache-2.0 2026-06-16
マルチモーダル
GitHub
blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
3D / NeRF
GitHub
GaussianSplatsGradientFlow
このプロジェクトは、「3D Gaussian Splatting for Real-Time Radiance Field Rendering」に記述されているGaussian …
★ 1 2026-05-16