3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

LLM

GitHub

awesome-opd

「Awesome On-Policy Distillation」は、強化学習におけるOn-Policy Distillation (OPD) に関する厳選されたリソース…

#LLM #Python #ディスティレーション

★ 1 2026-05-15

ASR / 音声認識

GitHub

panakoes

Panakoesは、音声のキャプチャ、文字起こし、AIによるインサイト抽出を提供するオープンソースのクラウドプラットフ…

#AI/機械学習 #AWS #Python

★ 1 MIT 2026-06-29

動画生成

GitHub

awesome-ai-api-plus

このプロジェクト「Awesome AI API Plus」は、AIビルダー向けの厳選されたAI APIリストです。一般的なAIツールリスト…

#API #CLI #Node.js

★ 1 MIT 2026-05-27

ASR / 音声認識

GitHub

AI-VERSE

「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…

#HuggingFace Transformers #NLP #Python

★ 1 2026-05-21

音声生成 / TTS

GitHub

ai-google-voice-agent

「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…

#AI #Groq AI #Python

★ 1 2026-05-26

画像生成

GitHub

my-lm

My-LMは、オープンウェイトのLLM実行、SDXL画像生成、RAG、QLoRAファインチューニングといった高度なAIタスクを、単…

#Electron #GPU必須 #LLM対応

★ 1 MIT 2026-05-09

画像生成

GitHub

DESIGNOSFORGE

DESIGNOSFORGEは、AIデザインにおける視覚的な問題を解決し、統制されたデザインワークフローを実現するオープンソー…

#CLI #Codex #GitHub

★ 1 MIT 2026-06-19

画像生成

GitHub

ComfyUI-Mutantwork

ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…

#ComfyUI対応 #GPU推奨 #Python

★ 1 ⑂ 1 2026-06-12

ASR / 音声認識

GitHub

voice-prompt-tool

「Voice Prompt Tool」は、Windows環境で動作する音声入力ツールです。ホットキーを押すだけで、任意のテキスト入力…

#AIテキスト整理 #GUIアプリ #Python

★ 1 2026-06-23

ComfyUI

GitHub

comfyui_gr85

comfyui_gr85 は、ComfyUI向けに作られた軽量なカスタムノード集です。画像サイズやアスペクト比の計算、シードベー…

#ComfyUI対応 #Python #カスタムノード

★ 1 ⑂ 2 2025-11-28

音声生成 / TTS

GitHub

SoviaMate

SoviaMateは、エンドツーエンドの音声対話システム（SDS）構築に向けたオープンな研究プロジェクトです。特に、大規…

#CLI #Hugging Face #Python

★ 1 Apache-2.0 2026-05-18

マルチモーダル

GitHub

zero-shot-video-classifier

このツールは、ビジョン言語基盤モデル（CLIP、SigLIP 2、X-CLIP）を用いたゼロショット動画分類器です。タスク固有…

#Docker #HuggingFace Transformers #Python

★ 1 2026-06-09

LLM

GitHub

visually-guided-subtitle-translation

このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-20

3D / NeRF

GitHub

Lid-Lab-NeRF

Lid-Lab-NeRFは、LiDAR点群の新しいスキャンを生成するためのPyTorchベースのNeRFフレームワークです。このツールは…

#CLI #GPU必須 #LiDAR

★ 1 Apache-2.0 2025-11-28

LLM

GitHub

TOKEN_BANK-manage-your-token-usage

TOKENBANKは、AIコーディングアシスタントのトークン使用量と費用を詳細に統計・管理するためのデスクトップアプリケ…

#Python #Web UI #Windows

★ 1 2026-06-01

LLM

GitHub

contextcontrol

ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル（LLM）の利用、およびパッチワークフ…

#CLI #LLM #Ollama

★ 1 ⑂ 2 NOASSERTION 2026-05-31

音声生成 / TTS

GitHub

Open-Vox

OpenVoxは、選択したテキストをグローバルショートカットで読み上げる、オープンソースかつマルチOS対応のデスクトッ…

#GPU対応 #Python #Tkinter

★ 1 NOASSERTION 2026-06-02

ASR / 音声認識

GitHub

BaltiVoice-ASR

BaltiVoice ASRは、バルティ語（チベット語族の低リソース言語）の音声をテキストに変換する初のAI音声認識（ASR）シ…

#AI/ML #ASR #Hugging Face

★ 1 MIT 2026-06-12

LLM

GitHub

teaching_llm_applications

本リポジトリは、ヨーク大学コンピュータサイエンス学部が提供する12週間の修士課程コース「大規模言語モデル — 内部…

#LLM学習 #Python #ハンズオン

★ 1 GPL-3.0 2026-06-25

ASR / 音声認識

GitHub

Multimodal-Emotion-Recognition-System

このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…

#CLI #Machine Learning #Python

★ 1 2026-06-08

マルチモーダル

GitHub

DeepNumberVision

DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…

#CLI #GPU必須 #OpenCV

★ 1 2026-05-30

マルチモーダル

GitHub

mlx-mtp

mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…

#Apple Silicon対応 #CLI #Python

★ 1 Apache-2.0 2026-06-16

マルチモーダル

GitHub

blind-vision-mcp

blind-vision-mcpは、テキストベースのLLM（大規模言語モデル）に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…

#CLI #GPU必須 #Python

★ 1 MIT 2026-06-15

3D / NeRF

GitHub

GaussianSplatsGradientFlow

このプロジェクトは、「3D Gaussian Splatting for Real-Time Radiance Field Rendering」に記述されているGaussian …

#CLI #Python #可視化

★ 1 2026-05-16