3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
ai-subtitle-generator
本ツールは、YouTube Shorts、TikTok、Reelsなどの短尺動画コンテンツ向けに、AIを活用しワードレベルで高精度なSRT…
★ 1 2026-05-16
LLM
GitHub
RAG_pipelines
このツールは、RAG (Retrieval-Augmented Generation) システムの設計と構築を目的とした実験的なリポジトリです。デ…
★ 1 MIT 2026-05-26
画像生成
GitHub
Lumina-AI
Lumina AIは、高度なマルチモーダルAIバーチャルコンパニオン兼アシスタントです。Gradioインターフェース上で動作し…
★ 1 MIT 2026-06-22
LLM
GitHub
llama-google-colab-tutorial
本リポジトリは、MetaのLlama 3.1 8B InstructモデルをGoogle Colab上で無料で利用するためのステップバイステップチ…
★ 1 2026-03-18
LLM
GitHub
Project-adam-v2
Synthesizer V2(Project Adam V2)は、MBTIプロファイルに基づいた4つのAIアクター間で複雑な会話をシミュレートし…
★ 1 MIT 2026-05-22
ComfyUI
GitHub
Comfyjot
ComfyJotは、ComfyUIのキャンバス上に直接手書きのメモや注釈を追加できるフロントエンド専用の拡張機能です。ワーク…
★ 1 ⑂ 1 MIT 2026-04-05
音声生成 / TTS
GitHub
ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26
画像生成
GitHub
my-lm
My-LMは、オープンウェイトのLLM実行、SDXL画像生成、RAG、QLoRAファインチューニングといった高度なAIタスクを、単…
★ 1 MIT 2026-05-09
画像生成
GitHub
DESIGNOSFORGE
DESIGNOSFORGEは、AIデザインにおける視覚的な問題を解決し、統制されたデザインワークフローを実現するオープンソー…
★ 1 MIT 2026-06-19
画像生成
GitHub
ComfyUI-Mutantwork
ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…
★ 1 ⑂ 1 2026-06-12
ASR / 音声認識
GitHub
voice-prompt-tool
「Voice Prompt Tool」は、Windows環境で動作する音声入力ツールです。ホットキーを押すだけで、任意のテキスト入力…
★ 1 2026-06-23
音楽生成
GitHub
CodeBeats
「CodeBeats」は、ソースコードを音楽へと変換する革新的なツールです。独自の解析エンジンが関数のメロディ、ループ…
★ 1 MIT 2026-04-16
3D / NeRF
GitHub
gaussian-splatting-pytorch
このプロジェクトは、リアルタイムな新規視点合成を実現する最先端の「3D Gaussian Splatting」技術を、PyTorchのみ…
★ 1 MIT 2025-12-29
LLM
GitHub
CharacterForge-AI
CharacterForge AIは、ゲームデザイナーやアプリケーション開発者向けに、AWS上でAI搭載のゲームキャラクターを構築…
★ 1 NOASSERTION 2026-05-24
3D / NeRF
GitHub
Lid-Lab-NeRF
Lid-Lab-NeRFは、LiDAR点群の新しいスキャンを生成するためのPyTorchベースのNeRFフレームワークです。このツールは…
★ 1 Apache-2.0 2025-11-28
LLM
GitHub
TOKEN_BANK-manage-your-token-usage
TOKENBANKは、AIコーディングアシスタントのトークン使用量と費用を詳細に統計・管理するためのデスクトップアプリケ…
★ 1 2026-06-01
LLM
GitHub
contextcontrol
ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル(LLM)の利用、およびパッチワークフ…
★ 1 ⑂ 2 NOASSERTION 2026-05-31
音声生成 / TTS
GitHub
Open-Vox
OpenVoxは、選択したテキストをグローバルショートカットで読み上げる、オープンソースかつマルチOS対応のデスクトッ…
★ 1 NOASSERTION 2026-06-02
ASR / 音声認識
GitHub
BaltiVoice-ASR
BaltiVoice ASRは、バルティ語(チベット語族の低リソース言語)の音声をテキストに変換する初のAI音声認識(ASR)シ…
★ 1 MIT 2026-06-12
LLM
GitHub
teaching_llm_applications
本リポジトリは、ヨーク大学コンピュータサイエンス学部が提供する12週間の修士課程コース「大規模言語モデル — 内部…
★ 1 GPL-3.0 2026-06-25
ASR / 音声認識
GitHub
Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
マルチモーダル
GitHub
DeepNumberVision
DeepNumberVisionは、PyTorchとOpenCVで構築された深層学習コンピュータビジョンパイプラインです。ユーザーが描画ま…
★ 1 2026-05-30
マルチモーダル
GitHub
mlx-mtp
mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…
★ 1 Apache-2.0 2026-06-16
マルチモーダル
GitHub
blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15