3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
omni-retrieval
omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…
★ 2 Apache-2.0 2026-06-08
ASR / 音声認識
GitHub
speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-26
AIエージェント
GitHub
job-copilot
プログラマー向けのAI面接コーチツール「JobCopilot」は、ユーザーが作成したMarkdown形式の技術ノートをプライベー…
★ 2 MIT 2026-05-24
ASR / 音声認識
GitHub
TermSub
TermSubは、AIを活用して動画コンテンツの文字起こし、翻訳、専門用語管理を行うFastAPIアプリケーションです。マル…
★ 2 MIT 2026-07-01
LLM
GitHub
AI-Hiring-OS
AI Hiring OSは、候補者のスクリーニングから従業員管理までを統合した、次世代のマルチテナント型採用・HRMSプラッ…
★ 2 MIT 2026-06-10
音声生成 / TTS
GitHub
lingo-agent
LINGOは、中小企業向けに設計されたベータ版のAI電話エージェントバックエンドです。リアルな電話番号を持ち、永続的…
★ 2 2026-06-18
画像生成
GitHub
adafactor-8bit
このツールは、融合CUDAカーネルと対数空間ブロック単位量子化を特徴とする8ビットAdafactorオプティマイザです。LLM…
★ 2 MIT 2026-06-24
音声生成 / TTS
GitHub
tianyan-tts-mobile
「天眼 TTS Mobile」は、軽量なAndroid WebViewブラウザアプリです。PaseoやZCodeの遠隔操作ページ、あるいは一般的…
★ 2 MIT 2026-06-16
3D / NeRF
GitHub
mobile-gs-scan
Pebbleは、高価な3Dスキャンサービスに代わる、NVIDIA製GPUユーザー向けのセルフホスト型3Dスキャンスタジオです。We…
★ 1 2026-05-15
LLM
GitHub
Multi-Agent-Data-Analytics
本プロジェクトは、マルチエージェントアーキテクチャとRAG(検索拡張生成)システム、GoogleのGeminiモデルを組み合…
★ 1 Apache-2.0 2026-05-15
LLM
GitHub
Conjugate-Purification-Dynamics
このリポジトリは、生成システムにおける「探索-利用」のジレンマを解決するための「共轭净化动力学 (CPD)」理論と、…
★ 1 MIT 2026-05-23
音楽生成
GitHub
anvil-audio
Anvil Audioは、AIオーディオ生成のためのプラグ可能なスタジオツールであり、Stability AIの`stable-audio-tools`を…
★ 1 MIT 2026-05-13
LLM
GitHub
Drishti
Drishtiは、コードとドキュメントの理解を深めるためのマルチモーダルなRAG(検索拡張生成)システムです。Tree-sitt…
★ 1 MIT 2026-06-01
マルチモーダル
GitHub
mllm-persona-evaluation
本ツールは、「都市センチメント認識のためのLLMエージェントにおけるペルソナの妥当性」に関する研究の公式実装です…
★ 1 CC-BY-4.0 2026-05-26
マルチモーダル
GitHub
qwen-visual-training-lab
「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…
★ 1 2026-05-15
画像生成
GitHub
anime-sd-mcp
anime-sd-mcpは、MCP(Model Context Protocol)サーバーとして機能し、AIクライアント(Claude Desktop、Claude Cod…
★ 1 MIT 2026-05-30
音楽生成
GitHub
Melodic-Intelligence-Layer
MIL(Melodic Intelligence Layer)は、ニューラルネットワークを使わずに数学理論に基づいたアルゴリズムによるピア…
★ 1 Apache-2.0 2026-04-05
動画生成
GitHub
drama-cc
「drama-cc」は、Claude Codeのスラッシュコマンドとして機能するAIツールです。40秒の短編AIソープオペラ動画を生成…
★ 1 MIT 2026-05-13
ASR / 音声認識
GitHub
Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
ASR / 音声認識
GitHub
voiceintake
「VoiceIntake」は、AIを活用して患者の音声問診を自動化するシステムです。患者が話すだけでAIが問診内容を瞬時に文…
★ 1 2026-06-16
マルチモーダル
GitHub
easycomputewithgemma
このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン(iOS/Android)から自然言…
★ 1 2026-05-24
LLM
GitHub
local-ai-lab
「local-ai-lab」は、RAG (Retrieval Augmented Generation)、MCP (Model Context Protocol)、LangChain、LangGraph…
★ 1 MIT 2026-06-20
ASR / 音声認識
GitHub
panakoes
Panakoesは、音声のキャプチャ、文字起こし、AIによるインサイト抽出を提供するオープンソースのクラウドプラットフ…
★ 1 MIT 2026-06-29