3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
NeuralSoundForge
NeuralSoundForgeは、StyleGAN2とセマンティック因数分解を駆使した高度な深層学習プラットフォームです。このツール…
★ 1 2026-02-06
ASR / 音声認識
GitHub
Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
ASR / 音声認識
GitHub
Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
音楽生成
GitHub
Conditional-Music-Generation
このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…
★ 1 MIT 2026-05-12
マルチモーダル
GitHub
-deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
LLM
GitHub
RoboGuard-RLAIF
このRoboGuardは、産業用ロボットUR10eのマニュアルに基づいた技術サポートを提供するエンタープライズRAGエージェン…
★ 1 2026-06-24
AIエージェント
GitHub
pi-context-pruner
pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…
★ 1 2026-05-30
動画生成
GitHub
WaveSpeedAI-Skills
WaveSpeedAI Skillsは、700以上のメディアモデルと290以上のOpenAI互換LLMを統合したWaveSpeedAI推論プラットフォー…
★ 1 MIT 2026-05-21
AIエージェント
GitHub
loom
loomは、耐久性のあるエージェント実行エンジン「Sibyl」のためのSlackフロントエンドです。Slackのメッセージやコマ…
★ 1 2026-05-25
ASR / 音声認識
GitHub
ai-voice-assistant-nlp
このプロジェクトはPythonと自然言語処理(NLP)を活用したAI音声アシスタントです。音声コマンドを理解し、ウェブ検…
★ 1 2026-05-25
マルチモーダル
GitHub
mllm-persona-evaluation
本ツールは、「都市センチメント認識のためのLLMエージェントにおけるペルソナの妥当性」に関する研究の公式実装です…
★ 1 CC-BY-4.0 2026-05-26
マルチモーダル
GitHub
ragonfire
RagOnFireは、Apple Silicon Mac向けに設計された完全ローカルなマルチモーダルRAG(検索拡張生成)システムです。Ol…
★ 1 MIT 2026-05-21
ComfyUI
GitHub
comfyui-Colab
このGitHubリポジトリは、Google Colab上でComfyUIとQwen-Image-Editモデルを簡単に展開・実行するためのインタラク…
★ 1 ⑂ 1 2026-06-06
マルチモーダル
GitHub
residuos_yolov11m_gemma3
このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…
★ 1 2026-06-13
音声生成 / TTS
GitHub
Easy-TTS-Toolkit
Easy TTS Toolkitは、音声合成(TTS)機能をPythonプロジェクトに手軽に組み込むためのツールキットです。開発者は、…
★ 1 MIT 2026-06-26
音声生成 / TTS
GitHub
echome
ECHOMEは、ユーザーの思考、音声、行動を高精度にクローンし自動化するオープンソースの個人AIミラーエンジンです。…
★ 1 MIT 2026-05-07
マルチモーダル
GitHub
clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
LLM
GitHub
argus-ai
Argusは、サプライチェーン、金融、ヘルスケアなどの高リスクな意思決定を支援する、多角的で説明可能、不確実性を考…
★ 1 Apache-2.0 2026-05-18
LLM
GitHub
tesm
TESM(Token-Entangled State Machine)は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革…
★ 1 MIT 2026-06-08
ASR / 音声認識
GitHub
VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
音声生成 / TTS
GitHub
MOSSlanding
MOSSlandingは、5秒程度の音声サンプルからあらゆる声をクローンできる世界最高峰の音声クローニングTTSツールです。…
★ 1 2026-06-05
音声生成 / TTS
GitHub
afterwords
Afterwordsは、ローカルで動作するボイスクローニングTTS(テキスト読み上げ)サーバーです。15秒のYouTubeクリップ…
★ 1 MIT 2026-06-20
3D / NeRF
GitHub
splat-slim
splat-slimは、3D Gaussian Splatting(3DGS)モデルを再トレーニングせずに軽量化するためのツールです。既存の.ply…
★ 1 MIT 2026-06-14
LLM
GitHub
transformer-roofline-analyzer
Transformer Roofline Analyzerは、Hugging FaceのTransformerモデル設定ファイルから、計算量(FLOPs)、メモリ帯域…
★ 1 MIT 2026-05-30