3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI
GitHub
comfyui-prompt-editor
「comfyui-prompt-editor」は、ComfyUIの複数行プロンプトウィジェットをフルスクリーンでタッチ操作可能にするエデ…
★ 1 ⑂ 1 MIT 2026-06-13
ComfyUI
GitHub
vram8gb_comfyui_wan2.2
vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2(14…
★ 1 2026-06-25
画像生成
GitHub
Brain-MRI-Generation-and-Segmentation
このリポジトリは、膠芽腫セグメンテーションのための合成T1c脳MRIスキャン生成に関する修士論文に付随するものです…
★ 1 2026-06-09
マルチモーダル
GitHub
mlx-mtp
mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…
★ 1 Apache-2.0 2026-06-16
音声生成 / TTS
GitHub
speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
マルチモーダル
GitHub
clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
音楽生成
GitHub
synt-audio
Auratuneは、Lofi Girlのような没入型体験にインスパイアされた、Lo-fiスタイルのデジタルコンテンツ作成システムで…
★ 1 2026-04-21
画像生成
GitHub
TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
音声生成 / TTS
GitHub
ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26
画像生成
GitHub
Pic2Pic
EGFanTuan/Pic2Picは、Stable DiffusionとControlNetを基盤とした対話型の「草図から画像」生成ツールです。手書きの…
★ 1 2026-06-11
画像生成
GitHub
neural-flow-surrogates
「neural-flow-surrogates」は、多孔質媒体におけるCO₂/ブラインの二相流シミュレーションを高速化するためのニュー…
★ 1 MIT 2026-05-26
動画生成
GitHub
NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
ASR / 音声認識
GitHub
AKIRA-AI-Voice-Assistant
AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…
★ 1 2026-06-08
動画生成
GitHub
automate_me
「automate_me」は、YouTube動画制作を完全に自動化するフルスタックのウェブアプリケーションです。単一のダッシュ…
★ 1 MIT 2026-06-12
ASR / 音声認識
GitHub
voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14
LLM
GitHub
Enterprise-RAG-Intelligence
Enterprise RAG Intelligenceは、ゼロトラスト検索、RBAC強制、および根拠に基づいた生成を提供するセキュアなエンタ…
★ 1 MIT 2026-05-31
ASR / 音声認識
GitHub
Elderly-Care-Companion
Elderly Care Companionは、AIを活用した高齢者向けのヘルスアシスタントです。主な機能として、音声による症状記録…
★ 1 2026-06-09
AIエージェント
GitHub
pi-context-pruner
pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…
★ 1 2026-05-30
音声生成 / TTS
GitHub
hermes-weixin-voice
hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…
★ 1 MIT 2026-05-25
LLM
GitHub
yuri-os
Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー(DAG)を設計し、…
★ 1 2026-06-04
音声生成 / TTS
GitHub
lux-tts
LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…
★ 1 NOASSERTION 2026-05-10
LLM
GitHub
citeguard
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。本ツールは、…
★ 1 MIT 2026-05-28
ASR / 音声認識
GitHub
jarvis-local-ai
Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…
★ 1 2026-05-31
マルチモーダル
GitHub
Qwen-Image-Edit-Object-Manipulator
Qwen-Image-Edit-Object-Manipulatorは、画像内のオブジェクトを簡単かつ高精度に操作できるツールです。ロゴ、アク…
★ 1 ⑂ 1 Apache-2.0 2026-06-25