3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
Clippos
Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…
★ 6 ⑂ 1 MIT 2026-04-26
画像生成
GitHub
codex-gpt-image-2-subscription
このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…
★ 6 ⑂ 2 MIT 2026-06-07
音声生成 / TTS
GitHub
chorus
Chorusは、YouTubeの長い動画コンテンツを効率的に消費するための画期的なツールです。YouTubeのURLまたは思想家の名…
★ 6 2026-04-25
音声生成 / TTS
GitHub
ghost-narrator
Ghost Narratorは、ブログや静的サイト向けに自己ホスト型のAI音声ナレーションを提供するツールです。ElevenLabsの…
★ 6 ⑂ 1 MIT 2026-06-15
音声生成 / TTS
GitHub
BridgeSpeak
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…
★ 6 ⑂ 2 MIT 2026-05-10
3D / NeRF
GitHub
higs
HiGSは、SIGGRAPH Asia 2025で発表された「Inverse Radiative Transport for Infrared Scenes with Gaussian Primiti…
★ 6 ⑂ 1 2026-06-09
マルチモーダル
GitHub
Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
ASR / 音声認識
GitHub
Live-Church-Captions
Church Capは、教会向けに開発されたオープンソースかつローカルファーストのリアルタイムキャプションアプリです。…
★ 6 MIT 2026-06-23
ComfyUI
GitHub
WavTTS-ComfyUI
WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…
★ 6 ⑂ 1 MIT 2026-06-04
画像生成
GitHub
nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
マルチモーダル
GitHub
AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 6 MIT 2026-06-12
3D / NeRF
GitHub
LandmarkDiff-public
LandmarkDiffは、単一の顔写真から美容整形手術後の予測画像を生成する革新的なツールです。解剖学的に条件付けされ…
★ 6 ⑂ 11 MIT 2026-05-01
マルチモーダル
GitHub
egobabyvlm
本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ(BabyView …
★ 6 NOASSERTION 2026-06-23
動画生成
GitHub
Agnes-AI-Platform
Agnes AI Platformは、Agnes AIのAPI(Agnes Image 2.1 FlashおよびAgnes Video V2.0)を利用した画像・動画生成のた…
★ 6 NOASSERTION 2026-06-25
ComfyUI
GitHub
MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 6 ⑂ 3 MIT 2026-06-04
音声生成 / TTS
GitHub
ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 6 ⑂ 1 MIT 2026-06-23
画像生成
GitHub
M2GenCO
M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…
★ 6 2026-05-26
3D / NeRF
GitHub
StoryCore-Engine
StoryCore Engineは、スクリプトから一貫性のある画像、動画、ストーリー、対話、空間オーディオを生成する、ローカ…
★ 6 ⑂ 1 MIT 2026-06-23
画像生成
GitHub
CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
音声生成 / TTS
GitHub
the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 6 ⑂ 1 MIT 2026-05-27
AIエージェント
GitHub
Local-Model
このツールは、Kali Linux上でQwen 2.5-7Bモデル(LM Studio経由)を活用する、完全にローカルで自律的なサイバーセ…
★ 6 ⑂ 2 MIT 2026-06-17
AIエージェント
GitHub
Hive
Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…
★ 6 MIT 2026-06-11
画像生成
GitHub
dbmsolver
DBMSolverは、高品質な画像間変換(Image-to-Image Translation)を実現するための、トレーニング不要な拡散ブリッジ…
★ 6 2026-06-05
音声生成 / TTS
GitHub
vocalis
Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…
★ 6 MIT 2026-05-21