3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2208 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
Clippos
Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…
★ 6 ⑂ 1 MIT 2026-04-26
マルチモーダル
GitHub
Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
音声生成 / TTS
GitHub
vocalis
Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…
★ 6 MIT 2026-05-21
AIエージェント
GitHub
Local-Model
このツールは、Kali Linux上でQwen 2.5-7Bモデル(LM Studio経由)を活用する、完全にローカルで自律的なサイバーセ…
★ 6 ⑂ 2 MIT 2026-06-30
AIエージェント
GitHub
Deep-Research-104
このプロジェクトは、Web検索と高度な推論モデル(OpenAI o3、DeepSeek-R1、ローカルOllamaモデルなど)を組み合わせ…
★ 6 MIT 2026-06-05
動画生成
GitHub
ai-film-skills
AI Film Studioは、Claude Code向けに設計されたエンドツーエンドのAI映画制作エージェントスキルです。ストーリーボ…
★ 6 ⑂ 1 MIT 2026-05-05
ComfyUI
GitHub
comfyui-ai-studio
ComfyUI AI Studioは、AI画像、動画、音楽生成のためのワークフロー駆動型クリエイティブスタジオです。ComfyUIの強…
★ 6 ⑂ 1 MIT 2026-05-03
画像生成
GitHub
rocmroll
ComfyUI ROCmRollは、Windowsプラットフォーム向けのComfyUIインスタンス管理ツールです。AMD GPUとROCmパッケージに…
★ 6 MIT 2026-07-04
3D / NeRF
GitHub
4dgs-human-avatar-comfyui-nodes-dataset
このリポジトリは、ComfyUI向けの究極の4DGS(4D Gaussian Splatting)モジュール「Shramko-Volumetric-Bridge」と、…
★ 6 Apache-2.0 2026-06-19
音声生成 / TTS
GitHub
uttera-tts-hotcold
uttera-tts-hotcoldは、ハイブリッドな「Hot/Cold」ワーカーアーキテクチャとプラグ可能なバックエンド(Coqui XTTS-…
★ 6 ⑂ 2 Apache-2.0 2026-05-15
マルチモーダル
GitHub
egobabyvlm
本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ(BabyView …
★ 6 NOASSERTION 2026-06-23
マルチモーダル
GitHub
wgram-lm
W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…
★ 6 AGPL-3.0 2026-06-21
画像生成
GitHub
spade
SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…
★ 6 MIT 2026-06-09
音声生成 / TTS
GitHub
chorus
Chorusは、YouTubeの長い動画コンテンツを効率的に消費するための画期的なツールです。YouTubeのURLまたは思想家の名…
★ 6 2026-04-25
AIエージェント
GitHub
noah-gen3-type2
「noah-gen3-type2」は、コンテキスト管理、記憶閉ループ、自律進化を特徴とする汎用型AI認知アーキテクチャです。「…
★ 6 2026-06-24
3D / NeRF
GitHub
LandmarkDiff-public
LandmarkDiffは、単一の顔写真から美容整形手術後の予測画像を生成する革新的なツールです。解剖学的に条件付けされ…
★ 6 ⑂ 11 MIT 2026-05-01
音声生成 / TTS
GitHub
the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 6 ⑂ 1 MIT 2026-05-27
ASR / 音声認識
GitHub
ai_interview
このツールは、リアルタイム音声対話、多段階面接、ライブ採点、詳細レポート生成機能を備えたAI駆動型模擬面接プラ…
★ 6 2026-06-15
画像生成
GitHub
nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
ASR / 音声認識
GitHub
game_voice_trans
VoxGoは、PCゲームプレイヤー向けに開発されたオープンソースのリアルタイム音声翻訳フロートウィンドウツールです。…
★ 6 GPL-3.0 2026-06-29
マルチモーダル
GitHub
CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 6 ⑂ 1 MIT 2026-05-19
3D / NeRF
GitHub
higs
HiGSは、SIGGRAPH Asia 2025で発表された「Inverse Radiative Transport for Infrared Scenes with Gaussian Primiti…
★ 6 ⑂ 1 2026-06-09
LLM
GitHub
Claude-Agentic-Skills2.0-version
vignesh2027/Claude-Agentic-Skills2.0-versionは、Anthropic社のClaude AI向けの「AgentOS 2.0」として、135以上の…
★ 6 MIT 2026-05-20
画像生成
GitHub
PiD-Image-Upscaler
PiD-Image-Upscalerは、NVIDIAのPiD(Pixel Diffusion Decoder)フレームワークを基盤とした、実験的な高機能超解像…
★ 6 ⑂ 2 Apache-2.0 2026-06-14