3,631 repos GH 3,516 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2215 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub vocalis
Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…
★ 6 MIT 2026-05-21
マルチモーダル GitHub CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 6 ⑂ 1 MIT 2026-05-19
画像生成 GitHub CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
画像生成 GitHub nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
画像生成 GitHub chatgpt-web-gen
このツールは、ChatGPT Plus/Pro/Teamアカウントを持つユーザー向けに、APIキーなしでChatGPT Webの画像生成機能を利…
★ 6 ⑂ 1 MIT 2026-06-07
LLM GitHub CRIMENET
CRIMENETは、世界中の犯罪組織間の同盟と敵対関係をマッピングしたオープンソースのデータベースおよびインタラクテ…
★ 6 MIT 2026-06-17
ComfyUI GitHub neuralforge
NeuralForgeは、ローカル環境で動作する自己ホスト型AI統合ダッシュボードです。LLMの管理、複数プラットフォームで…
★ 6 ⑂ 1 MIT 2026-03-26
画像生成 GitHub rocmroll
ComfyUI ROCmRollは、Windowsプラットフォーム向けのComfyUIインスタンス管理ツールです。AMD GPUとROCmパッケージに…
★ 6 MIT 2026-06-25
AIエージェント GitHub Local-Model
このツールは、Kali Linux上でQwen 2.5-7Bモデル(LM Studio経由)を活用する、完全にローカルで自律的なサイバーセ…
★ 6 ⑂ 2 MIT 2026-06-17
画像生成 GitHub spade
SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…
★ 6 MIT 2026-06-09
音声生成 / TTS GitHub the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 6 ⑂ 1 MIT 2026-05-27
ASR / 音声認識 GitHub ai_interview
このツールは、リアルタイム音声対話、多段階面接、ライブ採点、詳細レポート生成機能を備えたAI駆動型模擬面接プラ…
★ 6 2026-06-15
音声生成 / TTS GitHub claude-code-audio-recap
このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…
★ 6 Apache-2.0 2026-06-18
ComfyUI GitHub WavTTS-ComfyUI
WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…
★ 6 ⑂ 1 MIT 2026-06-04
3D / NeRF GitHub StoryCore-Engine
StoryCore Engineは、スクリプトから一貫性のある画像、動画、ストーリー、対話、空間オーディオを生成する、ローカ…
★ 6 ⑂ 1 MIT 2026-06-23
音声生成 / TTS GitHub ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 6 ⑂ 1 MIT 2026-06-23
画像生成 GitHub PiD-Image-Upscaler
PiD-Image-Upscalerは、NVIDIAのPiD(Pixel Diffusion Decoder)フレームワークを基盤とした、実験的な高機能超解像…
★ 6 ⑂ 2 Apache-2.0 2026-06-14
ASR / 音声認識 GitHub Live-Church-Captions
Church Capは、教会向けに開発されたオープンソースかつローカルファーストのリアルタイムキャプションアプリです。…
★ 6 MIT 2026-06-23
画像生成 GitHub dbmsolver
DBMSolverは、高品質な画像間変換(Image-to-Image Translation)を実現するための、トレーニング不要な拡散ブリッジ…
★ 6 2026-06-05
ASR / 音声認識 GitHub Clippos
Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…
★ 6 ⑂ 1 MIT 2026-04-26
マルチモーダル GitHub egobabyvlm
本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ(BabyView …
★ 6 NOASSERTION 2026-06-23
ComfyUI GitHub MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 6 ⑂ 3 MIT 2026-06-04
動画生成 GitHub Agnes-AI-Platform
Agnes AI Platformは、Agnes AIのAPI(Agnes Image 2.1 FlashおよびAgnes Video V2.0)を利用した画像・動画生成のた…
★ 6 NOASSERTION 2026-06-25
ComfyUI GitHub ComfyUI-Wildcard-Pipeline
ComfyUIのためのモジュール式プロシージャルプロンプト生成ツールです。ワイルドカード、固定値、結合、派生、制約を…
★ 6 ⑂ 2 GPL-3.0 2026-06-22