3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
3D / NeRF GitHub sfm-monocular-reconstruction
このプロジェクトは、単一の画像シーケンスから3D再構築を行うための2つの主要なアプローチ、Structure from Motion …
★ 1 MIT 2026-04-27
ComfyUI GitHub ComfyUI-Image-Compress
ComfyUI用のカスタムノードで、JPEGまたはPNG形式での画像圧縮を可能にします。エンコード品質と出力スケールを独立…
★ 1 ⑂ 1 MIT 2026-04-07
ComfyUI GitHub mefaihomevideoai-worker
本リポジトリは、MEFAI画像から動画へのパイプラインにおけるホーム側のGPUワーカーです。クラウド上で画像から動画…
★ 1 Apache-2.0 2026-06-12
動画生成 GitHub WaveSpeedAI-Skills
WaveSpeedAI Skillsは、700以上のメディアモデルと290以上のOpenAI互換LLMを統合したWaveSpeedAI推論プラットフォー…
★ 1 MIT 2026-06-24
ComfyUI GitHub ComfyUI-Smart-Metadata-Reader
ComfyUI-Smart-Metadata-Readerは、ComfyUIで生成された画像のメタデータをインテリジェントに読み取るPython製のカ…
★ 1 2026-05-28
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
動画生成 GitHub manim-coding-skill
このツールは、AIエージェントがManimGLを使用して高品質なSTEM教育アニメーション動画を自動生成、レンダリング、結…
★ 1 ⑂ 1 MIT 2026-06-12
動画生成 GitHub littleorange-video-mcp
LittleOrange Video MCPは、Model Context Protocol(MCP)に基づく動画生成サーバーサイドツールです。Sora2、Veo3.…
★ 1 2026-06-04
AIエージェント GitHub yamtam-engine
YAMTAM ENGINEは、AIコーディングエージェントがリポジトリに損害を与えるのを防ぐための個人用エージェントOSです。…
★ 1 Apache-2.0 2026-06-25
動画生成 GitHub happy-horse-api
Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…
★ 1 MIT 2026-05-25
LLM GitHub model-monitor
「模型 API 监控工具」は、OpenAI、DeepSeek、MiMoなど、複数のモデルAPIの利用状況をリアルタイムで監視・管理する…
★ 1 MIT 2026-06-25
ComfyUI GitHub ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
ComfyUI GitHub ComfyUI-Selective-Sigma-Detailer
ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…
★ 1 ⑂ 3 MIT 2026-05-10
LLM GitHub pdf-analyzer
このツールは、PDF文書の内容に基づいた質問応答を可能にするRAG(検索拡張生成)システムです。PDFをアップロードす…
★ 1 2026-05-14
LLM GitHub Project-adam-v2
Synthesizer V2(Project Adam V2)は、MBTIプロファイルに基づいた4つのAIアクター間で複雑な会話をシミュレートし…
★ 1 MIT 2026-05-22
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
LLM GitHub contextcontrol
ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル(LLM)の利用、およびパッチワークフ…
★ 1 ⑂ 2 NOASSERTION 2026-05-31
マルチモーダル GitHub PrismRAG
PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…
★ 1 MIT 2026-06-20
音楽生成 GitHub Conditional-Music-Generation
このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…
★ 1 MIT 2026-05-12
AIエージェント GitHub orchestrate-skill
「orchestrate」は、Claude Code向けの脳と身体のオーケストレーションスキルです。Claudeを主要な推論者(脳)とし…
★ 1 MIT 2026-06-13
音声生成 / TTS GitHub meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
AIエージェント GitHub YutoTerashima
このGitHubリポジトリは、AI研究者である寺島悠斗氏の専門的なプロフィールと研究活動を紹介するものです。大規模言…
★ 1 MIT 2026-06-19
音楽生成 GitHub rl-beat-generation
このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…
★ 1 MIT 2026-05-10
ASR / 音声認識 GitHub VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25