3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2211 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14
マルチモーダル GitHub pdf2md_skill
「PDF2MD」は、Claude Codeスキルとして提供されるPDFからMarkdownへの変換ツールです。特にカスタムフォント、埋め…
★ 1 MIT 2026-06-07
ComfyUI GitHub comfyui-weaver
comfyui-weaverは、Claude CodeがComfyUI(ローカルおよびComfy Cloud)を操作できるようにする自己完結型MCPサーバ…
★ 1 MIT 2026-06-11
音楽生成 GitHub MAZ-MUSIC
MAZは、AI音楽生成のための自己ホスト型ウェブアプリケーションです。ACE-Step 1.5基盤モデルを核とし、クリーンなブ…
★ 1 ⑂ 1 MIT 2026-06-15
音声生成 / TTS GitHub mlx-indextts-webui
このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…
★ 1 NOASSERTION 2026-05-20
3D / NeRF GitHub comfyui-3D-viewport
ComfyUIワークフロー向けに設計された、ネイティブOpenGL 3Dビューポートです。物理カメラに忠実な表現が可能で、深…
★ 1 2026-05-15
音楽生成 GitHub story-to-music
このツールは、トルコ語のテキスト(物語、コンセプト、下書きなど)をSunoやUdioといった音楽生成AI向けの音楽プロ…
★ 1 MIT 2026-05-23
マルチモーダル GitHub invoice-extractor
この「Invoice Extraction System」は、VLM(Vision Language Models)を活用して、請求書や領収書から構造化された…
★ 1 2026-06-07
LLM GitHub OracleBase
Oracleは、Agnoを基盤とした自律型AIコーディングエージェントです。CLIまたはWeb UIを通じて、コードの読み書き、編…
★ 1 MIT 2026-06-15
音楽生成 GitHub synt-audio
Auratuneは、Lofi Girlのような没入型体験にインスパイアされた、Lo-fiスタイルのデジタルコンテンツ作成システムで…
★ 1 2026-04-21
ASR / 音声認識 GitHub voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-25
ComfyUI GitHub comfyui-cloud-storage
comfyui-cloud-storageは、画像生成AIツールComfyUI用のカスタムノードパッケージです。ComfyUIで生成された画像、動…
★ 1 ⑂ 1 MIT 2026-05-06
ASR / 音声認識 GitHub ai-voice-assistant-nlp
このプロジェクトはPythonと自然言語処理(NLP)を活用したAI音声アシスタントです。音声コマンドを理解し、ウェブ検…
★ 1 2026-05-25
ComfyUI GitHub comfyui-cyberdelia-metadata
このツールは、ComfyUIの標準画像保存機能を拡張し、Civitaiと互換性のある詳細な画像メタデータ(シード、モデル、L…
★ 1 ⑂ 1 GPL-3.0 2026-05-26
ASR / 音声認識 GitHub zox-ai
Zox AIは、OllamaとLlama 3.1 8Bモデルを基盤とした、完全にオフラインで動作するWindows向けのAIデスクトップアシス…
★ 1 NOASSERTION 2026-06-10
音楽生成 GitHub musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
画像生成 GitHub GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
マルチモーダル GitHub whatfirst-small
whatfirst · smallは、タスクの優先順位付けを支援する、ローカルで動作する小型のビジョン言語モデル(Qwen2.5-VL-3…
★ 1 Apache-2.0 2026-06-19
音声生成 / TTS GitHub YOOS-APP
YOOS-APPは、ユーザー自身の執筆スタイルを学習し、その個性を保ったまま新しいコンテンツを生成するユニバーサルな…
★ 1 MIT 2026-06-05
画像生成 GitHub ideogram4-mps
Apple Silicon搭載Mac上で人気の画像生成モデルIdeogram 4を実行可能にするツールです。CUDAやNVIDIA GPUが不要で、M…
★ 1 MIT 2026-06-26
ASR / 音声認識 GitHub VoiceGPT
VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。ユーザーは「hello」というウェイクワードでア…
★ 1 MIT 2026-05-17
3D / NeRF GitHub hybrid-3d-human-reconstruction
RGB-Dカメラとグラフニューラルネットワーク、LSTM、確率的モーション推定を組み合わせた、リアルタイム動的3D人体再…
★ 1 MIT 2026-04-20
動画生成 GitHub mefaihomevideoai
MEFAI Home Video AIは、画像から動画を生成するエンドツーエンドのAIパイプラインです。高価なGPUをレンタルするこ…
★ 1 Apache-2.0 2026-06-25
ComfyUI GitHub master-canvas-hermes-plugin
Master Canvas Hermes Pluginは、AI動画プロジェクトのプリプロダクションキャンバスであるMaster CanvasのHermes Ag…
★ 1 MIT 2026-05-20