3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2211 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音楽生成 GitHub synt-audio
Auratuneは、Lofi Girlのような没入型体験にインスパイアされた、Lo-fiスタイルのデジタルコンテンツ作成システムで…
★ 1 2026-04-21
ASR / 音声認識 GitHub voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-25
ComfyUI GitHub comfyui-cloud-storage
comfyui-cloud-storageは、画像生成AIツールComfyUI用のカスタムノードパッケージです。ComfyUIで生成された画像、動…
★ 1 ⑂ 1 MIT 2026-05-06
ASR / 音声認識 GitHub ai-voice-assistant-nlp
このプロジェクトはPythonと自然言語処理(NLP)を活用したAI音声アシスタントです。音声コマンドを理解し、ウェブ検…
★ 1 2026-05-25
ComfyUI GitHub comfyui-cyberdelia-metadata
このツールは、ComfyUIの標準画像保存機能を拡張し、Civitaiと互換性のある詳細な画像メタデータ(シード、モデル、L…
★ 1 ⑂ 1 GPL-3.0 2026-05-26
ASR / 音声認識 GitHub zox-ai
Zox AIは、OllamaとLlama 3.1 8Bモデルを基盤とした、完全にオフラインで動作するWindows向けのAIデスクトップアシス…
★ 1 NOASSERTION 2026-06-10
音楽生成 GitHub musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
画像生成 GitHub GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
マルチモーダル GitHub whatfirst-small
whatfirst · smallは、タスクの優先順位付けを支援する、ローカルで動作する小型のビジョン言語モデル(Qwen2.5-VL-3…
★ 1 Apache-2.0 2026-06-19
音声生成 / TTS GitHub YOOS-APP
YOOS-APPは、ユーザー自身の執筆スタイルを学習し、その個性を保ったまま新しいコンテンツを生成するユニバーサルな…
★ 1 MIT 2026-06-05
画像生成 GitHub ideogram4-mps
Apple Silicon搭載Mac上で人気の画像生成モデルIdeogram 4を実行可能にするツールです。CUDAやNVIDIA GPUが不要で、M…
★ 1 MIT 2026-06-26
ASR / 音声認識 GitHub VoiceGPT
VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。ユーザーは「hello」というウェイクワードでア…
★ 1 MIT 2026-05-17
3D / NeRF GitHub hybrid-3d-human-reconstruction
RGB-Dカメラとグラフニューラルネットワーク、LSTM、確率的モーション推定を組み合わせた、リアルタイム動的3D人体再…
★ 1 MIT 2026-04-20
動画生成 GitHub mefaihomevideoai
MEFAI Home Video AIは、画像から動画を生成するエンドツーエンドのAIパイプラインです。高価なGPUをレンタルするこ…
★ 1 Apache-2.0 2026-06-25
ComfyUI GitHub master-canvas-hermes-plugin
Master Canvas Hermes Pluginは、AI動画プロジェクトのプリプロダクションキャンバスであるMaster CanvasのHermes Ag…
★ 1 MIT 2026-05-20
音声生成 / TTS GitHub openclaw-fish-audio
Conan-Scott/openclaw-fish-audioは、OpenClaw向けのFish Audio TTS音声プロバイダプラグインです。高品質な音声クロ…
★ 1 ⑂ 1 MIT 2026-05-15
画像生成 GitHub EdgeDiffusion
EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…
★ 1 2026-06-07
AIエージェント GitHub traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
LLM GitHub RePrompT
RePrompTは、電子健康記録(EHR)データを大規模言語モデル(LLM)と統合するための、時間認識型LLMフレームワークの…
★ 1 Apache-2.0 2026-04-17
ASR / 音声認識 GitHub TEL-Voice-Controlled-Smart-Home-Assistant
このツールは、モジュール式のスマートホームアシスタントシステムです。React製のモダンなウェブインターフェースと…
★ 1 2026-06-05
画像生成 GitHub LoRA-Dataset-Coach
「LoRA-Dataset-Coach」は、SDXLやFlux、Wanなどの写真・動画モデル向けLoRAトレーニングデータセットの準備、検証、…
★ 1 NOASSERTION 2026-06-05
LLM GitHub opencode-research-mcp
このツールは、学術研究プロセスを効率化するために設計された軽量な研究用MCP(Modular Cognitive Processor)サー…
★ 1 MIT 2026-06-02
ASR / 音声認識 GitHub realtime-voice-ai-platform
リアルタイム音声AI顧客サポートプラットフォームは、音声認識(STT)、音声合成(TTS)、マルチエージェントオーケ…
★ 1 MIT 2026-06-10
画像生成 GitHub f1-physics-engine
F1物理エンジンは、F1レースにおける車の動きを言語指示に基づいてビデオ生成するAIツールです。開始フレームと「急…
★ 1 ⑂ 1 MIT 2026-06-06