3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub VoiceOfIU
VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…
★ 1 Apache-2.0 2026-06-18
マルチモーダル GitHub tinyvlm-implementation
このリポジトリは、週末プロジェクトとしてゼロから構築されたVision-Language Model (VLM) の実装と、そのマルチGPU…
★ 1 2026-05-10
マルチモーダル GitHub uitars-mcp
UI-TARS MCPは、AIエージェントがデスクトップとウェブブラウザを操作するための「目と手」を提供するサーバーツール…
★ 1 Apache-2.0 2026-06-07
ComfyUI GitHub Comfyjot
ComfyJotは、ComfyUIのキャンバス上に直接手書きのメモや注釈を追加できるフロントエンド専用の拡張機能です。ワーク…
★ 1 ⑂ 1 MIT 2026-04-05
動画生成 GitHub 3blue1brown
このプロジェクトは、自然言語の記述からAI(GPT-5.1 Codex Max)がManimコードを生成し、教育的なアニメーション動…
★ 1 2026-05-21
画像生成 GitHub comfyui-character-picker
「ComfyUI Character Picker」は、ComfyUIのカスタムノードとして機能し、9500以上の膨大なアニメ/ゲームキャラクタ…
★ 1 ⑂ 1 MIT 2026-06-04
3D / NeRF GitHub gsplat-mlx
gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…
★ 1 MIT 2026-06-25
AIエージェント GitHub cell-mem
Cell-memは、AIエージェント向けに脳にインスパイアされた多層的な永続メモリシステムです。作業記憶、エピソード記…
★ 1 MIT 2026-06-09
動画生成 GitHub multimodal-ai-content-pipeline
このツールは、単一のテキストプロンプトから、ポスター画像、ビデオクリップ、ナレーションを含むプロモーションコ…
★ 1 MIT 2026-06-10
LLM GitHub KnowledgeBase
KnowledgeBaseは、ばらばらのメモを構造化された個人用Wikiに変換し、知識管理を支援するツールです。LLMを活用して…
★ 1 Apache-2.0 2026-06-26
ASR / 音声認識 GitHub dreamjournal-bot
「Dream Journal Bot」は、Telegramプラットフォームで動作する革新的な夢日記ボットです。本ボットの最大の特徴は、…
★ 1 2026-06-18
マルチモーダル GitHub clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
ComfyUI GitHub comfyui-runpod-agentic-nodes
ComfyUI Agentic workflow nodes (CRAG nodes)は、ComfyUI内でRunpod上のエージェントシステムを視覚的に設計、計画…
★ 1 MIT 2026-05-29
ASR / 音声認識 GitHub resilient-stt
Resilient STTは、OpenAI互換のASR(自動音声認識)エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…
★ 1 ⑂ 1 GPL-3.0 2026-05-25
音声生成 / TTS GitHub MOSSlanding
MOSSlandingは、5秒程度の音声サンプルからあらゆる声をクローンできる世界最高峰の音声クローニングTTSツールです。…
★ 1 2026-06-05
3D / NeRF GitHub token-enhancer
Token Enhancerは、AIエージェントがWebページを読み込む際に、大量の無駄なトークンを消費する問題を解決するローカ…
★ 1 MIT 2026-06-25
3D / NeRF GitHub Cosmo3DFlow
Cosmo3DFlowは、初期宇宙の初期条件を現在の観測データから再構築するためのツールです。3Dウェーブレットフローマッ…
★ 1 MIT 2026-06-12
画像生成 GitHub DESIGNOSFORGE
DESIGNOSFORGEは、AIデザインにおける視覚的な問題を解決し、統制されたデザインワークフローを実現するオープンソー…
★ 1 MIT 2026-06-19
3D / NeRF GitHub MultiBEST—Multiscale-Multiphase-Bridging-Experiment-and-Simulation-Toolkit
MultiBESTは、実験で得られた2D顕微鏡写真、2D/3D EBSDデータ、またはユーザーのスケッチから、原子レベルおよび連続…
★ 1 GPL-3.0 2026-06-09
マルチモーダル GitHub loop-antigravity
loop-antigravityは、Google Antigravity (agy CLI) とGeminiの1Mトークンコンテキストおよびマルチモーダル推論能力…
★ 1 Apache-2.0 2026-06-14
音声生成 / TTS GitHub nemoflix-studio
Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…
★ 1 Apache-2.0 2026-06-16
ASR / 音声認識 GitHub voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14
LLM GitHub Enterprise-RAG-Intelligence
Enterprise RAG Intelligenceは、ゼロトラスト検索、RBAC強制、および根拠に基づいた生成を提供するセキュアなエンタ…
★ 1 MIT 2026-05-31
ASR / 音声認識 GitHub Elderly-Care-Companion
Elderly Care Companionは、AIを活用した高齢者向けのヘルスアシスタントです。主な機能として、音声による症状記録…
★ 1 2026-06-09