3,630 repos GH 3,515 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音楽生成 GitHub reelsmith
AIを活用し、写真や動画のフォルダーから高解像度のハイライトリールを自動生成するコマンドラインツール「reelsmith…
★ 1 Apache-2.0 2026-06-16
画像生成 GitHub comfyui-amd-plug-and-play
miradorventus/comfyui-amd-plug-and-play は、AMD GPU(Ubuntu/Mint)上でComfyUIのセットアップと実行を大幅に簡素…
★ 1 2026-05-31
ASR / 音声認識 GitHub jarvis-local-ai
Jarvisは、Whisper、Qwen、Piper、Qdrantなどの技術を組み合わせた完全ローカルの音声AIアシスタントです。ウェイク…
★ 1 2026-05-31
ComfyUI GitHub niren-drama
泥人剧场 (Niren Drama) は、縦型ショートドラマ制作に特化したフルスタックAIプラットフォームです。このツールは、…
★ 1 MIT 2026-06-02
画像生成 GitHub prompt-caching
prompt-cachingは、AnthropicのClaude Code利用時にプロンプトを自動的にキャッシュ・再利用することで、トークン使…
★ 1 MIT 2026-06-25
マルチモーダル GitHub Tri-Sentinel-XAI
Tri-Sentinel XAIは、フィッシングURL、スパムテキスト、AI生成ディープフェイク画像を検出するマルチモーダルな説明…
★ 1 MIT 2026-06-13
音楽生成 GitHub midi-sketch
midi-sketchは、ルールベースでポップミュージックのMIDIスケッチを自動生成するC++17ライブラリです。WebAssemblyで…
★ 1 Apache-2.0 2026-06-07
画像生成 GitHub badhands_scorer
「Bad Hands Scorer」は、拡散モデルが生成する「奇妙な手」の画像を識別し、美的スコアを付与するための軽量な概念…
★ 1 2026-06-03
マルチモーダル GitHub easycomputewithgemma
このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン(iOS/Android)から自然言…
★ 1 2026-05-24
AIエージェント GitHub polaris
日本語の要約(200〜400文字、何ができるツールか・特徴・想定ユーザーを含める)
★ 1 AGPL-3.0 2026-06-26
AIエージェント GitHub deepscene
DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…
★ 1 MIT 2026-05-14
ASR / 音声認識 GitHub carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
3D / NeRF GitHub Marble-x-Nuke
「Marble x Nuke」は、Nuke 17+にWorld Labs Marble APIを統合したツールです。コンポジターやVFXアーティストは、テ…
★ 1 MIT 2026-05-11
マルチモーダル GitHub ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
LLM GitHub Conjugate-Purification-Dynamics
このリポジトリは、生成システムにおける「探索-利用」のジレンマを解決するための「共轭净化动力学 (CPD)」理論と、…
★ 1 MIT 2026-05-23
3D / NeRF GitHub comfyui-3D-viewport
ComfyUIワークフロー向けに設計された、ネイティブOpenGL 3Dビューポートです。物理カメラに忠実な表現が可能で、深…
★ 1 2026-05-15
ASR / 音声認識 GitHub Voxbee
Vox Beeは、Windows向けの無料オープンソース音声入力ソフトウェアです。whisper.cppを基盤とし、高速なローカル音声…
★ 1 GPL-3.0 2026-05-22
LLM GitHub Drishti
Drishtiは、コードとドキュメントの理解を深めるためのマルチモーダルなRAG(検索拡張生成)システムです。Tree-sitt…
★ 1 MIT 2026-06-01
音声生成 / TTS GitHub ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26
ASR / 音声認識 GitHub voice_input_tool
本ツールは、Windows向けの軽量な音声入力アシスタントです。フローティングボタンのクリックで録音を開始・停止し、…
★ 1 MIT 2026-06-09
3D / NeRF GitHub pose-from-silhouette
このリポジトリは、CVPR 2026に採択された「Globally Optimal Pose from Orthographic Silhouettes」の公式MATLAB実…
★ 1 AGPL-3.0 2026-06-03
画像生成 GitHub vision-studio
Vision Studio-Xは、ローカル環境で動作するAIを活用した画像および動画生成用のプロフェッショナルなデスクトップア…
★ 1 MIT 2026-06-21
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
3D / NeRF GitHub token-enhancer
Token Enhancerは、AIエージェントがWebページを読み込む際に、大量の無駄なトークンを消費する問題を解決するローカ…
★ 1 MIT 2026-06-25