3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ComfyUI GitHub mefaihomevideoai-worker
本リポジトリは、MEFAI画像から動画へのパイプラインにおけるホーム側のGPUワーカーです。クラウド上で画像から動画…
★ 1 Apache-2.0 2026-06-12
音声生成 / TTS GitHub beatbitch
「BeatBitch」は、Android、Windows、Linux、iOS (PWA)、Webで利用できる没入型リズム音声コーチです。本ツールは、…
★ 1 NOASSERTION 2026-05-31
3D / NeRF GitHub pose-from-silhouette
このリポジトリは、CVPR 2026に採択された「Globally Optimal Pose from Orthographic Silhouettes」の公式MATLAB実…
★ 1 AGPL-3.0 2026-06-03
画像生成 GitHub vision-studio
Vision Studio-Xは、ローカル環境で動作するAIを活用した画像および動画生成用のプロフェッショナルなデスクトップア…
★ 1 MIT 2026-06-21
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
3D / NeRF GitHub token-enhancer
Token Enhancerは、AIエージェントがWebページを読み込む際に、大量の無駄なトークンを消費する問題を解決するローカ…
★ 1 MIT 2026-06-25
音声生成 / TTS GitHub rvc-free-colab
rvc-free-colabは、古いGoogle Colab向けRVC学習ノートブックを、Python 3.12、numpy 2.x、torch 2.xといった最新のG…
★ 1 MIT 2026-06-02
3D / NeRF GitHub gsplat-mlx
gsplat-mlxは、Apple Silicon環境で3D Gaussian Splattingを高速に実行・開発するためのコアライブラリです。mlxのC+…
★ 1 MIT 2026-06-25
ASR / 音声認識 GitHub english-vocal-medical-terminology-mini
このリポジトリは、臨床文字起こしモデル、医療音声認識(STT)パイプライン、およびヘルスケア分野の会話型インター…
★ 1 NOASSERTION 2026-06-09
動画生成 GitHub multimodal-ai-content-pipeline
このツールは、単一のテキストプロンプトから、ポスター画像、ビデオクリップ、ナレーションを含むプロモーションコ…
★ 1 MIT 2026-06-10
ASR / 音声認識 GitHub slavex
「slaveX」は、3Dアパートにいるヒューマノイドに、音声やテキストで命令して自由に動かすことができるブラウザゲー…
★ 1 MIT 2026-06-11
LLM GitHub CodeFlowIQ
CodeFlowIQは、開発者が未知のコードベースを迅速に理解するのを助けるローカルファーストのリポジトリインテリジェ…
★ 1 MIT 2026-06-13
LLM GitHub seas
SEASとArgoは、AIの最前線で働くための補完的なシステムです。SEASはフロンティアのシグナルから「何が真実か」を探…
★ 1 NOASSERTION 2026-06-26
マルチモーダル GitHub easycomputewithgemma
このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン(iOS/Android)から自然言…
★ 1 2026-05-24
画像生成 GitHub seedream-4.5-api
APIDot経由のSeedream 4.5 APIは、ByteDance Seedの高度な画像生成・編集モデルSeedream 4.5を利用するためのプロダ…
★ 1 MIT 2026-05-25
画像生成 GitHub diffusion-models-from-scratch
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNIS…
★ 1 MIT 2026-05-08
音声生成 / TTS GitHub global-translation
このツールは、Googleの翻訳エンジンとMicrosoft Edge TTSを活用した、AI駆動型のリアルタイム言語翻訳アプリケーシ…
★ 1 2026-06-20
3D / NeRF GitHub UP.route
UP.routeは、ヴロツワフ生命環境科学大学の修士論文プロジェクトとして開発された3Dウェブジオポータルアプリケーシ…
★ 1 2026-06-26
3D / NeRF GitHub classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
AIエージェント GitHub txfence
txfenceは、EVM、Solana、Cosmosといった主要なブロックチェーン上で動作する自律エージェントの行動を安全に管理す…
★ 1 MIT 2026-05-19
ASR / 音声認識 GitHub easy-transcriber-stt
easy-transcriber-sttは、Windows向けのローカル音声文字起こしアプリケーションです。スピーチを自身のPC上でテキス…
★ 1 MIT 2026-06-29
LLM GitHub Enterprise-RAG-Intelligence
Enterprise RAG Intelligenceは、ゼロトラスト検索、RBAC強制、および根拠に基づいた生成を提供するセキュアなエンタ…
★ 1 MIT 2026-05-31
ComfyUI GitHub comfyui-runpod-agentic-nodes
ComfyUI Agentic workflow nodes (CRAG nodes)は、ComfyUI内でRunpod上のエージェントシステムを視覚的に設計、計画…
★ 1 MIT 2026-05-29
LLM GitHub Agentic-IRC-Bot
本ツールはPythonで開発されたエージェント型IRCボットです。LLMを中核に据え、ツール呼び出し、結果統合、長期記憶…
★ 1 MIT 2026-05-24