3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

LLM
GitHub
docintel
DocIntelは、RAG(検索拡張生成)技術を用いたAIドキュメントインテリジェンスシステムです。PDF、DOCX、TXT、Markdo…
★ 1 2026-06-23
画像生成
GitHub
grok-image-mcp
「Grok Image MCP」は、xAIの画像生成・編集サービス「Grok Imagine」をAIコーディングエージェント向けに提供するMC…
★ 1 MIT 2026-06-08
画像生成
GitHub
Text-conversion-to-handwritten-pictures
このツールは、テキストを手書き風の画像に変換するGUIアプリケーションです。複数のフォントやページ選択オプション…
★ 1 2026-06-09
マルチモーダル
GitHub
invoice-extractor
この「Invoice Extraction System」は、VLM(Vision Language Models)を活用して、請求書や領収書から構造化された…
★ 1 2026-06-07
LLM
GitHub
multi-agent-research-system
このマルチエージェントリサーチシステムは、ユーザーのクエリを受けて、ウェブから情報を収集・分析し、構造化され…
★ 1 ⑂ 1 2026-06-13
3D / NeRF
GitHub
telemetry-frame-mapper
本ツールは、DJIドローンで撮影された動画をGPS情報付きの3Dガウシアンスプラットへ変換する完全なパイプラインを提…
★ 1 MIT 2026-06-26
LLM
GitHub
pull-request-review
このツールは、GitHubのプルリクエストをAI(LLM)が自動的にレビューするGitHub Actionです。`codellama`などの指定…
★ 1 MIT 2026-06-18
AIエージェント
GitHub
deepscene
DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…
★ 1 MIT 2026-05-14
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
3D / NeRF
GitHub
Marble-x-Nuke
「Marble x Nuke」は、Nuke 17+にWorld Labs Marble APIを統合したツールです。コンポジターやVFXアーティストは、テ…
★ 1 MIT 2026-05-11
マルチモーダル
GitHub
ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
LLM
GitHub
CharacterForge-AI
CharacterForge AIは、ゲームデザイナーやアプリケーション開発者向けに、AWS上でAI搭載のゲームキャラクターを構築…
★ 1 NOASSERTION 2026-05-24
音楽生成
GitHub
ai-music-studio
ai-music-studioは、AMD ROCm環境で動作するローカルAIアルバム生成ツールです。単一のコンセプトからLLMによるアル…
★ 1 NOASSERTION 2026-04-26
ASR / 音声認識
GitHub
AI-Vision-Assistant-for-Real-Time-Face-Recognition
このツールは、AIを活用したリアルタイム顔認識アシスタントです。ウェブカメラを通じて既知の人物を識別し、音声フ…
★ 1 2026-05-10
3D / NeRF
GitHub
project_slam_gs3lam
GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM(…
★ 1 2026-04-04
画像生成
GitHub
anime-sd-mcp
anime-sd-mcpは、MCP(Model Context Protocol)サーバーとして機能し、AIクライアント(Claude Desktop、Claude Cod…
★ 1 MIT 2026-05-30
ComfyUI
GitHub
ComfyUI_RH_ZImageI2L
ComfyUI_RH_ZImageI2Lは、人気の画像生成UI「ComfyUI」を拡張するプラグインです。Z-Image-i2L機能をComfyUIに統合す…
★ 1 Apache-2.0 2026-06-25
画像生成
GitHub
vibe-brain
vibe-brainは、AIコーディングアシスタントがプロジェクトのコンテキストをセッション間で保持し、作業の効率性を高…
★ 1 ⑂ 1 MIT 2026-06-25
AIエージェント
GitHub
AgentLoopKit
AgentLoopKitは、Codex、Claude Code、Gemini CLIなどAIコーディングエージェントが生成したコードの品質と検証可能…
★ 1 MIT 2026-06-25
画像生成
GitHub
generative-modeling-scientific
このリポジトリは、科学計算タスクに適用されるスコアベースの生成モデルの研究用ベンチマークフレームワークです。…
★ 1 2026-06-13
ASR / 音声認識
GitHub
claude-baby
Claude Babyは、ハンズフリーで音声操作が可能なClaude Codeエージェントです。このツールはデスクトップペットとし…
★ 1 AGPL-3.0 2026-06-15
3D / NeRF
GitHub
TripoSplat
TripoSplatは、単一の2D画像から高品質な3Dガウスモデルを生成し、詳細な3D構造へと変換するツールです。アニメーシ…
★ 1 MIT 2026-06-26
音声生成 / TTS
GitHub
meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
音声生成 / TTS
GitHub
zotero-minimax-tts
「MiniMax SAPI5 TTS Bridge」は、クラウドまたはローカルのテキスト読み上げ(TTS)サービスが提供する音声を、Wind…
★ 1 MIT 2026-06-17