3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

画像生成
GitHub
hermes-lemonade-llm-image-support
このプラグインは、Hermesエージェント向けにLemonade Serverを介した高速なローカル画像生成とLLM利用を可能にしま…
★ 1 MIT 2026-06-03
3D / NeRF
GitHub
MultiBEST—Multiscale-Multiphase-Bridging-Experiment-and-Simulation-Toolkit
MultiBESTは、実験で得られた2D顕微鏡写真、2D/3D EBSDデータ、またはユーザーのスケッチから、原子レベルおよび連続…
★ 1 GPL-3.0 2026-06-09
AIエージェント
GitHub
skill-document-analysis
Document Analysisは、標準化された「識別→分解→評価→出力」プロセスを通じて、あらゆる種類のドキュメントを実行可…
★ 1 MIT 2026-06-15
LLM
GitHub
scrape-website-mcp
scrape-website-mcpは、ウェブサイトを高性能にスクレイピングし、クリーンなMarkdown形式でコンテンツを抽出するセ…
★ 1 MIT 2026-05-12
ASR / 音声認識
GitHub
VoiceGPT
VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。ユーザーは「hello」というウェイクワードでア…
★ 1 MIT 2026-05-17
音楽生成
GitHub
AI-Music-systems
このプロジェクトは、Hindustani古典音楽のラーガ(Bageshree, Khamaj, Bhoop)に特化したAI音楽生成システムです。M…
★ 1 2026-05-17
LLM
GitHub
knowshelf
「Knowshelf」は、Go言語で書かれた個人用Markdown書籍知識ベース管理ツールです。Markdown形式の書籍をローカルのSQ…
★ 1 Apache-2.0 2026-05-18
音声生成 / TTS
GitHub
Omnicut
OmniCutは、動画編集、音声ミキシング、写真編集、カラーグレーディング、AIを活用したコンテンツ作成機能を統合した…
★ 1 MIT 2026-05-21
音声生成 / TTS
GitHub
ComfyUI-Qwen3-TTS
ComfyUI-Qwen3-TTSは、テキストを音声に変換するシンプルなテキスト読み上げアプリケーションです。中国語、英語、日…
★ 1 2026-06-29
マルチモーダル
GitHub
vlm-from-scratch-v4
Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…
★ 1 MIT 2026-05-19
音声生成 / TTS
GitHub
RustyClaw
RustyClawは、Rustで実装されたClaude Code CLIで、コードベースの効率的なRAGインデックス作成、スマートなモデルル…
★ 1 Apache-2.0 2026-05-08
音楽生成
GitHub
musicgen-api
「MusicGen + Demucs API」は、テキストプロンプトからAI音楽を生成し、音源をボーカル、ドラム、ベースなどに分離す…
★ 1 ⑂ 1 MIT 2026-06-04
ComfyUI
GitHub
vfx-familiar
VFX Familiarは、ComfyUIを大規模なVFXプロダクションで利用する際の課題(アセット管理の複雑化、再現性の困難さ)…
★ 1 MIT 2026-04-30
音声生成 / TTS
GitHub
openclaw-fish-audio
Conan-Scott/openclaw-fish-audioは、OpenClaw向けのFish Audio TTS音声プロバイダプラグインです。高品質な音声クロ…
★ 1 ⑂ 1 MIT 2026-05-15
音声生成 / TTS
GitHub
hermes-weixin-voice
hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
agents-connector
agents-connectorは、Claude Code、Codex、Gemini CLIといったAIエージェント間の連携を可能にするローカルメッセー…
★ 1 MIT 2026-06-23
ASR / 音声認識
GitHub
stenographer
「stenographer」は、macOSネイティブの音声認識機能を活用したコマンドラインツールです。音声ファイルやライブマイ…
★ 1 2026-06-08
AIエージェント
GitHub
agentmd
AgentMDは、Claude Codeエージェントの監査、整理、安全なルーティングを支援するCLIおよびMCP(Claude Code)ベース…
★ 1 MIT 2026-05-31
ComfyUI
GitHub
comfyui-touch-numeric
「comfyui-touch-numeric」は、人気の画像生成AIツールComfyUIの数値入力ウィジェット(seedやINT/FLOAT値など)を、…
★ 1 ⑂ 1 MIT 2026-06-24
音楽生成
GitHub
Melodic-Intelligence-Layer
MIL(Melodic Intelligence Layer)は、ニューラルネットワークを使わずに数学理論に基づいたアルゴリズムによるピア…
★ 1 Apache-2.0 2026-04-05
AIエージェント
GitHub
OhMyAgent
OhMyAgentは、永続的な記憶システムを持つ自己ホスト型AIエージェントゲートウェイであり、セッション間で情報を忘れ…
★ 1 MIT 2026-06-26
動画生成
GitHub
seedance-2-api
Seedance 2 APIは、APIDotを通じて利用できる、ByteDance Seedが開発した高度なマルチモーダル動画生成モデルです。…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23