3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

動画生成
GitHub
wan2.2-i2v-fast
wan2.2-i2v-fastは、14BパラメータのWan-AI/Wan2.2-I2V-A14B-Diffusersモデルを活用した、実験的かつ高度に最適化さ…
★ 5 ⑂ 1 Apache-2.0 2026-06-15
音声生成 / TTS
GitHub
qwen3-tts-spanish-voices
このツールは、Qwen3-TTSを利用してスペイン語のテキスト読み上げ(TTS)機能を提供します。Apple Silicon搭載のMac…
★ 5 ⑂ 2 MIT 2026-06-21
画像生成
GitHub
CUIG
CUIGは、テキストから画像を生成する拡散モデルにおける概念忘却の研究コードベースです。本リポジトリは、独立、シ…
★ 5 MIT 2026-06-12
ComfyUI
GitHub
ComfyUI-Flow-Assistor
ComfyUI-Flow-Assistorは、ComfyUIのワークフローを効率化するための必須ユーティリティノード集です。このツールは…
★ 5 ⑂ 2 MIT 2026-05-14
AIエージェント
GitHub
AgentRearrange-Paper
AgentRearrangeは、Swarmsフレームワーク向けの汎用マルチエージェントオーケストレーションプリミティブです。本ツ…
★ 5 ⑂ 1 Apache-2.0 2026-06-04
画像生成
GitHub
image2tools
Image2Toolsは、GPT Image 2、GeminiベースのNano Banana 3など多様なAI画像モデルに対応した、使いやすいオールイン…
★ 5 MIT 2026-06-25
3D / NeRF
GitHub
Future-Droidux
Future Droiduxは、動き、知能、適応型インターフェースデザインの交差点を探索する次世代の没入型Web体験です。人間…
★ 5 2026-05-21
LLM
GitHub
Scraper
Deep Web Scraperは、サイバーセキュリティ研究者、脅威インテリジェンスアナリスト、プライバシー擁護者を対象とし…
★ 5 ⑂ 1 GPL-3.0 2026-05-02
LLM
GitHub
mini-rag
miniRは、AIエージェント向けの軽量でセルフホスト型のRAG(検索拡張生成)検索バックエンドです。Markdown、Word、P…
★ 5 ⑂ 1 MIT 2026-06-02
マルチモーダル
GitHub
multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
ASR / 音声認識
GitHub
wisprflow-sdk
WisprFlow SDKは、Wispr Flowデスクトップクライアントの非公式Python SDKです。Wispr Flowの音声APIをリバースエン…
★ 5 ⑂ 1 MIT 2026-06-09
LLM
GitHub
mosaic
Mosaicは、AIエージェントの記憶をローカル環境で効率的かつ安全に管理するためのMCP(Model Context Protocol)サー…
★ 5 MIT 2026-06-04
ASR / 音声認識
GitHub
VibeRave
VibeRaveは、人気のあるライブコーディング環境Strudelを基盤とし、音声、テキスト、ワンクリックプリセットといった…
★ 5 AGPL-3.0 2026-05-20
LLM
GitHub
agentic-workspace-core
このツールは、Daaaaave/agentic-workspace-coreという、コーディングエージェントのためのポータブルなワークスペー…
★ 5 MIT 2026-06-11
LLM
GitHub
OpenMetaMate
MetaMateは、LLM(大規模言語モデル)を活用し、PDFからのデータ抽出を効率化するAIアシストツールです。系統的レビ…
★ 5 NOASSERTION 2026-06-20
ASR / 音声認識
GitHub
Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
LLM
GitHub
tensor-serve
tensor-serveは、OpenAI互換AI向けのZIMベースの検索拡張プロキシです。KiwixのOPDSカタログからZIMドキュメントをダ…
★ 5 MIT 2026-05-11
画像生成
GitHub
gpt-magazine-portrait-workflow
このプロジェクトは、Codexの画像生成能力とGPT Imageの基準を活用し、人物の雑誌写真風画像を生成するワークフロー…
★ 5 MIT 2026-06-08
音声生成 / TTS
GitHub
voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
画像生成
GitHub
reward-guidance
このツールは「Are we really tilting?」論文の実験コードで、フロー・拡散モデルにおける報酬ガイダンスのメカニズ…
★ 5 ⑂ 1 MIT 2026-05-07
ASR / 音声認識
GitHub
PARSE
PARSEは、記述言語学のフィールドワークと、それに続く比較分析を支援するブラウザベースのワークステーションです。…
★ 5 MIT 2026-06-18