3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

画像生成
GitHub
awesome-ai-image-prompts
このリポジトリは、GPT-Image-2、Nano Banana、Seedance、Qwen-VL、Gemini ImagenなどのAI画像生成モデル向けの、955…
★ 3 ⑂ 2 Apache-2.0 2026-05-26
画像生成
GitHub
cover-xiaohongshu
「cover-xiaohongshu」は、小紅書(Xiaohongshu)のカバー画像を生成およびレイアウトを分析するためのCodex/Claude …
★ 3 MIT 2026-05-28
音声生成 / TTS
GitHub
kokoro-server
「kokoro-infer」は、高速で軽量なKokoro-82M TTS(Text-to-Speech)推論エンジンおよびサーバーです。CPU、CUDA、そ…
★ 3 2026-05-31
マルチモーダル
GitHub
mimo-code
MiMo-Codeは、MiMoモデルファミリー専用のネイティブデスクトップコーディングエージェントです。WindowsおよびmacOS…
★ 3 MIT 2026-06-15
音声生成 / TTS
GitHub
node-webrtc-rust
node-webrtc-rustは、Node.jsでリアルタイム音声エージェントを構築するためのRustネイティブWebRTCスタックです。電…
★ 3 2026-06-26
AIエージェント
GitHub
claude-code-goal-mode
このツールは、Anthropic Claude Code向けの「/goal」コマンドを拡張したものです。階層的な計画ツリー(スプリント→…
★ 3 ⑂ 1 MIT 2026-05-13
ASR / 音声認識
GitHub
astrbot_plugin_volcengine_asr
本ツールは、AstrBot向けの火山引擎豆包语音ASRプラグインです。QQおよびNapCatからの音声メッセージをテキストに変…
★ 3 2026-05-13
マルチモーダル
GitHub
kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
AIエージェント
GitHub
thesis
THESISは、X(旧Twitter)上のトークンに関する論文を評価し、Baseチェーンで自動的に取引を行う自律型AI委員会です…
★ 3 MIT 2026-06-05
動画生成
GitHub
awesome-wam-2026
このリポジトリは、World Action Model (WAM) に関する2026年版の分類済み研究論文索引です。4つの主要な調査論文と7…
★ 3 2026-05-29
音声生成 / TTS
GitHub
voice-to-text
CogNativeは、既存の声をクローンし、その声で別の言語の音声を生成できる翻訳音声合成ツールです。GUIとCLIの両方を…
★ 3 2026-05-13
ASR / 音声認識
GitHub
Gstrl
GstrlはmacOS 14+向けの画期的なユーティリティで、ジェスチャー、音声、AIエージェントを組み合わせた直感的な操作…
★ 3 ⑂ 1 MIT 2026-05-20
音声生成 / TTS
GitHub
tube-assistant
TubeAssistantは、YouTubeチャンネルの運営を完全に自動化するツールです。AIがチャンネル分析に基づいてスクリプト…
★ 3 MIT 2026-06-12
ComfyUI
GitHub
ComfyUI-ResizeToCanvasSize
ComfyUI-ResizeToCanvasSizeは、ComfyUI用のカスタムノードパックで、画像を任意のキャンバスサイズに正確にリサイズ…
★ 3 ⑂ 1 MIT 2026-04-16
画像生成
GitHub
Preserve-and-Personalize
本リポジトリは、ICLR2026で発表された「Preserve and Personalize: Personalized Text-to-Image Diffusion Models w…
★ 3 ⑂ 1 MIT 2026-05-22
3D / NeRF
GitHub
Medical-Imaging-Analysis
「Medical Imaging Analysis」は、MATLABで開発された医療画像解析のポートフォリオプロジェクトで、多次元レジスト…
★ 3 2026-04-22
音声生成 / TTS
GitHub
mellifluous
mellifluousは、Markdown形式のテキストを構造やインラインコンテンツを考慮し、自然な間合いで読み上げるツールです…
★ 3 MIT 2026-06-22
LLM
GitHub
whatifd
whatifdは、LLM(大規模言語モデル)システムにおけるプロンプト、モデル、ツールの変更がもたらす影響を客観的に評…
★ 3 ⑂ 1 Apache-2.0 2026-06-22
動画生成
GitHub
imagine-mcp
「imagine-mcp」は、Google Gemini、OpenAI、Grokといった主要なAIモデルを横断し、画像や動画の理解および生成を可…
★ 3 MIT 2026-06-24
画像生成
GitHub
pixeltamer-gpt-image-skill
「pixeltamer」は、Claude Code、Codex CLI、OpenCode、Cursorなど50以上のAIコーディングエージェント向けに設計さ…
★ 3 MIT 2026-06-17
ASR / 音声認識
GitHub
tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
画像生成
GitHub
Diffusion-Zero-to-Hero
本リポジトリは、拡散モデルをゼロから体系的に学ぶための中国語実践コースです。DDPM、DDIM、Hugging Face Diffuser…
★ 3 Apache-2.0 2026-05-21
マルチモーダル
GitHub
OmniMemo
OmniMemoは、MiMo V2.5 全スタックモデルを基盤とした多モーダル会議インテリジェントエージェントです。最大の特長…
★ 3 MIT 2026-06-01