3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-06-30
動画生成
GitHub
mmx-mcp-server
mmx-mcp-serverは、MiniMaxの全モダリティ(テキスト、検索、画像理解、画像生成、音声合成、動画生成、音楽生成、配…
★ 31 ⑂ 8 MIT 2026-04-17
LLM
GitHub
MindBase
Bilibiliのお気に入り動画やクラウド文書をチャット可能な個人知識ベースへと変換するツールです。動画の音声認識(A…
★ 31 ⑂ 1 MIT 2026-06-28
ComfyUI
GitHub
comfy-swap
Comfy-Swapは、ComfyUIの複雑なワークフローを安定したREST APIエンドポイントやCLIコマンドに変換するツールです。A…
★ 31 ⑂ 8 MIT 2026-03-30
ASR / 音声認識
GitHub
FastWord
FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…
★ 31 ⑂ 3 2026-05-23
画像生成
GitHub
gpt-image-2-webui
ImgX Studioは、GPT ImageおよびOpenAI互換の画像APIに対応した、洗練されたセルフホスト型WebUIです。デザイナー、…
★ 31 ⑂ 5 2026-04-27
AIエージェント
GitHub
Orkas
Orkasは、AIエージェントのチームを構築し、単一のチャットインターフェースで指揮できるオープンソースのデスクトッ…
★ 31 ⑂ 8 MIT 2026-06-24
ComfyUI
GitHub
ComfyUI-Janus_pro_vision
ComfyUI上でDeepSeek AIのJanus-Pro-7Bを使えるようにするカスタムノード拡張です。1枚または2枚の画像を入力し、詳…
★ 31 ⑂ 1 MIT 2025-03-20
動画生成
GitHub
Awesome-Agent-Based-Low-Level-Vision
本リポジトリは、自律エージェントや(M)LLMエージェントを用いた低レベル画像処理(画像修復、画像編集、超解像など…
★ 30 ⑂ 4 MIT 2026-06-15
ComfyUI
GitHub
comfyui-llm-node-for-amazon-bedrock
このリポジトリは、Amazon Bedrockの基盤モデルをComfyUIのワークフロー内から呼び出せるカスタムノード集です。Bedr…
★ 30 ⑂ 17 MIT-0 2025-03-07
音声生成 / TTS
GitHub
speech-studio
Speech Studioは、コンテンツクリエイター向けのオープンソースのデスクトップアプリケーションです。短い音声クリッ…
★ 30 ⑂ 5 Apache-2.0 2026-07-02
LLM
GitHub
obsidian-vault-agent
Obsidian Vault Agentは、Obsidianユーザー向けのClaude Codeプラグインです。AIエージェントの能力を活用し、書籍、…
★ 30 ⑂ 3 MIT 2026-03-30
LLM
GitHub
pinrule
pinruleは、AIが長時間のタスク中に当初の目的から逸脱しないように、5〜10個の重要なルールを設定できる普遍的なAI…
★ 30 ⑂ 1 MIT 2026-05-19
ComfyUI
GitHub
ComfyUI_GradientDeepShrink
ComfyUI向けの拡張ノードで、既定のPatchModelAddDownscaleを発展させ、モデル内の特定ブロックに対するダウンスケー…
★ 30 ⑂ 5 2024-05-22
ComfyUI
GitHub
ComfyUI-MakeFrame
MakeFrameは、ComfyUI向けに動画やアニメーションをフレーム単位で扱いやすくするカスタムノード集です。OpenCVで処…
★ 30 ⑂ 8 MIT 2024-05-22
マルチモーダル
GitHub
CanvasChat
CanvasChatは、Google GeminiのCanvasプレビューモードに特化した、Gemini 3 Flashモデルを無料で大量に利用できるチ…
★ 30 ⑂ 7 MIT 2026-05-22
音声生成 / TTS
GitHub
jarvis-v3
Jarvis v3は、Apple Silicon Mac向けに設計された、Claude Codeを完全ローカルで音声操作するためのインターフェース…
★ 30 ⑂ 2 2026-03-24
3D / NeRF
GitHub
iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
ComfyUI
GitHub
ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
LLM
GitHub
awaek
X(旧Twitter)で保存したブックマークをパーソナルAIとして活用できるツールです。散逸しがちな保存投稿を「チャッ…
★ 29 ⑂ 2 2026-05-24
音声生成 / TTS
GitHub
supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
ASR / 音声認識
GitHub
VoiceInput
VoiceInputは、macOS向けの軽量で直感的なメニューバー音声入力ツールです。右Commandキーを押しながら話すだけで、…
★ 29 ⑂ 1 GPL-3.0 2026-07-04
ASR / 音声認識
GitHub
watch-video-skill
このスキルは、Claude AIに動画を「視聴」させ、タイム同期された文字起こしと自動スケーリングされた静止画を組み合…
★ 29 ⑂ 2 MIT 2026-04-30