3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub tts-vue-next
「TTS Vue Next」は、Microsoft Edge TTSサービスを利用した、デスクトップ向けのテキスト読み上げ(TTS)アプリケー…
★ 32 ⑂ 1 2026-04-24
ComfyUI GitHub Comfyui-anima-sampler
ComfyUI Anima Flow Corrective Samplerは、ComfyUI用のカスタムサンプラーノードで、AnimaおよびCosmosスタイルの画…
★ 32 ⑂ 2 MIT 2026-06-10
画像生成 GitHub RTDMD
RTDMD(Reward-Tilted Distribution Matching Distillation)は、少ないステップ数で高品質な画像を生成する「few-st…
★ 32 ⑂ 1 Apache-2.0 2026-06-06
画像生成 GitHub HainTag
HainTag(海茵的标签工坊)は、AI描画のためのタグ生成、管理、ワークフローを統合したWindowsデスクトップアプリケ…
★ 32 ⑂ 1 GPL-3.0 2026-06-12
LLM GitHub dejavu
Deja Vuは、AIエージェントやアシスタント向けに設計されたローカルファーストのAI記憶システムです。AIツール間で失…
★ 32 ⑂ 3 Apache-2.0 2026-06-11
音声生成 / TTS GitHub wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
AIエージェント GitHub Orkas
Orkasは、AIエージェントのチームを構築し、単一のチャットインターフェースで指揮できるオープンソースのデスクトッ…
★ 31 ⑂ 8 MIT 2026-06-24
画像生成 GitHub gpt-image-2-webui
ImgX Studioは、GPT ImageおよびOpenAI互換の画像APIに対応した、洗練されたセルフホスト型WebUIです。デザイナー、…
★ 31 ⑂ 5 2026-04-27
ASR / 音声認識 GitHub FastWord
FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…
★ 31 ⑂ 3 2026-05-23
ComfyUI GitHub Dots-TTS-ComfyUI
このツールは、ComfyUI向けのカスタムノードコレクションであり、Dots TTSによる高品質なテキスト音声合成、音声クロ…
★ 31 ⑂ 3 Apache-2.0 2026-06-11
動画生成 GitHub mmx-mcp-server
mmx-mcp-serverは、MiniMaxの全モダリティ(テキスト、検索、画像理解、画像生成、音声合成、動画生成、音楽生成、配…
★ 31 ⑂ 8 MIT 2026-04-17
LLM GitHub synaptic-memory
Synaptic Memoryは、LLMエージェント向けの脳にインスパイアされた知識グラフとMCP(Multi-hop Chain of Thought)ツ…
★ 31 ⑂ 1 NOASSERTION 2026-06-18
LLM GitHub MindBase
Bilibiliのお気に入り動画やクラウド文書をチャット可能な個人知識ベースへと変換するツールです。動画の音声認識(A…
★ 31 ⑂ 1 MIT 2026-06-23
ASR / 音声認識 GitHub openquack
OpenQuackはmacOS向けの音声文字変換メニューバーアプリです。ホットキーを押して話すだけで、話した内容がカーソル…
★ 31 ⑂ 5 MIT 2026-06-29
動画生成 GitHub Awesome-Agent-Based-Low-Level-Vision
本リポジトリは、自律エージェントや(M)LLMエージェントを用いた低レベル画像処理(画像修復、画像編集、超解像など…
★ 30 ⑂ 4 MIT 2026-06-15
LLM GitHub pinrule
pinruleは、AIが長時間のタスク中に当初の目的から逸脱しないように、5〜10個の重要なルールを設定できる普遍的なAI…
★ 30 ⑂ 1 MIT 2026-05-19
マルチモーダル GitHub CanvasChat
CanvasChatは、Google GeminiのCanvasプレビューモードに特化した、Gemini 3 Flashモデルを無料で大量に利用できるチ…
★ 30 ⑂ 7 MIT 2026-05-22
ASR / 音声認識 GitHub jarvis-mac
Jarvis-Macは、macOS上で動作する高度な日本語音声アシスタントです。ユーザーが「ジャービス」と呼びかけることで起…
★ 30 ⑂ 2 MIT 2026-06-19
ASR / 音声認識 GitHub watch-video-skill
このスキルは、Claude AIに動画を「視聴」させ、タイム同期された文字起こしと自動スケーリングされた静止画を組み合…
★ 29 ⑂ 2 MIT 2026-04-30
3D / NeRF GitHub iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
動画生成 GitHub seedance2.0-rehber
このリポジトリは、トルコのAIコミュニティ向けにSeedance 2.0マルチショットプロンプティングに関するガイドを提供…
★ 29 ⑂ 3 MIT 2026-04-30
音声生成 / TTS GitHub supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
ComfyUI GitHub ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
LLM GitHub awaek
X(旧Twitter)で保存したブックマークをパーソナルAIとして活用できるツールです。散逸しがちな保存投稿を「チャッ…
★ 29 ⑂ 1 2026-05-24