3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
画像生成 GitHub comfyui-CleanFreak
ComfyUIのワークフローをワンクリックで役割ごとに整理するツール「CleanFreak」は、ローダー、エンコーダー、サンプ…
★ 32 ⑂ 4 2026-06-07
マルチモーダル GitHub ARIS-Movie-Director
ARIS-Movie-Directorは、曖昧なストーリーの指示から、AIエージェントが生成と監査を行い、イメージベースのムービー…
★ 32 ⑂ 2 MIT 2026-06-26
動画生成 GitHub ShipinKit
ShipinKitは、AIビデオ生成のプロトタイプを迅速に作成し、既存のプロジェクトに容易に統合するための非公式Swift SD…
★ 32 ⑂ 3 MIT 2026-05-23
AIエージェント GitHub everything-gemini
Everything Gemini Code (EGC)は、Geminiを始めとするAIエージェントのためのオーケストレーションエコシステムと、…
★ 31 ⑂ 28 MIT 2026-06-30
ASR / 音声認識 GitHub FastWord
FastWordは、macOSユーザー向けのプライベートでローカルなプッシュトゥトーク音声入力アプリケーションです。ホット…
★ 31 ⑂ 3 2026-05-23
動画生成 GitHub mmx-mcp-server
mmx-mcp-serverは、MiniMaxの全モダリティ(テキスト、検索、画像理解、画像生成、音声合成、動画生成、音楽生成、配…
★ 31 ⑂ 8 MIT 2026-04-17
AIエージェント GitHub Orkas
Orkasは、AIエージェントのチームを構築し、単一のチャットインターフェースで指揮できるオープンソースのデスクトッ…
★ 31 ⑂ 8 MIT 2026-06-24
ASR / 音声認識 GitHub openquack
OpenQuackはmacOS向けの音声文字変換メニューバーアプリです。ホットキーを押して話すだけで、話した内容がカーソル…
★ 31 ⑂ 5 MIT 2026-06-29
LLM GitHub MindBase
Bilibiliのお気に入り動画やクラウド文書をチャット可能な個人知識ベースへと変換するツールです。動画の音声認識(A…
★ 31 ⑂ 1 MIT 2026-06-23
画像生成 GitHub gpt-image-2-webui
ImgX Studioは、GPT ImageおよびOpenAI互換の画像APIに対応した、洗練されたセルフホスト型WebUIです。デザイナー、…
★ 31 ⑂ 5 2026-04-27
音声生成 / TTS GitHub wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-06-30
動画生成 GitHub Awesome-Agent-Based-Low-Level-Vision
本リポジトリは、自律エージェントや(M)LLMエージェントを用いた低レベル画像処理(画像修復、画像編集、超解像など…
★ 30 ⑂ 4 MIT 2026-06-15
マルチモーダル GitHub CanvasChat
CanvasChatは、Google GeminiのCanvasプレビューモードに特化した、Gemini 3 Flashモデルを無料で大量に利用できるチ…
★ 30 ⑂ 7 MIT 2026-05-22
音声生成 / TTS GitHub speech-studio
Speech Studioは、コンテンツクリエイター向けのオープンソースのデスクトップアプリケーションです。短い音声クリッ…
★ 30 ⑂ 5 Apache-2.0 2026-07-02
ASR / 音声認識 GitHub jarvis-mac
Jarvis-Macは、macOS上で動作する高度な日本語音声アシスタントです。ユーザーが「ジャービス」と呼びかけることで起…
★ 30 ⑂ 2 MIT 2026-06-19
LLM GitHub pinrule
pinruleは、AIが長時間のタスク中に当初の目的から逸脱しないように、5〜10個の重要なルールを設定できる普遍的なAI…
★ 30 ⑂ 1 MIT 2026-05-19
ASR / 音声認識 GitHub VoiceInput
VoiceInputは、macOS向けの軽量で直感的なメニューバー音声入力ツールです。右Commandキーを押しながら話すだけで、…
★ 29 ⑂ 1 GPL-3.0 2026-07-04
LLM GitHub LongParser
LongParserは、プライバシーを重視したドキュメントインテリジェンスエンジンです。PDF、DOCX、PPTX、XLSX、CSVとい…
★ 29 ⑂ 2 NOASSERTION 2026-05-05
音声生成 / TTS GitHub supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
ComfyUI GitHub ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
3D / NeRF GitHub maplibre-gl-splat
「maplibre-gl-splat」は、MapLibre GL JS地図上で3D Gaussian Splatを視覚化するためのプラグインです。このツール…
★ 29 ⑂ 5 MIT 2026-06-22
ASR / 音声認識 GitHub watch-video-skill
このスキルは、Claude AIに動画を「視聴」させ、タイム同期された文字起こしと自動スケーリングされた静止画を組み合…
★ 29 ⑂ 2 MIT 2026-04-30
LLM GitHub awaek
X(旧Twitter)で保存したブックマークをパーソナルAIとして活用できるツールです。散逸しがちな保存投稿を「チャッ…
★ 29 ⑂ 2 2026-05-24
動画生成 GitHub seedance2.0-rehber
このリポジトリは、トルコのAIコミュニティ向けにSeedance 2.0マルチショットプロンプティングに関するガイドを提供…
★ 29 ⑂ 3 MIT 2026-04-30