3,631 repos GH 3,516 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

画像生成

GitHub

spade

SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…

#CLI #GPU必須 #Python

★ 6 MIT 2026-06-09

画像生成

GitHub

lora-block-weight-neo

このツールは、Stable Diffusion WebUI Forge - Neo向けの拡張機能であり、LoRAのブロックレベルでの重み付けを詳細…

#GPU必須 #Python #SD 1.5対応

★ 6 MIT 2026-05-22

画像生成

GitHub

M2GenCO

M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…

#CLI #GPU必須 #Python

★ 6 2026-05-26

音声生成 / TTS

GitHub

chorus

Chorusは、YouTubeの長い動画コンテンツを効率的に消費するための画期的なツールです。YouTubeのURLまたは思想家の名…

#AI活用 #CLI #Python

★ 6 2026-04-25

音声生成 / TTS

GitHub

kokopop

「kokopop」は、Pythonの依存関係なしにGGUF形式のKokoroテキスト読み上げモデルを実行するためのスタンドアロンC++…

#C++ライブラリ #CLI #GPU対応

★ 6 MIT 2026-05-29

ASR / 音声認識

GitHub

game_voice_trans

VoxGoは、PCゲームプレイヤー向けに開発されたオープンソースのリアルタイム音声翻訳フロートウィンドウツールです。…

#CLI #OpenAI API互換 #Python

★ 6 GPL-3.0 2026-06-11

画像生成

GitHub

chatgpt-web-gen

このツールは、ChatGPT Plus/Pro/Teamアカウントを持つユーザー向けに、APIキーなしでChatGPT Webの画像生成機能を利…

#ChatGPT #CLI #Python

★ 6 ⑂ 1 MIT 2026-06-07

3D / NeRF

GitHub

StoryCore-Engine

StoryCore Engineは、スクリプトから一貫性のある画像、動画、ストーリー、対話、空間オーディオを生成する、ローカ…

#ComfyUI対応 #Python #React

★ 6 ⑂ 1 MIT 2026-06-23

ASR / 音声認識

GitHub

parrot

ParrotはmacOS向けの高速、無料、プライベートな音声入力ツールです。ショートカットを押すだけで、話した言葉をきれ…

#macOS #オープンソース #プライベート（ローカル処理）

★ 6 MIT 2026-05-30

LLM

GitHub

whatsorag

RAG（Retrieval Augmented Generation）パイプラインの設計を支援するビジュアルウェブアプリケーション。データ取り…

#Next.js #React #TypeScript

★ 6 MIT 2026-06-08

音声生成 / TTS

GitHub

vocalis

Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…

#CLI #GPU必須 #LLM連携

★ 6 MIT 2026-05-21

ComfyUI

GitHub

comfyui-ai-studio

ComfyUI AI Studioは、AI画像、動画、音楽生成のためのワークフロー駆動型クリエイティブスタジオです。ComfyUIの強…

#AI生成 #ComfyUI対応 #Next.js

★ 6 ⑂ 1 MIT 2026-05-03

ASR / 音声認識

GitHub

typoless

TypolessはmacOS向けのメニューバーアプリケーションで、グローバルな音声入力を可能にします。ローカルでの自動音声…

#AI #macOS #OpenAI互換LLM

★ 6 ⑂ 1 2026-06-04

画像生成

GitHub

CAM

このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…

#CLI #GPU必須 #Python

★ 6 2026-06-01

音声生成 / TTS

GitHub

ScriptSmith-Engine

ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…

#AI活用 #CLI #FFmpeg

★ 6 ⑂ 1 MIT 2026-06-23

LLM

GitHub

agentsync

agentsyncは、複数のデバイス間でMarkdownファイルなどのフォルダをリアルタイムに同期し、ポイントインタイムリカバ…

#CLI #Rust #TypeScript

★ 6 2026-05-17

マルチモーダル

GitHub

CodeBind

CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…

#CLI #GPU必須 #Hugging Face対応

★ 6 ⑂ 1 MIT 2026-05-19

マルチモーダル

GitHub

wgram-lm

W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…

#AGPLライセンス #CLI #Hugging Face Transformers

★ 6 AGPL-3.0 2026-06-21

音楽生成

GitHub

mlx-swift-audio

mlx-swift-audioは、テキストから音声への変換（TTS）と音声からテキストへの変換（STT）機能をアプリケーションに提…

#Apple Silicon対応 #iOS #macOS

★ 6 ⑂ 2 MIT 2026-06-25

画像生成

GitHub

rocmroll

ComfyUI ROCmRollは、Windowsプラットフォーム向けのComfyUIインスタンス管理ツールです。AMD GPUとROCmパッケージに…

#AMD GPU必須 #CLI #ComfyUI対応

★ 6 MIT 2026-06-25

マルチモーダル

GitHub

Operator-on-Android

Operatorは、PCに接続することなく、視覚言語モデル（VLM）を使用してAndroidスマートフォンを直接操作できるオンデ…

#AI Agent #Android #Root必須

★ 6 ⑂ 1 MIT 2026-06-17

音声生成 / TTS

GitHub

uttera-tts-hotcold

uttera-tts-hotcoldは、ハイブリッドな「Hot/Cold」ワーカーアーキテクチャとプラグ可能なバックエンド（Coqui XTTS-…

#APIサーバー #Coqui TTS #GPU必須

★ 6 ⑂ 2 Apache-2.0 2026-05-15

画像生成

GitHub

nanoDLM

「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル（MDM）の実装です。約110…

#CLI #GPU推奨 #Python

★ 6 ⑂ 1 2026-05-16

画像生成

GitHub

comfyui-lighthouse

ComfyUI用のLighthouseは、ノード間の接続関係を視覚的に明確にする非破壊的なオーバーレイツールです。クリックした…

#ComfyUI対応 #Python #Web UI

★ 6 ⑂ 2 2026-06-07