3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ComfyUI

GitHub

ComfyUI_AB_Wildcard

「AB Wildcard - ComfyUI Wildcard Processor」は、ComfyUIのプロンプト作成を劇的に強化するカスタムノードです。ワ…

#ComfyUI対応 #Python #Web UI

★ 2 ⑂ 1 MIT 2026-06-13

動画生成

GitHub

ai-video-pipeline

このツールは、AIを活用してスクリプト作成、画像検索、音声合成、最終的なMP4動画生成までを完全に自動化する、無料…

#AI #CLI #Python

★ 2 2026-05-13

画像生成

GitHub

ReCo-Diff

ReCo-Diffは、スパースビューCT（低線量CT）における画像再構成のための、残差条件付き決定論的サンプリングに基づく…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-15

ASR / 音声認識

GitHub

agentdictate

AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…

#CLI #Linux #OpenAI API

★ 2 MIT 2026-05-14

LLM

GitHub

GameAgent

DB GameAgentは、ローカルで動作するゲームデータベースアシスタントです。現状は「アークナイツ」のゲームデータ、…

#CLI #LLM対応 #Python

★ 2 MIT 2026-05-16

LLM

GitHub

rusty-gpt

rusty-gptは、RustとBurnライブラリを用いてゼロから開発されたGPTモデルで、埋め込みから完全なトランスフォーマー…

#API #CUDA #Docker

★ 2 Apache-2.0 2026-06-18

画像生成

GitHub

image-prompt-layers

このリポジトリは、AI画像生成の品質を高めるための「7層構造画像プロンプトライブラリ」です。Meta、Subject、Scene…

#Gemini Image対応 #Midjourney対応 #プロンプトエンジニアリング

★ 2 NOASSERTION 2026-05-16

音声生成 / TTS

GitHub

strands-omnivoice

strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-05-16

画像生成

GitHub

DiffVMB-pub

本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…

#CLI #GPU必須 #Python

★ 2 ⑂ 1 2026-05-04

ComfyUI

GitHub

Prompt808

Prompt808は、ComfyUI用のビジョンLLMプロンプト生成ノードです。画像からコンテンツやスタイルを学習し、ユーザーの…

#AI/ML #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 MIT 2026-04-25

3D / NeRF

GitHub

tju-cv-course-project

このリポジトリは、医用画像の分類、セグメンテーション、および3D再構築に特化したコンピュータビジョンの学術プロ…

#CLI #Computer Vision #Medical Imaging

★ 2 MIT 2026-03-21

LLM

GitHub

AI-consultant-for-the-store

このプロジェクトは、自然言語を理解し、カタログからの商品推奨、カート管理、注文処理、およびマネージャーへの通…

#AI #Node.js #PostgreSQL

★ 2 MIT 2026-06-22

音声生成 / TTS

GitHub

voice-ai-chat

このツールは、オープンソース技術（Whisper、Groq、LLaMA 3.3、gTTS、FastAPIなど）を基にゼロから構築された音声AI…

#AIチャット #Docker #FastAPI

★ 2 MIT 2026-05-25

LLM

GitHub

Awesome-Self-Distillation

「Awesome Large Model Self-Distillation」は、大規模言語モデル（LLMs）、マルチモーダルLLMs（MLLMs）、推論モデ…

#LLM #Python #研究

★ 2 Apache-2.0 2026-05-26

動画生成

GitHub

AI-E-Commerce-Media-Studio

このAI Eコマースメディアスタジオは、AIを活用してEコマース向けの商用利用可能な商品画像やシネマティックビデオを…

#API #Celery #GPU利用

★ 2 ⑂ 1 2026-06-15

3D / NeRF

GitHub

ARIS-in-AI-Offer

このツールは、「ARIS（Auto Research in Sleep）」エージェントフレームワークを活用し、AI分野での就職活動（特に…

#AI研究支援 #CLI #HTML生成

★ 2 MIT 2026-06-25

音声生成 / TTS

GitHub

obsidian-mac-tts

「Local Mac TTS for Obsidian」は、ObsidianのノートをmacOSに内蔵された高品質なテキスト読み上げエンジンで読み上…

#macOSのみ #Obsidianプラグイン #オフライン利用可能

★ 2 2026-05-08

ASR / 音声認識

GitHub

hey-claude

「Hey Claude」は、ブラウザからハンズフリーでAnthropicのClaude Codeを音声操作できるツールです。ウェイクワード…

#Claude Code連携 #Node.js #Web UI

★ 2 MIT 2026-06-10

音声生成 / TTS

GitHub

Velora

Veloraは、Groqの高速LLMを活用したAI駆動の多言語翻訳プラットフォームです。単なる単語の翻訳にとどまらず、語彙、…

#AI #JavaScript #LLM

★ 2 MIT 2026-06-14

画像生成

GitHub

rainfield-diffusion-models

本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…

#CLI #GPU必須 #Python

★ 2 NOASSERTION 2026-05-21

動画生成

GitHub

seedance2-video-gen-skill-for-openclaw

本ツールは、OpenClaw、Claude Code、OpenCodeといったAIエージェント向けに、GPT Image 2を活用したAI画像生成・編…

#AI Agent #CLI #Node.js

★ 2 ⑂ 1 MIT 2026-06-16

画像生成

GitHub

prompt-to-skill

prompt-to-skillは、AIプロンプトを再利用可能なAIスキルに変換し、標準化、検証を支援するツールです。異なるAIモデ…

#AI/ML #CLI #JSON

★ 2 2026-06-23

ASR / 音声認識

GitHub

AiSRT

AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…

#CLI #GPU推奨 #Python

★ 2 MIT 2026-06-19

画像生成

GitHub

media-routing-mesh

Media-OSは、AIアシストメディア制作のためのルーティングオペレーティングシステムであり、特にClaude Code向けに設…

#AI #Claude Code対応 #DeckLink

★ 2 2026-06-23