3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識

GitHub

meet-transcription

このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…

#Deepgram #Docker #Google Meet対応

★ 7 MIT 2026-06-22

LLM

GitHub

AttributeCiteQuote

このリポジトリは、大規模言語モデル（LLMs）を用いた証拠に基づくテキスト生成に関する調査研究「Attribution, Cita…

#LLM関連 #データセット #研究成果

★ 7 BSD-3-Clause 2026-04-17

画像生成

GitHub

claude-skill-codex-imagegen

「claude-skill-codex-imagegen」は、AIアシスタント「Claude Code」にOpenAIの高性能画像生成モデル「gpt-image-2」…

#Claude Code対応 #CLI #OpenAI Codex CLI

★ 7 MIT 2026-05-16

マルチモーダル

GitHub

35gateway

「35Gateway」は、35m.aiが開発・運営するソース利用可能なAIゲートウェイです。テキスト、画像、動画、音声、音楽と…

#AI Gateway #OpenAI互換 #Web UI

★ 6 ⑂ 1 NOASSERTION 2026-04-15

ComfyUI

GitHub

TrendCut-Studio

TrendCut Studioは、短編動画運用向けのローカル自動化ワークベンチです。ホットスポット発見、素材分析、スクリプト…

#AI #ComfyUI対応 #Node.js

★ 6 ⑂ 2 MIT 2026-06-05

AIエージェント

GitHub

Local-Model

このツールは、Kali Linux上でQwen 2.5-7Bモデル（LM Studio経由）を活用する、完全にローカルで自律的なサイバーセ…

#CLI #Kali Linux #LLM

★ 6 ⑂ 2 MIT 2026-06-17

ComfyUI

GitHub

WavTTS-ComfyUI

WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…

#ComfyUI対応 #GPU必須 #Python

★ 6 ⑂ 1 MIT 2026-06-04

3D / NeRF

GitHub

higs

HiGSは、SIGGRAPH Asia 2025で発表された「Inverse Radiative Transport for Infrared Scenes with Gaussian Primiti…

#CLI #CUDA #GPU必須

★ 6 ⑂ 1 2026-06-09

ComfyUI

GitHub

ComfyUI-Wildcard-Pipeline

ComfyUIのためのモジュール式プロシージャルプロンプト生成ツールです。ワイルドカード、固定値、結合、派生、制約を…

#ComfyUI対応 #Node.js #Python

★ 6 ⑂ 2 GPL-3.0 2026-06-22

AIエージェント

GitHub

Hive

Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…

#CLI #Python #SDK

★ 6 MIT 2026-06-11

ASR / 音声認識

GitHub

soyle

SöyleはmacOS向けのプッシュツートーク型音声認識ツールです。キーを押しながら話すと、話した内容がデバイス上で100…

#Apple Silicon必須 #macOS対応 #Swift

★ 6 MIT 2026-06-21

画像生成

GitHub

codex-gpt-image-2-subscription

このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…

#ChatGPT Subscription #Claude Code Skill #CLI

★ 6 ⑂ 2 MIT 2026-06-07

AIエージェント

GitHub

noah-gen3-type2

「noah-gen3-type2」は、コンテキスト管理、記憶閉ループ、自律進化を特徴とする汎用型AI認知アーキテクチャです。「…

#AI Agent #CLI #Python

★ 6 2026-06-18

音声生成 / TTS

GitHub

claude-code-audio-recap

このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…

#Claude Code Plugin #CLI #macOS

★ 6 Apache-2.0 2026-06-18

マルチモーダル

GitHub

egobabyvlm

本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ（BabyView …

#Python #PyTorch #VLM

★ 6 NOASSERTION 2026-06-23

ComfyUI

GitHub

MisoTTS-ComfyUI

MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ（TTS）ノードです。Miso TTS 8BモデルとMimiオーディオトークン…

#ComfyUI対応 #GPU必須 #Python

★ 6 ⑂ 3 MIT 2026-06-04

マルチモーダル

GitHub

Multimodal-Edge-Node

Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…

#GPU必須 #Python #Web UI

★ 6 Apache-2.0 2026-05-01

ASR / 音声認識

GitHub

Live-Church-Captions

Church Capは、教会向けに開発されたオープンソースかつローカルファーストのリアルタイムキャプションアプリです。…

#CLI #Python #Web UI

★ 6 MIT 2026-06-23

ASR / 音声認識

GitHub

murmur

Murmurは、macOSユーザー向けのローカルファーストなホールド・トゥ・トーク音声文字変換アプリです。ホットキーを押…

#Apple Silicon #LLM対応 #macOS

★ 6 MIT 2026-06-09

画像生成

GitHub

ScribeNEO

ScribeNEOは、Stable Diffusion Forge Neo専用に開発されたプロンプトエンジニアリング拡張機能です。AIを活用し、ユ…

#AI活用 #GPU必須 #LLM連携

★ 6 MIT 2026-05-29

音声生成 / TTS

GitHub

BridgeSpeak

BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…

#AIエージェント対応 #CLI #Python

★ 6 ⑂ 2 MIT 2026-05-10

画像生成

GitHub

spade

SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…

#CLI #GPU必須 #Python

★ 6 MIT 2026-06-09

3D / NeRF

GitHub

LandmarkDiff-public

LandmarkDiffは、単一の顔写真から美容整形手術後の予測画像を生成する革新的なツールです。解剖学的に条件付けされ…

#CLI #GPU必須 #Hugging Face Space

★ 6 ⑂ 11 MIT 2026-05-01

画像生成

GitHub

lora-block-weight-neo

このツールは、Stable Diffusion WebUI Forge - Neo向けの拡張機能であり、LoRAのブロックレベルでの重み付けを詳細…

#GPU必須 #Python #SD 1.5対応

★ 6 MIT 2026-05-22