3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

AIエージェント

GitHub

heya.skill

本ツールは、Bilibiliの動画投稿者「黒鴉」（Heya）の動画タイトルスタイル（長文、感情を煽る表現、複数の出来事を…

#Agent Skills対応 #AIエージェント #CLI

★ 8 MIT 2026-06-22

LLM

GitHub

durag

Du-RAG (Durable RAG)は、AIエージェント向けに Retrieval-Augmented Generation (RAG) を基盤とした永続的な記憶層…

#AIエージェント #CLI #Google Gemini対応

★ 8 ⑂ 1 Apache-2.0 2026-06-05

動画生成

GitHub

adobe2api

「adobe2api」は、Adobe Fireflyの画像・動画生成能力をOpenAI互換のAPIとして提供するゲートウェイです。Adobe Fire…

#Docker #OpenAI互換API #Python

★ 8 ⑂ 1 2026-05-16

マルチモーダル

GitHub

modalformer-lowlight

このプロジェクト「modalformer-lowlight」は、低照度環境で撮影された画像のノイズ、色の歪み、細部喪失を改善する…

#GPU必須 #Python #Transformerモデル

★ 8 ⑂ 2 MIT 2026-05-01

ASR / 音声認識

GitHub

voxrt-asr-ios

VoxrtAsr for iOSは、オンデバイスで動作するストリーミング音声認識ライブラリです。独自開発のRust製推論ランタイ…

#iOS #NEONアクセラレーション #Rust

★ 8 ⑂ 1 Apache-2.0 2026-06-04

音声生成 / TTS

GitHub

omnivoice-app

OmniVoiceを搭載したセルフホスト型の音声クローンおよびテキスト読み上げ（TTS）ウェブアプリケーションです。テキ…

#Docker #GPU対応 #Python

★ 8 NOASSERTION 2026-06-12

LLM

GitHub

LLMs-Tutorials-Projects

このリポジトリは、LLM（大規模言語モデル）に関する実践的なチュートリアルと実装コード集を提供します。ファインチ…

#Evaluation #Fine-tuning #Google Colab

★ 8 ⑂ 3 2026-06-23

ComfyUI

GitHub

ComfyUI-LocateAnything

「ComfyUI-LocateAnything」は、NVIDIAのLocateAnything-3BビジュアルグラウンディングモデルをComfyUIで利用可能に…

#ComfyUI対応 #GPU必須 #Python

★ 8 ⑂ 3 GPL-3.0 2026-06-01

マルチモーダル

GitHub

Awesome-VLA-Safety

本リポジトリは、Vision-Language-Action（VLA）モデルの安全性に関する厳選された研究論文リストです。データ準備、…

#AI安全性 #Python #VLAモデル

★ 8 2026-05-20

マルチモーダル

GitHub

GDB

GDB (GraphicDesignBench) は、グラフィックデザインタスクにおけるビジョン言語モデルの性能を評価するためのリアル…

#Anthropic対応 #CLI #Gemini対応

★ 8 ⑂ 1 NOASSERTION 2026-05-05

ASR / 音声認識

GitHub

freestyle

Freestyleは、macOS向けのオープンソースAI音声ディクテーションツールです。ユーザーはホットキーを長押しして話し…

#AI #macOS #OpenAI API

★ 8 ⑂ 1 Apache-2.0 2026-05-24

画像生成

GitHub

CivitDeck

CivitDeckは、AIアート生成コミュニティCivitAIのモバイルクライアントで、Kotlin Multiplatform (KMP) を用いてAndr…

#Android #CivitAI対応 #ComfyUI対応

★ 8 MIT 2026-06-24

ASR / 音声認識

GitHub

cream-typer

Cream Typerは、Apple Siliconデバイス上で動作するローカル音声翻訳・テキスト化ツールです。Caps Lockをタップして…

#Apple Silicon #macOS #Python

★ 8 ⑂ 1 MIT 2026-05-02

ComfyUI

GitHub

J-AI-Studio

J AI Studioは、複雑なグラフエディタを必要とせずに、ローカルで画像や動画を生成するためのComfyUI用シンプルUIで…

#CLI #ComfyUI対応 #GPU必須

★ 8 MIT 2026-05-03

ASR / 音声認識

GitHub

Edu_Omni_MyMind

EduMINDは、ベトナム語と英語が混在する学術環境向けに設計された、多モーダルなバイリンガル講義アシスタントおよび…

#CLI #Python #Web UI

★ 8 ⑂ 3 MIT 2026-06-23

音声生成 / TTS

GitHub

SubForge

SubForgeは、AIを駆使した高機能な動画字幕ツールです。音声のテキスト化、意味に基づいたスマートな断句、誤字修正…

#AI駆動 #CLI #Python

★ 8 GPL-3.0 2026-06-18

3D / NeRF

GitHub

SEAR

SEARは、RGB画像と熱画像を組み合わせてカメラのポーズを推定する3D再構築プロジェクトです。Visual Geometric Trans…

#3D再構築 #CLI #GPU必須

★ 8 NOASSERTION 2026-05-07

AIエージェント

GitHub

nextjs-skills

このスキルはNext.js 16+のApp Routerプロジェクト向けに、キャッシングアーキテクチャの設計と実装を支援します。単…

#App Router #Caching #CLI

★ 8 MIT 2026-05-30

AIエージェント

GitHub

praxia

Praxiaは、個人の暗黙知を組織の共有ノウハウへと自動昇格させることに特化した、ワークフロー指向のマルチエージェ…

#CLI #OSS #Python

★ 8 Apache-2.0 2026-06-25

ASR / 音声認識

GitHub

Seam-LocalFirstMinutes

Seamは、会議の録音・文字起こし・要約をローカル環境中心で完結させるmacOS向けアプリです。マイク録音とシステム音…

#macOS #Python #クラウドAPI連携

★ 8 Apache-2.0 2026-06-23

音声生成 / TTS

GitHub

DeepInterview

DeepInterviewは、CVと職務経歴書をアップロードするだけで、AIが模擬面接官として音声で面接練習をサポートするオー…

#CLI #Python #Web UI

★ 8 Apache-2.0 2026-06-24

画像生成

GitHub

DisPOSE

この「DisPOSE」は、自己教師ありマルチビュー3D人体ポーズ推定のための実装です。離散的なクロスビュー人物割り当て…

#3Dポーズ推定 #CLI #GPU必須

★ 8 MIT 2026-06-15

動画生成

GitHub

bony-agent

「Bony Agent」は「AI Media Agent」として、AIを活用したフルスタックのコンテンツ制作・配信プラットフォームです…

#AI生成 #FastAPI #LangGraph

★ 8 ⑂ 1 2026-06-17

画像生成

GitHub

MAs-DiT

このGitHubリポジトリは、「Few Channels Draw The Whole Picture: Revealing Massive Activations in Diffusion Tra…

★ 8 2026-05-21