3,639 repos GH 3,524 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS

GitHub

avataraisdk

avataraisdkは、任意のウェブサイトに簡単に組み込める3D AIアバターSDKです。リアルタイムのリップシンクと多言語音…

#API #JavaScript #Shopify

★ 2 MIT 2026-05-28

LLM

GitHub

Gemini-chatbot

このGemini Chatbotは、StreamlitとFastAPI、Google Gemini APIを使用して構築されたフルスタックのAIチャットボット…

#FastAPI #Google Gemini API #Python

★ 2 2026-06-16

音声生成 / TTS

GitHub

muse-tts-embed

「MUSE TTS Embed」は、Anthropic Claudeのチャットインターフェース内に永続的なオーディオプレイヤーを組み込み、A…

#Claude MCP #Python #マルチプラットフォーム対応

★ 2 NOASSERTION 2026-05-23

LLM

GitHub

OpenArch

このGitHubリポジトリ「OpenArch」は、Sebastian RaschkaのLLM Architecture Galleryに基づき、現代のオープンソース…

#LLM #Python #PyTorch

★ 2 ⑂ 1 MIT 2026-06-19

画像生成

GitHub

aether

Aetherは、参考画像や生成結果から「視覚的記憶」を生成・管理し、美的スタイルの一貫した画像を継続的に創作するた…

#CLI #Codex対応 #プラグイン

★ 2 MIT 2026-06-22

LLM

GitHub

schoolwork-rag

schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…

#CLI #Docker対応 #Python

★ 2 MIT 2026-05-25

LLM

GitHub

kg-rag

KG-RAGは、Jiraサポートチケットの問い合わせに特化したRAG（検索拡張生成）システムです。ChromaDBによるセマンティ…

#Docker #LLM #Python

★ 2 2026-06-10

ASR / 音声認識

GitHub

speech-emotion-recognition-transfer-learning

このプロジェクトは、音声感情認識（SER）におけるテキストのみ（RoBERTa）、音声のみ（wav2vec2/WavLM/HuBERT）、お…

#Gradio #HuggingFace #Python

★ 2 MIT 2026-06-26

画像生成

GitHub

muapi-python

MuAPIの公式Python SDKで、画像、動画、音声の生成、AIによる画像強化、背景除去、動画編集（リップシンク）、ファイ…

#AI / Machine Learning #API Client #Python

★ 2 ⑂ 1 MIT 2026-06-18

画像生成

GitHub

reference_anomaly_generation

このツール「Reference Anomaly Generation and Segmentation」は、参照画像から欠陥パターンを抽出して通常の背景画…

#CLI #Hugging Face対応 #ModelScope対応

★ 2 Apache-2.0 2026-05-08

LLM

GitHub

py-rag-engine

py-rag-engineは、PDFやMarkdown文書から情報を抽出し、質問応答を行うための軽量なPython製RAG (Retrieval-Augmente…

#CLI #PostgreSQL #Python

★ 2 MIT 2026-05-22

3D / NeRF

GitHub

catetus

Catetusは、Gaussian Splattingの最適化と本番環境への配信を支援するオープンソースのインフラです。巨大な.plyファ…

#API #CLI #glTF

★ 2 NOASSERTION 2026-05-31

ComfyUI

GitHub

ComfyUI-MSS-Login

ComfyUI mss_loginは、ComfyUIのセキュリティ、ガバナンス、パーミッション、マルチユーザー制御を強化する次世代シ…

#ComfyUI対応 #Web UI #アクセス制御

★ 2 ⑂ 2 2026-06-23

動画生成

GitHub

AI-E-Commerce-Media-Studio

このAI Eコマースメディアスタジオは、AIを活用してEコマース向けの商用利用可能な商品画像やシネマティックビデオを…

#API #Celery #GPU利用

★ 2 ⑂ 1 2026-06-15

LLM

GitHub

DocLens

DocLensは、PDF、研究論文、レポートなどの文書を、検索可能で構造化されたAI対応の知識に変換するオープンソースの…

#AI #Docker #Document Processing

★ 2 MIT 2026-06-21

マルチモーダル

GitHub

visualdocqa-kit

VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-22

AIエージェント

GitHub

ashlr-md

Ashlr MDは、macOS、Windows、Linuxに対応したオープンソースのAIネイティブMarkdownアプリです。従来のテキストエデ…

#AI #CLI #Linux

★ 2 MIT 2026-06-09

音声生成 / TTS

GitHub

newscriber

NewScriberは、AIを活用した自律型の多言語ニュース編集・ポッドキャストスクリプト作成・音声ブリーフィング配信ネ…

#AI/ML #Go #n8n

★ 2 NOASSERTION 2026-06-10

その他

GitHub

Neural-Zero-Shot-Voice-Cloning

本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…

#Docker #GPU必須 #Python

★ 2 MIT 2026-06-11

動画生成

GitHub

grokcli

grokcliは、xAI Grokの全機能をCLIで利用できる、ゼロ依存のスタンドアロンツールです。SuperGrokまたはX Premium+の…

#AIエージェント対応 #APIキー不要 #CLI

★ 2 MIT 2026-06-02

ASR / 音声認識

GitHub

speaknow

SpeakNowは、Windowsデスクトップ向けの軽量な音声入力ツールです。ホットキーを押して話すだけで、認識されたテキス…

#Python #Windows #デスクトップアプリケーション

★ 2 MIT 2026-04-22

画像生成

GitHub

rainfield-diffusion-models

本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…

#CLI #GPU必須 #Python

★ 2 NOASSERTION 2026-05-21

ASR / 音声認識

GitHub

voice-sentiment-streamlit

「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…

#AI #NLP #Python

★ 2 2026-04-22

LLM

GitHub

opencrab

opencrabは、タスクをこなすだけでなく、自己の目標を持ち自己進化を追求する「自律生命体」です。他のエージェント…

#Claude Code #CLI #Codex

★ 2 MIT 2026-06-07