3,639 repos GH 3,524 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub avataraisdk
avataraisdkは、任意のウェブサイトに簡単に組み込める3D AIアバターSDKです。リアルタイムのリップシンクと多言語音…
★ 2 MIT 2026-05-28
LLM GitHub Gemini-chatbot
このGemini Chatbotは、StreamlitとFastAPI、Google Gemini APIを使用して構築されたフルスタックのAIチャットボット…
★ 2 2026-06-16
音声生成 / TTS GitHub muse-tts-embed
「MUSE TTS Embed」は、Anthropic Claudeのチャットインターフェース内に永続的なオーディオプレイヤーを組み込み、A…
★ 2 NOASSERTION 2026-05-23
LLM GitHub OpenArch
このGitHubリポジトリ「OpenArch」は、Sebastian RaschkaのLLM Architecture Galleryに基づき、現代のオープンソース…
★ 2 ⑂ 1 MIT 2026-06-19
画像生成 GitHub aether
Aetherは、参考画像や生成結果から「視覚的記憶」を生成・管理し、美的スタイルの一貫した画像を継続的に創作するた…
★ 2 MIT 2026-06-22
LLM GitHub schoolwork-rag
schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…
★ 2 MIT 2026-05-25
LLM GitHub kg-rag
KG-RAGは、Jiraサポートチケットの問い合わせに特化したRAG(検索拡張生成)システムです。ChromaDBによるセマンティ…
★ 2 2026-06-10
ASR / 音声認識 GitHub speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-26
画像生成 GitHub muapi-python
MuAPIの公式Python SDKで、画像、動画、音声の生成、AIによる画像強化、背景除去、動画編集(リップシンク)、ファイ…
★ 2 ⑂ 1 MIT 2026-06-18
画像生成 GitHub reference_anomaly_generation
このツール「Reference Anomaly Generation and Segmentation」は、参照画像から欠陥パターンを抽出して通常の背景画…
★ 2 Apache-2.0 2026-05-08
LLM GitHub py-rag-engine
py-rag-engineは、PDFやMarkdown文書から情報を抽出し、質問応答を行うための軽量なPython製RAG (Retrieval-Augmente…
★ 2 MIT 2026-05-22
3D / NeRF GitHub catetus
Catetusは、Gaussian Splattingの最適化と本番環境への配信を支援するオープンソースのインフラです。巨大な.plyファ…
★ 2 NOASSERTION 2026-05-31
ComfyUI GitHub ComfyUI-MSS-Login
ComfyUI mss_loginは、ComfyUIのセキュリティ、ガバナンス、パーミッション、マルチユーザー制御を強化する次世代シ…
★ 2 ⑂ 2 2026-06-23
動画生成 GitHub AI-E-Commerce-Media-Studio
このAI Eコマースメディアスタジオは、AIを活用してEコマース向けの商用利用可能な商品画像やシネマティックビデオを…
★ 2 ⑂ 1 2026-06-15
LLM GitHub DocLens
DocLensは、PDF、研究論文、レポートなどの文書を、検索可能で構造化されたAI対応の知識に変換するオープンソースの…
★ 2 MIT 2026-06-21
マルチモーダル GitHub visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
AIエージェント GitHub ashlr-md
Ashlr MDは、macOS、Windows、Linuxに対応したオープンソースのAIネイティブMarkdownアプリです。従来のテキストエデ…
★ 2 MIT 2026-06-09
音声生成 / TTS GitHub newscriber
NewScriberは、AIを活用した自律型の多言語ニュース編集・ポッドキャストスクリプト作成・音声ブリーフィング配信ネ…
★ 2 NOASSERTION 2026-06-10
その他 GitHub Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
動画生成 GitHub grokcli
grokcliは、xAI Grokの全機能をCLIで利用できる、ゼロ依存のスタンドアロンツールです。SuperGrokまたはX Premium+の…
★ 2 MIT 2026-06-02
ASR / 音声認識 GitHub speaknow
SpeakNowは、Windowsデスクトップ向けの軽量な音声入力ツールです。ホットキーを押して話すだけで、認識されたテキス…
★ 2 MIT 2026-04-22
画像生成 GitHub rainfield-diffusion-models
本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…
★ 2 NOASSERTION 2026-05-21
ASR / 音声認識 GitHub voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
LLM GitHub opencrab
opencrabは、タスクをこなすだけでなく、自己の目標を持ち自己進化を追求する「自律生命体」です。他のエージェント…
★ 2 MIT 2026-06-07