3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub muse-tts-embed
「MUSE TTS Embed」は、Anthropic Claudeのチャットインターフェース内に永続的なオーディオプレイヤーを組み込み、A…
★ 2 NOASSERTION 2026-05-23
LLM GitHub OpenArch
このGitHubリポジトリ「OpenArch」は、Sebastian RaschkaのLLM Architecture Galleryに基づき、現代のオープンソース…
★ 2 ⑂ 1 MIT 2026-06-19
画像生成 GitHub aether
Aetherは、参考画像や生成結果から「視覚的記憶」を生成・管理し、美的スタイルの一貫した画像を継続的に創作するた…
★ 2 MIT 2026-06-22
LLM GitHub schoolwork-rag
schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…
★ 2 MIT 2026-05-25
LLM GitHub kg-rag
KG-RAGは、Jiraサポートチケットの問い合わせに特化したRAG(検索拡張生成)システムです。ChromaDBによるセマンティ…
★ 2 2026-06-10
ASR / 音声認識 GitHub speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-26
画像生成 GitHub muapi-python
MuAPIの公式Python SDKで、画像、動画、音声の生成、AIによる画像強化、背景除去、動画編集(リップシンク)、ファイ…
★ 2 ⑂ 1 MIT 2026-06-18
3D / NeRF GitHub dreid-pack
DREID-Packは、DREIDING力場、Goldstein+Split DEE、tree-decomposition DPを駆使し、全原子レベルでのタンパク質側…
★ 2 MIT 2026-04-05
マルチモーダル GitHub ORION
ORIONは、低軌道衛星向けの自律型トリアージシステムです。Raspberry Pi 5に最適化されたVision-Language Model (VLM…
★ 2 ⑂ 1 2026-05-19
3D / NeRF GitHub catetus
Catetusは、Gaussian Splattingの最適化と本番環境への配信を支援するオープンソースのインフラです。巨大な.plyファ…
★ 2 NOASSERTION 2026-05-31
ComfyUI GitHub ComfyUI-MSS-Login
ComfyUI mss_loginは、ComfyUIのセキュリティ、ガバナンス、パーミッション、マルチユーザー制御を強化する次世代シ…
★ 2 ⑂ 2 2026-06-23
動画生成 GitHub AI-E-Commerce-Media-Studio
このAI Eコマースメディアスタジオは、AIを活用してEコマース向けの商用利用可能な商品画像やシネマティックビデオを…
★ 2 ⑂ 1 2026-06-15
LLM GitHub DocLens
DocLensは、PDF、研究論文、レポートなどの文書を、検索可能で構造化されたAI対応の知識に変換するオープンソースの…
★ 2 MIT 2026-06-21
マルチモーダル GitHub visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
AIエージェント GitHub ashlr-md
Ashlr MDは、macOS、Windows、Linuxに対応したオープンソースのAIネイティブMarkdownアプリです。従来のテキストエデ…
★ 2 MIT 2026-06-09
音声生成 / TTS GitHub newscriber
NewScriberは、AIを活用した自律型の多言語ニュース編集・ポッドキャストスクリプト作成・音声ブリーフィング配信ネ…
★ 2 NOASSERTION 2026-06-10
その他 GitHub Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
動画生成 GitHub grokcli
grokcliは、xAI Grokの全機能をCLIで利用できる、ゼロ依存のスタンドアロンツールです。SuperGrokまたはX Premium+の…
★ 2 MIT 2026-06-02
ASR / 音声認識 GitHub agentdictate
AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…
★ 2 MIT 2026-05-14
動画生成 GitHub Pannotate-iOS
Pannotateは、画像アノテーションとモーションプロンプトを組み合わせることで、視覚的にガイドされたAIビデオ生成を…
★ 2 ⑂ 1 2026-04-29
画像生成 GitHub awesome-gpu-for-ai
「Awesome GPU for AI」は、AIおよびLLMワークロード向けGPUの選定ガイドです。特にローカルLLM推論に焦点を当て、VR…
★ 2 2026-06-13
動画生成 GitHub sora-api
Mountsea AIが提供するSora 2 APIは、OpenAIの最新AIビデオ生成モデル「Sora 2 (Sora Pro, Sora2)」への安価で簡単な…
★ 2 MIT 2026-05-27
AIエージェント GitHub cloudclaw
CloudClawは、Spring BootとSpring AIを活用したエンタープライズグレードのオープンソースAIエージェントプラットフ…
★ 2 ⑂ 3 Apache-2.0 2026-06-18
ComfyUI GitHub DemonAlone-nodes-ComfyUI
このリポジトリは、ComfyUI用の軽量ユーティリティノード群を提供します。これらは元々XYZプロットパイプラインをサ…
★ 2 ⑂ 1 MIT 2026-06-18