3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

動画生成

GitHub

sanatation

NVIDIAのビデオワールドモデル「SANA-WM」をApple Silicon (MシリーズMac) で動作させるためのパッチとインタラクテ…

#Apple Silicon #CLI #GPU必須

★ 2 Apache-2.0 2026-05-21

動画生成

GitHub

article-to-podcast

このツールは、Markdown形式で書かれた記事を自動的にMP3形式のポッドキャストとMP4形式のスライドショー動画に変換…

#CLI #LLM活用 #Node.js

★ 2 2026-05-06

AIエージェント

GitHub

SYNAPSE

SYNAPSE Intelligence Platformは、自律型AIエージェントと高度なセマンティック検索（RAG）を駆使し、FAANGグレード…

#Autonomous AI agents #CLI #Docker

★ 2 MIT 2026-06-04

AIエージェント

GitHub

opus-magnum

Opus Magnum Claude Codeは、長期にわたる複雑なAIコーディングプロジェクトを、コンテキストの損失やエージェントの…

#Agentic Workflows #AI #Claude Code

★ 2 MIT 2026-06-11

画像生成

GitHub

dreamina-web-interface

DreamWeaver CLIは、テキストによる指示を視覚的な作品に変えるインテリジェントなコマンドラインツールです。参照画…

#AI Image Generator #CLI #Multi-Modal Generation

★ 2 2026-06-26

ASR / 音声認識

GitHub

voice-sentiment-streamlit

「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…

#AI #NLP #Python

★ 2 2026-04-22

ASR / 音声認識

GitHub

Murmur

Murmurは、話すだけで文字入力ができる無料のオープンソースAI音声入力ツールです。Alibaba FunASR音声認識エンジン…

#AI連携 #Python #デスクトップアプリ

★ 2 ⑂ 2 NOASSERTION 2026-06-22

ASR / 音声認識

GitHub

Vox

Voxは、Windowsユーザー向けのオフライン音声テキスト変換ツールです。右Ctrlキーを押して話すだけで、チャット、ブ…

#Windows #オフライン #トレイアプリ

★ 2 ⑂ 2 MIT 2026-05-24

マルチモーダル

GitHub

rag-multimodal

このプロジェクトは、複雑な表や図を含むPDF文書から情報を抽出するマルチモーダルRAGシステムの実装デモです。マル…

#AWS #LangGraph #OpenSearch

★ 2 MIT 2026-06-21

ComfyUI

GitHub

Agnes

Agnesは、テキストからビデオを生成する2段階のAIパイプラインを提供するツールです。最大の特徴は、画像生成UIであ…

#API #CLI #ComfyUI対応

★ 2 MIT 2026-06-06

マルチモーダル

GitHub

omni-retrieval

omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-06-08

ComfyUI

GitHub

ComfyUI-HiCache

ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…

#ComfyUI-Hunyuan3DWrapper #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 MIT 2026-06-11

画像生成

GitHub

chatwalaau

ChatWalaʻauは、完全にローカルで動作するフルスタックAIエージェントランタイムです。最新のチャットUIをAG-UIプロ…

#CLI #Microsoft Agent Framework #OpenAI互換

★ 2 Apache-2.0 2026-06-27

3D / NeRF

GitHub

EasyTraceSTL

EasyTraceSTLは、3Dプリントメーカー向けの無料、オフラインで非常にシンプルな3Dデザインツールです。画像を取り込…

#PWA #STL出力 #Web UI

★ 2 2026-06-17

画像生成

GitHub

zimage-skill

zimage-skillは、自然言語のテキスト記述からAIが美しい画像を生成するツールです。プログラミングの知識がなくても…

#AI画像生成 #Linux対応 #macOS対応

★ 2 MIT 2026-06-27

AIエージェント

GitHub

neon-shadows

「NEON SHADOWS: Chrome & Blood」は、2087年のサイバーパンク世界を舞台にしたPython製のテキストベースRPGです。プ…

#CLI #Python #サイバーパンク

★ 2 2026-05-18

ASR / 音声認識

GitHub

rust-whisper-diarization

rust-whisper-diarizationは、純粋なRustで実装されたストリーミング音声認識と話者分離のライブラリです。whisper.c…

#ONNX #Rust #Whisper

★ 2 2026-05-23

3D / NeRF

GitHub

3dgs-detail-zoom-annotator

「3DGS Detail Zoom Annotator」は、3DGS（3D Gaussian Splatting）やNeRF、3D再構築などの研究論文における図表作成…

#Web UI #ZIPエクスポート #ブラウザ対応

★ 2 MIT 2026-03-26

ASR / 音声認識

GitHub

deckle

Deckleは、ローカルファーストのWindowsユーティリティで、ホットキーによる音声文字起こし、リアルタイム画面キャプ…

#.NET #CLI #GPU必須

★ 2 MIT 2026-06-16

マルチモーダル

GitHub

sentra-rag-failure-modes

このリポジトリは、Googleの最新マルチモーダル埋め込みモデル`gemini-embedding-2`の経験的失敗モードと幾何学的特…

#CLI #Google Gemini API #OpenAI API

★ 2 MIT 2026-05-08

ComfyUI

GitHub

ComfyUI-PromptDrafter-SceneQueue

ComfyUI-PromptDrafter-SceneQueueは、画像生成AIツールComfyUIの拡張機能であるComfyUI-PromptDrafterのコンパニオ…

#ComfyUI対応 #GPU必須 #PromptDrafter対応

★ 2 ⑂ 1 MIT 2026-03-20

ASR / 音声認識

GitHub

macOS-dictate

macOS向けのプライバシーを重視した自己ホスト型音声入力ツールです。ホットキーを押しながら話すことで、音声をテキ…

#macOS #Python #Web UI

★ 2 MIT 2026-06-25

音声生成 / TTS

GitHub

lingo-agent

LINGOは、中小企業向けに設計されたベータ版のAI電話エージェントバックエンドです。リアルな電話番号を持ち、永続的…

#API #Deepgram #Docker

★ 2 2026-06-18

LLM

GitHub

GenAI-PDF-QA-Assistant

このGenAI PDF Q&Aアシスタントは、Streamlit、LangChain、FAISS、OllamaローカルLLMを活用したAI駆動型ツールです。…

#Local LLM #PDF対応 #Python

★ 2 2026-05-13