3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS

GitHub

pi-listens

@p8n.ai/pi-listensは、音声認識（STT）と音声合成（TTS）機能を提供する、音声ファーストのPiパッケージです。デフ…

#CLI #Pi対応 #Sarvam AI連携

★ 2 MIT 2026-05-11

ASR / 音声認識

GitHub

openwritr-windows

OpenWritr for Windows (ARM64)は、Windows on ARMデバイス、特にSnapdragon X Elite搭載機に特化したプッシュトゥト…

#ARM64対応 #NPU対応 #Windows

★ 2 MIT 2026-06-12

画像生成

GitHub

ComfyUI-AliAn-Ideogram-Magic-Prompt

このツールは、ComfyUIのカスタムノードとして機能し、Ideogramのホスト型Magic Prompt APIを利用して、一般的なテキ…

#API連携 #ComfyUI対応 #Ideogram 4

★ 2 MIT 2026-06-04

動画生成

GitHub

ai-content-automation-system

このプロジェクトは、AIまたは手動スクリプト入力からYouTube ShortsやReelsのような短尺縦型動画を自動生成するため…

#AI活用 #CLI #FFmpeg

★ 2 NOASSERTION 2026-05-10

ASR / 音声認識

GitHub

parley

Parleyは、音声指示型Vision-Language-Action（VLA）パイプライン向けのベンチマークツールキットです。このツールは…

#CLI #Python #Vision-Language-Action (VLA)

★ 2 MIT 2026-06-23

LLM

GitHub

schoolwork-rag

schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…

#CLI #Docker対応 #Python

★ 2 MIT 2026-05-25

音声生成 / TTS

GitHub

Supertonic-Voice

Supertonic Voiceは、PySide6とローカルONNX AI音声モデルで構築された、オフラインのデスクトップ音声合成（TTS）ア…

#Chrome拡張機能 #Python #TTS (Text-to-Speech)

★ 2 MIT 2026-06-16

LLM

GitHub

modelfaucet

ModelFaucetは、オープンソースのLLM配信ゲートウェイと組み込み可能なSDKです。あらゆるウェブサイト、アプリケーシ…

#API Gateway #Python #SDK

★ 2 NOASSERTION 2026-06-22

ASR / 音声認識

GitHub

voice-sentiment-analysis

このAIベースの音声感情分析アプリケーションは、話された言葉をテキストに変換し、NLPモデルを用いてリアルタイムで…

#AI #Python #Web UI

★ 2 ⑂ 1 2026-04-21

動画生成

GitHub

article-to-podcast

このツールは、Markdown形式で書かれた記事を自動的にMP3形式のポッドキャストとMP4形式のスライドショー動画に変換…

#CLI #LLM活用 #Node.js

★ 2 2026-05-06

AIエージェント

GitHub

SYNAPSE

SYNAPSE Intelligence Platformは、自律型AIエージェントと高度なセマンティック検索（RAG）を駆使し、FAANGグレード…

#Autonomous AI agents #CLI #Docker

★ 2 MIT 2026-06-04

AIエージェント

GitHub

opus-magnum

Opus Magnum Claude Codeは、長期にわたる複雑なAIコーディングプロジェクトを、コンテキストの損失やエージェントの…

#Agentic Workflows #AI #Claude Code

★ 2 MIT 2026-06-11

LLM

GitHub

augmenting_historians

このPythonスクリプト群は、歴史家が自身の原稿を批判的に分析するための実験的なインフラストラクチャです。RAGアー…

#CLI #LLM #OpenAI連携

★ 2 MIT 2026-06-22

AIエージェント

GitHub

job-copilot

プログラマー向けのAI面接コーチツール「JobCopilot」は、ユーザーが作成したMarkdown形式の技術ノートをプライベー…

#Docker #LLM #Markdown

★ 2 MIT 2026-05-24

画像生成

GitHub

dreamina-web-interface

DreamWeaver CLIは、テキストによる指示を視覚的な作品に変えるインテリジェントなコマンドラインツールです。参照画…

#AI Image Generator #CLI #Multi-Modal Generation

★ 2 2026-06-26

LLM

GitHub

Kymic

Kymicは、Model Context Protocol (MCP)とCode Mode実行パラダイムを利用した自律型AIオーケストレーションプラット…

#AIエージェント #CLI #Docker

★ 2 MIT 2026-03-29

ASR / 音声認識

GitHub

CWX-Transcribe

CWX-Transcribeは、OpenAIの`gpt-4o-transcribe-diarize`モデルを基盤とした、長時間の2話者インタビュー向け高精度…

#AI/ML #CLI #OpenAI/GPT

★ 2 Apache-2.0 2026-05-06

音声生成 / TTS

GitHub

voice-ai-chat

このツールは、オープンソース技術（Whisper、Groq、LLaMA 3.3、gTTS、FastAPIなど）を基にゼロから構築された音声AI…

#AIチャット #Docker #FastAPI

★ 2 MIT 2026-05-25

マルチモーダル

GitHub

rag-multimodal

このプロジェクトは、複雑な表や図を含むPDF文書から情報を抽出するマルチモーダルRAGシステムの実装デモです。マル…

#AWS #LangGraph #OpenSearch

★ 2 MIT 2026-06-21

ComfyUI

GitHub

Agnes

Agnesは、テキストからビデオを生成する2段階のAIパイプラインを提供するツールです。最大の特徴は、画像生成UIであ…

#API #CLI #ComfyUI対応

★ 2 MIT 2026-06-06

マルチモーダル

GitHub

omni-retrieval

omni-retrievalは、テキスト、画像、音声、動画といった多様なメディアタイプを完全にローカルかつエアギャップ環境…

#CLI #GPU必須 #Python

★ 2 Apache-2.0 2026-06-08

ComfyUI

GitHub

ComfyUI-HiCache

ComfyUI-HiCacheは、ComfyUIでHunyuan3Dの形状生成を加速するための、トレーニング不要なノードです。flow-matching…

#ComfyUI-Hunyuan3DWrapper #ComfyUI対応 #GPU必須

★ 2 ⑂ 1 MIT 2026-06-11

3D / NeRF

GitHub

EasyTraceSTL

EasyTraceSTLは、3Dプリントメーカー向けの無料、オフラインで非常にシンプルな3Dデザインツールです。画像を取り込…

#PWA #STL出力 #Web UI

★ 2 2026-06-17

画像生成

GitHub

zimage-skill

zimage-skillは、自然言語のテキスト記述からAIが美しい画像を生成するツールです。プログラミングの知識がなくても…

#AI画像生成 #Linux対応 #macOS対応

★ 2 MIT 2026-06-27