3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
LLM GitHub tesm
TESM(Token-Entangled State Machine)は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革…
★ 1 MIT 2026-06-08
ASR / 音声認識 GitHub parleq-speech
Parleqは、macOS向けのオープンソースで音声入力によるテキスト作成ツールです。グローバルホットキーで起動し、話し…
★ 1 Apache-2.0 2026-06-30
ASR / 音声認識 GitHub Voxbee
Vox Beeは、Windows向けの無料オープンソース音声入力ソフトウェアです。whisper.cppを基盤とし、高速なローカル音声…
★ 1 GPL-3.0 2026-05-22
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-07-02
マルチモーダル GitHub lfm2.5-vl-ane
LFM2.5-VL on the Apple Neural Engineは、LiquidAIのLFM2.5-VL-450MモデルをApple Neural Engine上で完全に動作させ…
★ 1 NOASSERTION 2026-06-16
音声生成 / TTS GitHub Porta
Portaは、iPhoneから任意のWebブラウザへファイルを直接ストリーミングできる、一時的でグローバルなデバイス間ファ…
★ 1 Apache-2.0 2026-06-25
音声生成 / TTS GitHub logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
動画生成 GitHub p-video-avatar-generator
「P-Video Avatar generator」は、PrunaAIのP-Video Avatarモデルを搭載した、無料のAIトークアバター動画生成デスク…
★ 1 ⑂ 1 MIT 2026-06-10
画像生成 GitHub GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
ASR / 音声認識 GitHub Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
音声生成 / TTS GitHub voxcpm2-pinokio-launcher
このツールは、トークナイザーフリーの多言語テキスト読み上げシステム「OpenBMB VoxCPM」を、Pinokioを通じて簡単に…
★ 1 2026-05-03
動画生成 GitHub awesome-ai-fashion-video-prompts
このGitHubリポジトリは、ファッションブランド、アパレル販売業者、スタイリスト、クリエイター、Eコマースチーム向…
★ 1 2026-04-28
動画生成 GitHub seedance-movie-mcp
このツールは、Volcengine Ark Seedance/Jimengの動画生成サービスと連携するローカルのstdio MCPサーバーです。物語…
★ 1 MIT 2026-05-25
AIエージェント GitHub kply
Kplyは、AIコーディングエージェント向けに安全なKubernetesセッションを提供するCLIツールです。生のクラスターアク…
★ 1 Apache-2.0 2026-06-01
動画生成 GitHub HappyHorse-1.0
Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…
★ 1 2026-04-11
ASR / 音声認識 GitHub TEL-Voice-Controlled-Smart-Home-Assistant
このツールは、モジュール式のスマートホームアシスタントシステムです。React製のモダンなウェブインターフェースと…
★ 1 2026-06-05
ComfyUI GitHub comfyui-prompt-library-nodes
このツールは、ComfyUIユーザー向けのカスタムノードコレクションです。大規模なComfyUIワークフローで、プロンプト…
★ 1 MIT 2026-05-31
LLM GitHub logal-rag
「logal-rag」は、ローカルのプライベートファイルを対象に、RAG(Retrieval Augmented Generation)技術を用いてユ…
★ 1 MIT 2026-06-25
マルチモーダル GitHub vision-bridge-skill
「vision-bridge-skill」は、多モーダル対応ではないAIモデルに対し、画像、PDF、スクリーンショット、図表などの視…
★ 1 2026-06-11
画像生成 GitHub ComfyUI-Mutantwork
ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…
★ 1 ⑂ 1 2026-06-12
音声生成 / TTS GitHub ha-car-spoken-alerts
このツールは、Home Assistant、Piper TTS、およびVLCを連携させ、Android Autoを介して車のスピーカーからプライバ…
★ 1 MIT 2026-06-13
AIエージェント GitHub Legion_runner
Legion Runnerは、RustとeBPFを用いて構築されたGitHub Actionsランナー向けのセキュリティ強化ツールです。CI/CDパ…
★ 1 MIT 2026-06-23
音声生成 / TTS GitHub codetalkie
Codetalkieは、Claude CodeやOpenAI CodexなどのAIコーディングエージェントのためのハンズフリー音声インターフェー…
★ 1 2026-06-21
音声生成 / TTS GitHub echotwin
EchoTwinは、Discordで利用できるAI音声ボットで、ユーザーの発言にクローンされた声でリアルタイムに返答します。Fi…
★ 1 MIT 2026-06-12