3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub voice-ai-chat
このツールは、オープンソース技術(Whisper、Groq、LLaMA 3.3、gTTS、FastAPIなど)を基にゼロから構築された音声AI…
★ 2 MIT 2026-05-25
LLM GitHub Awesome-Self-Distillation
「Awesome Large Model Self-Distillation」は、大規模言語モデル(LLMs)、マルチモーダルLLMs(MLLMs)、推論モデ…
★ 2 Apache-2.0 2026-05-26
動画生成 GitHub AI-E-Commerce-Media-Studio
このAI Eコマースメディアスタジオは、AIを活用してEコマース向けの商用利用可能な商品画像やシネマティックビデオを…
★ 2 ⑂ 1 2026-06-15
3D / NeRF GitHub ARIS-in-AI-Offer
このツールは、「ARIS(Auto Research in Sleep)」エージェントフレームワークを活用し、AI分野での就職活動(特に…
★ 2 MIT 2026-06-25
音声生成 / TTS GitHub obsidian-mac-tts
「Local Mac TTS for Obsidian」は、ObsidianのノートをmacOSに内蔵された高品質なテキスト読み上げエンジンで読み上…
★ 2 2026-05-08
ASR / 音声認識 GitHub hey-claude
「Hey Claude」は、ブラウザからハンズフリーでAnthropicのClaude Codeを音声操作できるツールです。ウェイクワード…
★ 2 MIT 2026-06-10
音声生成 / TTS GitHub Velora
Veloraは、Groqの高速LLMを活用したAI駆動の多言語翻訳プラットフォームです。単なる単語の翻訳にとどまらず、語彙、…
★ 2 MIT 2026-06-14
画像生成 GitHub rainfield-diffusion-models
本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…
★ 2 NOASSERTION 2026-05-21
動画生成 GitHub seedance2-video-gen-skill-for-openclaw
本ツールは、OpenClaw、Claude Code、OpenCodeといったAIエージェント向けに、GPT Image 2を活用したAI画像生成・編…
★ 2 ⑂ 1 MIT 2026-06-16
画像生成 GitHub prompt-to-skill
prompt-to-skillは、AIプロンプトを再利用可能なAIスキルに変換し、標準化、検証を支援するツールです。異なるAIモデ…
★ 2 2026-06-23
ASR / 音声認識 GitHub AiSRT
AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…
★ 2 MIT 2026-06-19
画像生成 GitHub media-routing-mesh
Media-OSは、AIアシストメディア制作のためのルーティングオペレーティングシステムであり、特にClaude Code向けに設…
★ 2 2026-06-23
音声生成 / TTS GitHub voice-channel
このツールは「voice-channel」と名付けられ、Claude Codeエージェントをハンズフリーで音声操作するためのローカル…
★ 2 NOASSERTION 2026-06-23
ComfyUI GitHub gpus-python-example
このリポジトリは、Novita GPUs SDKを使用してPythonワーカーハンドラを実装する方法を示すための具体例を提供します…
★ 2 Apache-2.0 2026-05-28
音声生成 / TTS GitHub muse-tts-embed
「MUSE TTS Embed」は、Anthropic Claudeのチャットインターフェース内に永続的なオーディオプレイヤーを組み込み、A…
★ 2 NOASSERTION 2026-05-23
3D / NeRF GitHub NeRF.cpp
NeRF.cppは、C++とLibTorchを用いてNeRF(Neural Radiance Fields)を実装したツールです。静止したシーンのRGB画像…
★ 1 BSD-3-Clause 2026-05-17
AIエージェント GitHub agentos
AgentOSは、複数のAIエージェントが記憶を共有し、連携してタスクを遂行するための基盤となる「AIエージェント向けオ…
★ 1 2026-06-15
ASR / 音声認識 GitHub Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
音声生成 / TTS GitHub ha-car-spoken-alerts
このツールは、Home Assistant、Piper TTS、およびVLCを連携させ、Android Autoを介して車のスピーカーからプライバ…
★ 1 MIT 2026-06-13
ASR / 音声認識 GitHub diting-ai-bilibili-video-to-text-notes
本ツールは、Bilibiliの人気動画やプレイリストのURLから、AIを活用して自動的にMarkdown形式のスマートノートを生成…
★ 1 ⑂ 1 MIT 2026-06-26
音声生成 / TTS GitHub nemoflix-studio
Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…
★ 1 Apache-2.0 2026-06-16
ASR / 音声認識 GitHub mixpeek-extractors
Mixpeek Extractorsは、ビデオ、画像、音声、テキスト、PDFといった多様なファイル形式から、検索可能なベクトル埋め…
★ 1 MIT 2026-06-16
動画生成 GitHub mefaihomevideoai
MEFAI Home Video AIは、画像から動画を生成するエンドツーエンドのAIパイプラインです。高価なGPUをレンタルするこ…
★ 1 Apache-2.0 2026-06-25
LLM GitHub Enterprise-RAG-Intelligence
Enterprise RAG Intelligenceは、ゼロトラスト検索、RBAC強制、および根拠に基づいた生成を提供するセキュアなエンタ…
★ 1 MIT 2026-05-31