3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ComfyUI
GitHub
ComfyUI-Smart-Metadata-Reader
ComfyUI-Smart-Metadata-Readerは、ComfyUIで生成された画像のメタデータをインテリジェントに読み取るPython製のカ…
★ 1 2026-05-28
音声生成 / TTS
GitHub
MeteorVoice
MeteorVoiceは、AIを活用した音声ファーストの英会話コーチングツールです。ユーザーは様々なシナリオを選び、AIコー…
★ 1 ⑂ 1 MIT 2026-06-21
画像生成
GitHub
sd-webui-forge-multi-prompt-slots
SD WebUI Forge向けのこの拡張機能は、最大30個のプロンプトスロットを管理し、一括で画像生成や設定保存を可能にし…
★ 1 MIT 2026-06-24
マルチモーダル
GitHub
esp32-cam-with-gemma
ESP32-CAMオフラインAIビジョンアシスタントは、IoT、コンピュータビジョン、ローカル大規模言語モデルを組み合わせ…
★ 1 MIT 2026-05-31
AIエージェント
GitHub
Agent-Runtime-Community
Agent Runtime Security Platformは、自律型AIエージェントのためのオープンソースのゼロトラストセキュリティ、ガバ…
★ 1 2026-05-31
ASR / 音声認識
GitHub
AI-Voice-Receptionist
AI Voice Receptionistは、Pythonで構築された完全なリアルタイム、フルデュプレックスのAI音声受付システムです。ロ…
★ 1 2026-06-04
マルチモーダル
GitHub
MultiModal-from-scratch
このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル(VLM)をゼロから構築するための詳細なステップ…
★ 1 2026-06-06
ASR / 音声認識
GitHub
AKIRA-AI-Voice-Assistant
AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…
★ 1 2026-06-08
動画生成
GitHub
happy-horse-api
Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…
★ 1 MIT 2026-05-25
LLM
GitHub
rag-systems-production
「rag-systems-production」は、Windowsチーム向けに設計された、本番環境対応のRAG(検索拡張生成)システム構築ツ…
★ 1 Apache-2.0 2026-07-05
動画生成
GitHub
runway-ml
Runwayは、動画、画像、オーディオ制作のための生成AIツールを開発する企業です。Gen-4モデルファミリーを基盤とし、…
★ 1 2026-06-27
音声生成 / TTS
GitHub
speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-07-01
LLM
GitHub
laravelai
このツールは、LaravelアプリケーションにAIチャット機能を統合するためのSDKパッケージ「LaravelAI」です。Ollama、…
★ 1 MIT 2026-05-09
画像生成
GitHub
codex-media-gen
「codex-media-gen」は、Claude AIがリアルなAIラスター画像を生成するためのスキルです。ClaudeのWebまたはデスクト…
★ 1 MIT 2026-05-16
音声生成 / TTS
GitHub
voice-tools
Voice Tools Directoryは、AI音声ツールを効率的に比較・検討するための静的なディレクトリサイトです。YouTuberやポ…
★ 1 ⑂ 1 MIT 2026-06-24
画像生成
GitHub
diffusiondesk
DiffusionDeskは、ComfyUIユーザー向けの強力なAI画像生成フロントエンドです。Text2Image、Image2Image、Inpaint、I…
★ 1 ⑂ 1 MIT 2026-06-16
音声生成 / TTS
GitHub
marmalade-tts-android
「marmalade-tts-android」は、オンデバイスのニューラルボイスと感情認識プロソディを搭載したAndroid向けテキスト…
★ 1 MIT 2026-06-18
音声生成 / TTS
GitHub
hermes-weixin-voice
hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…
★ 1 MIT 2026-05-25
3D / NeRF
GitHub
splattie-widget
「splattie-widget」は、インタラクティブな3D Gaussian SplattingをWebコンポーネントとして提供するツールです。Ri…
★ 1 MIT 2026-06-06
音声生成 / TTS
GitHub
Open-Vox
OpenVoxは、選択したテキストをグローバルショートカットで読み上げる、オープンソースかつマルチOS対応のデスクトッ…
★ 1 NOASSERTION 2026-06-02
ASR / 音声認識
GitHub
BaltiVoice-ASR
BaltiVoice ASRは、バルティ語(チベット語族の低リソース言語)の音声をテキストに変換する初のAI音声認識(ASR)シ…
★ 1 MIT 2026-06-12
AIエージェント
GitHub
agentos
AgentOSは、複数のAIエージェントが記憶を共有し、連携してタスクを遂行するための基盤となる「AIエージェント向けオ…
★ 1 2026-06-15
動画生成
GitHub
NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
マルチモーダル
GitHub
tokensieve
tokensieveは、VLM(Vision-Language Model)を用いたVQA(Visual Question Answering)タスクにおいて、推論時の「p…
★ 1 2026-06-10