3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

マルチモーダル
GitHub
blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
動画生成
GitHub
ai-video-generation
このリポジトリは、Frameloop API を用いたAI動画自動化のための実用的な「curlレシピ集」です。顔出しなしのYouTube…
★ 1 2026-05-13
ComfyUI
GitHub
Comfy_Storyboard
「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…
★ 1 MIT 2026-04-13
LLM
GitHub
awesome-opd
「Awesome On-Policy Distillation」は、強化学習におけるOn-Policy Distillation (OPD) に関する厳選されたリソース…
★ 1 2026-05-15
ASR / 音声認識
GitHub
The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
音声生成 / TTS
GitHub
marmalade-tts-android
「marmalade-tts-android」は、オンデバイスのニューラルボイスと感情認識プロソディを搭載したAndroid向けテキスト…
★ 1 MIT 2026-06-18
音声生成 / TTS
GitHub
hermes-weixin-voice
hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…
★ 1 MIT 2026-05-25
ComfyUI
GitHub
rave-culture-field-guide
「🍓 Rave Culture Field Guide」は、1960年代のacid testsから2026年の自律型DJに至るまで、レイブカルチャーの完全…
★ 1 NOASSERTION 2026-05-03
ASR / 音声認識
GitHub
local-dictation
Apple Silicon搭載Mac向けに設計された、超低遅延かつ完全オンデバイスで動作する音声入力ツールです。ホットキーを…
★ 1 Apache-2.0 2026-06-25
動画生成
GitHub
seedance-ip-pipeline
「Seedance IP Pipeline」は、Higgsfield Seedance 2.0とストーリーボード参照ワークフローに基づいた、AIビデオ生成…
★ 1 MIT 2026-05-09
動画生成
GitHub
Video_Orchestrator
Veo Generative Video Orchestratorは、Google Veoを利用して映画のような高品質な製品説明動画をブラウザ上で作成で…
★ 1 MIT 2026-05-04
画像生成
GitHub
comfyui-character-picker
「ComfyUI Character Picker」は、ComfyUIのカスタムノードとして機能し、9500以上の膨大なアニメ/ゲームキャラクタ…
★ 1 ⑂ 1 MIT 2026-06-04
3D / NeRF
GitHub
Cosmo3DFlow
Cosmo3DFlowは、初期宇宙の初期条件を現在の観測データから再構築するためのツールです。3Dウェーブレットフローマッ…
★ 1 MIT 2026-06-12
動画生成
GitHub
hyperframes-motion-director
このHyperFrames Motion Directorは、記事、製品、ウェブサイトから映画のようなHyperFramesモーションビデオを作成…
★ 1 AGPL-3.0 2026-06-04
マルチモーダル
GitHub
gaze
このツールは、AIにPC画面の「目」を与えるPython製アプリケーションです。ローカルで動作し、スクリーンショット、…
★ 1 MIT 2026-06-20
ASR / 音声認識
GitHub
Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
動画生成
GitHub
happy-horse-api
Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…
★ 1 MIT 2026-05-25
LLM
GitHub
rag-systems-production
「rag-systems-production」は、Windowsチーム向けに設計された、本番環境対応のRAG(検索拡張生成)システム構築ツ…
★ 1 Apache-2.0 2026-06-26
動画生成
GitHub
runway-ml
Runwayは、動画、画像、オーディオ制作のための生成AIツールを開発する企業です。Gen-4モデルファミリーを基盤とし、…
★ 1 2026-06-20
画像生成
GitHub
KinetiDiff
KinetiDiffは、進行性骨化性線維異形成症(FOP)の原因となるACVR1受容体を標的とするキナーゼ阻害剤を設計するため…
★ 1 MIT 2026-06-25
音声生成 / TTS
GitHub
speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
ASR / 音声認識
GitHub
voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14
マルチモーダル
GitHub
claude-badpunpc
このツールは、Steamゲーム「これは諧音梗(BadPunPC)」をAnthropicのClaude Sonnet 4.6を使って全自動で攻略するAIソ…
★ 1 MIT 2026-05-03