3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
動画生成 GitHub ai-video-generation
このリポジトリは、Frameloop API を用いたAI動画自動化のための実用的な「curlレシピ集」です。顔出しなしのYouTube…
★ 1 2026-05-13
ComfyUI GitHub Comfy_Storyboard
「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…
★ 1 MIT 2026-04-13
LLM GitHub awesome-opd
「Awesome On-Policy Distillation」は、強化学習におけるOn-Policy Distillation (OPD) に関する厳選されたリソース…
★ 1 2026-05-15
ASR / 音声認識 GitHub The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
音声生成 / TTS GitHub marmalade-tts-android
「marmalade-tts-android」は、オンデバイスのニューラルボイスと感情認識プロソディを搭載したAndroid向けテキスト…
★ 1 MIT 2026-06-18
音声生成 / TTS GitHub hermes-weixin-voice
hermes-weixin-voiceは、Hermes WeChatエージェント向けの双方向音声I/Oレイヤーです。これにより、エージェントは受…
★ 1 MIT 2026-05-25
ComfyUI GitHub rave-culture-field-guide
「🍓 Rave Culture Field Guide」は、1960年代のacid testsから2026年の自律型DJに至るまで、レイブカルチャーの完全…
★ 1 NOASSERTION 2026-05-03
ASR / 音声認識 GitHub local-dictation
Apple Silicon搭載Mac向けに設計された、超低遅延かつ完全オンデバイスで動作する音声入力ツールです。ホットキーを…
★ 1 Apache-2.0 2026-06-25
動画生成 GitHub seedance-ip-pipeline
「Seedance IP Pipeline」は、Higgsfield Seedance 2.0とストーリーボード参照ワークフローに基づいた、AIビデオ生成…
★ 1 MIT 2026-05-09
画像生成 GitHub Petal
PetalGenは、AI画像生成のためのプロンプトエンジニアリングツールです。Pollinations.aiによって提供されており、ユ…
★ 1 ⑂ 1 MIT 2026-05-30
動画生成 GitHub Video_Orchestrator
Veo Generative Video Orchestratorは、Google Veoを利用して映画のような高品質な製品説明動画をブラウザ上で作成で…
★ 1 MIT 2026-05-04
画像生成 GitHub comfyui-character-picker
「ComfyUI Character Picker」は、ComfyUIのカスタムノードとして機能し、9500以上の膨大なアニメ/ゲームキャラクタ…
★ 1 ⑂ 1 MIT 2026-06-04
3D / NeRF GitHub Cosmo3DFlow
Cosmo3DFlowは、初期宇宙の初期条件を現在の観測データから再構築するためのツールです。3Dウェーブレットフローマッ…
★ 1 MIT 2026-06-12
動画生成 GitHub hyperframes-motion-director
このHyperFrames Motion Directorは、記事、製品、ウェブサイトから映画のようなHyperFramesモーションビデオを作成…
★ 1 AGPL-3.0 2026-06-04
マルチモーダル GitHub gaze
このツールは、AIにPC画面の「目」を与えるPython製アプリケーションです。ローカルで動作し、スクリーンショット、…
★ 1 MIT 2026-06-20
ASR / 音声認識 GitHub Multimodal-Emotion-Recognition-System
このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…
★ 1 2026-06-08
動画生成 GitHub happy-horse-api
Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…
★ 1 MIT 2026-05-25
LLM GitHub rag-systems-production
「rag-systems-production」は、Windowsチーム向けに設計された、本番環境対応のRAG(検索拡張生成)システム構築ツ…
★ 1 Apache-2.0 2026-06-26
動画生成 GitHub runway-ml
Runwayは、動画、画像、オーディオ制作のための生成AIツールを開発する企業です。Gen-4モデルファミリーを基盤とし、…
★ 1 2026-06-20
画像生成 GitHub KinetiDiff
KinetiDiffは、進行性骨化性線維異形成症(FOP)の原因となるACVR1受容体を標的とするキナーゼ阻害剤を設計するため…
★ 1 MIT 2026-06-25
音声生成 / TTS GitHub speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
ASR / 音声認識 GitHub voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14
マルチモーダル GitHub claude-badpunpc
このツールは、Steamゲーム「これは諧音梗(BadPunPC)」をAnthropicのClaude Sonnet 4.6を使って全自動で攻略するAIソ…
★ 1 MIT 2026-05-03