3,631 repos GH 3,516 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
画像生成 GitHub dbmsolver
DBMSolverは、高品質な画像間変換(Image-to-Image Translation)を実現するための、トレーニング不要な拡散ブリッジ…
★ 6 2026-06-05
ASR / 音声認識 GitHub Clippos
Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…
★ 6 ⑂ 1 MIT 2026-04-26
音声生成 / TTS GitHub ghost-narrator
Ghost Narratorは、ブログや静的サイト向けに自己ホスト型のAI音声ナレーションを提供するツールです。ElevenLabsの…
★ 6 ⑂ 1 MIT 2026-06-15
ASR / 音声認識 GitHub voxrt-asr-models
このリポジトリは、VoxRTオンデバイスランタイム向けに最適化されたASR(自動音声認識)モデルのウェイトを提供しま…
★ 6 NOASSERTION 2026-05-28
AIエージェント GitHub commerce-agents
commerce-agentsは、Eコマースアプリケーション向けに自律型エージェントを構築するためのツール群です。在庫管理、…
★ 6 MIT 2026-05-01
ASR / 音声認識 GitHub ai_interview
このツールは、リアルタイム音声対話、多段階面接、ライブ採点、詳細レポート生成機能を備えたAI駆動型模擬面接プラ…
★ 6 2026-06-15
画像生成 GitHub kimodo-houdini-bridge
このツールは、NVIDIA Kimodo(テキスト駆動の3D人体モーション生成AIモデル)をSideFX Houdiniに連携させるブリッジ…
★ 6 ⑂ 1 2026-06-10
LLM GitHub pioneer
Pioneerは、手元PCや自分で管理するサーバー上で動かせるローカルファーストの個人向けAIアシスタント基盤です。永続…
★ 6 MIT 2026-06-28
マルチモーダル GitHub AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 6 MIT 2026-06-12
動画生成 GitHub seedance-superprompt
Seedance 2.0 Superpromptは、ByteDance Seedance 2.0の動画生成プロンプト作成を支援するポータブルなプロンプトス…
★ 6 ⑂ 2 MIT 2026-05-23
LLM GitHub CRIMENET
CRIMENETは、世界中の犯罪組織間の同盟と敵対関係をマッピングしたオープンソースのデータベースおよびインタラクテ…
★ 6 MIT 2026-06-17
画像生成 GitHub awesome-gpt-image-2-playground
「awesome-gpt-image-2-playground」は、ブラウザで無料で利用できる唯一のGPT Image 2プロンプトライブラリです。ユ…
★ 6 NOASSERTION 2026-05-06
音声生成 / TTS GitHub the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 6 ⑂ 1 MIT 2026-05-27
AIエージェント GitHub otto
ottoは、AIエージェントの行動を改善・永続化するための「行動層」を提供するツールです。エージェントが過去の修正…
★ 6 ⑂ 1 MIT 2026-06-22
LLM GitHub Claude-Agentic-Skills2.0-version
vignesh2027/Claude-Agentic-Skills2.0-versionは、Anthropic社のClaude AI向けの「AgentOS 2.0」として、135以上の…
★ 6 MIT 2026-05-20
画像生成 GitHub best-ai-image-generator-resources
AI画像生成に関する最適なリソース、モデル比較フレームワーク、プロンプトガイド、編集ワークフロー、およびClipris…
★ 6 2026-04-28
LLM GitHub El-Primor
El Primorは、OpenCode環境で開発者を支援するために設計された、自己適応型AIエージェントです。単なる機能性だけで…
★ 6 MIT 2026-06-13
画像生成 GitHub image2tools
Image2Toolsは、GPT Image 2、GeminiベースのNano Banana 3など多様なAI画像モデルに対応した、使いやすいオールイン…
★ 5 MIT 2026-06-25
ASR / 音声認識 GitHub prj-voca-ai
Vocaは、WhatsAppなどの音声メッセージを、ChatGPT、Claude、Geminiといったあらゆる大規模言語モデル(LLM)で利用…
★ 5 MIT 2026-04-23
LLM GitHub Scraper
Deep Web Scraperは、サイバーセキュリティ研究者、脅威インテリジェンスアナリスト、プライバシー擁護者を対象とし…
★ 5 ⑂ 1 GPL-3.0 2026-05-02
LLM GitHub mini-rag
miniRは、AIエージェント向けの軽量でセルフホスト型のRAG(検索拡張生成)検索バックエンドです。Markdown、Word、P…
★ 5 ⑂ 1 MIT 2026-06-02
マルチモーダル GitHub multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
ASR / 音声認識 GitHub wisprflow-sdk
WisprFlow SDKは、Wispr Flowデスクトップクライアントの非公式Python SDKです。Wispr Flowの音声APIをリバースエン…
★ 5 ⑂ 1 MIT 2026-06-09
ComfyUI GitHub ComfyUI_834t_scene_composer
ComfyUI上でレイヤー単位のリージョナルプロンプト作業をまとめて行えるカスタムノードです。色別レイヤーごとにプロ…
★ 5 ⑂ 1 MIT 2026-04-03