3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ComfyUI GitHub comfyui-cyberdelia-z-engineer
ComfyUIの「Z-Image Turbo」ワークフロー向けに設計された、LLMを活用した高度なプロンプトエンジニアリングノードで…
★ 5 ⑂ 1 MIT 2026-05-18
AIエージェント GitHub Synthos
Synthosは、AIを活用した学術研究のための自己進化型コグニティブオペレーティングシステムです。Pythonスクリプトを…
★ 5 ⑂ 1 MIT 2026-06-30
音声生成 / TTS GitHub voice-audition
VoiceAuditionは、AIエージェント向けのTTS(Text-to-Speech)音声ディスカバリー・推薦ツールです。9つのTTSプロバ…
★ 5 ⑂ 1 MIT 2026-07-03
AIエージェント GitHub laravel-agent-mcp
「laravel-agent-mcp」は、Laravelアプリケーションのデータベーススキーマ、クエリ、ログ、キュー、キャッシュ、ル…
★ 5 ⑂ 1 MIT 2026-06-22
画像生成 GitHub image2tools
Image2Toolsは、GPT Image 2、GeminiベースのNano Banana 3など多様なAI画像モデルに対応した、使いやすいオールイン…
★ 5 MIT 2026-06-25
画像生成 GitHub drawthings-grpc-hermes-plugin
このツールは、Hermes AgentがDraw Thingsのローカル画像生成機能を利用できるようにするgRPCプラグインです。Draw T…
★ 5 ⑂ 1 MIT 2026-06-02
ASR / 音声認識 GitHub youtube-caption-tool
「Verbatim · YouTube逐字稿工具」は、YouTube動画の文字起こしを支援するローカルで動作するウェブツールです。主な…
★ 5 2026-05-10
マルチモーダル GitHub multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
ASR / 音声認識 GitHub wisprflow-sdk
WisprFlow SDKは、Wispr Flowデスクトップクライアントの非公式Python SDKです。Wispr Flowの音声APIをリバースエン…
★ 5 ⑂ 1 MIT 2026-06-09
AIエージェント GitHub mcpagent
MCPAGENT ($MCPX) は、Baseネットワーク上で動作するトラストレスなエージェントプロトコルです。ERC-8004に基づくエ…
★ 5 MIT 2026-05-17
3D / NeRF GitHub wavelet-splatting
WIPES(Wavelet-based Visual Primitives)は、多次元視覚信号の効率的な表現を目的としたウェーブレットベースの視…
★ 5 MIT 2026-06-04
ASR / 音声認識 GitHub Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
ComfyUI GitHub ComfyUI-Drawer
ComfyUI-Drawerは、ComfyUIの複雑なワークフローをモバイルフレンドリーなモジュール式UIプラットフォームに変革しま…
★ 5 ⑂ 2 NOASSERTION 2026-05-16
画像生成 GitHub gpt-magazine-portrait-workflow
このプロジェクトは、Codexの画像生成能力とGPT Imageの基準を活用し、人物の雑誌写真風画像を生成するワークフロー…
★ 5 MIT 2026-06-08
音声生成 / TTS GitHub voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
マルチモーダル GitHub Auto_Translator
Auto-Translatorは、複数のエージェントを活用したPDFコンテンツの自動翻訳ツールです。原文のフォーマットを完璧に…
★ 5 ⑂ 1 2026-04-16
AIエージェント GitHub AeroGraph
AeroGraphは、AIエージェントのワークフローに特化したオープンソースの視覚的デバッガー兼フライトレコーダーです。…
★ 5 ⑂ 2 Apache-2.0 2026-06-30
LLM GitHub pi-automode
pi-automodeは、Piエージェントのツール呼び出しを監視し、事前定義されたルールや自動モード分類器に基づいて、危険…
★ 5 MIT 2026-06-25
画像生成 GitHub reward-guidance
このツールは「Are we really tilting?」論文の実験コードで、フロー・拡散モデルにおける報酬ガイダンスのメカニズ…
★ 5 ⑂ 1 MIT 2026-05-07
ASR / 音声認識 GitHub prj-voca-ai
Vocaは、WhatsAppなどの音声メッセージを、ChatGPT、Claude、Geminiといったあらゆる大規模言語モデル(LLM)で利用…
★ 5 MIT 2026-04-23
AIエージェント GitHub ai-security-methodology
AI Security Methodologyは、AIエージェント向けのセキュリティ研究方法論を提供するリポジトリです。攻撃パターン、…
★ 5 MIT 2026-05-23
音声生成 / TTS GitHub awesome-voice-ai
このGitHubリポジトリは、音声AIツールの厳選されたリストを提供しており、音声エージェント、テキスト読み上げ (TTS…
★ 5 ⑂ 8 MIT 2026-04-10
音声生成 / TTS GitHub arli
ARLIは、Rustで開発された、多機能かつプロダクショングレードのAIエージェントハーネスです。ランタイム依存を持た…
★ 5 MIT 2026-06-27
画像生成 GitHub nitograph
Nitographは、MNISTの数字をネオン風のストリングアートに変換し、釘から釘への連続的な糸の経路を生成するクラス条…
★ 5 2026-06-12