3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub typoless
TypolessはmacOS向けのメニューバーアプリケーションで、グローバルな音声入力を可能にします。ローカルでの自動音声…
★ 6 ⑂ 1 2026-06-04
音声生成 / TTS GitHub Bao-Translate
Bao Translateは、Androidデバイス上で動作するプライベートなリアルタイム音声翻訳アプリです。マイクからの音声を…
★ 6 Apache-2.0 2026-06-30
AIエージェント GitHub fablize-for-hermes
fablize-for-hermesは、fablizeの検証済み手順をHermes Agentエコシステムに適合させたプロジェクトです。検証の根拠…
★ 5 MIT 2026-06-17
ASR / 音声認識 GitHub Auto-Vod-Trimmer
VOD Auto Trimmerは、長時間のVODを手動で編集する手間を省くためのマルチスレッドPythonツールです。ローカルAI(Wh…
★ 5 ⑂ 1 GPL-3.0 2026-06-06
ASR / 音声認識 GitHub PARSE
PARSEは、記述言語学のフィールドワークと、それに続く比較分析を支援するブラウザベースのワークステーションです。…
★ 5 MIT 2026-06-27
画像生成 GitHub Multi-Modal-105
このプロジェクトは、テキストから画像(T2I)およびテキストから動画(T2V)を生成する、プロダクションレベルかつ…
★ 5 MIT 2026-06-06
動画生成 GitHub wan2.2-i2v-fast
wan2.2-i2v-fastは、14BパラメータのWan-AI/Wan2.2-I2V-A14B-Diffusersモデルを活用した、実験的かつ高度に最適化さ…
★ 5 ⑂ 1 Apache-2.0 2026-06-15
画像生成 GitHub CTGMWorkshop
このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…
★ 5 Unlicense 2026-06-23
ComfyUI GitHub comfyui-cyberdelia-z-engineer
ComfyUIの「Z-Image Turbo」ワークフロー向けに設計された、LLMを活用した高度なプロンプトエンジニアリングノードで…
★ 5 ⑂ 1 MIT 2026-05-18
AIエージェント GitHub Synthos
Synthosは、AIを活用した学術研究のための自己進化型コグニティブオペレーティングシステムです。Pythonスクリプトを…
★ 5 ⑂ 1 MIT 2026-06-30
音声生成 / TTS GitHub voice-audition
VoiceAuditionは、AIエージェント向けのTTS(Text-to-Speech)音声ディスカバリー・推薦ツールです。9つのTTSプロバ…
★ 5 ⑂ 1 MIT 2026-07-03
AIエージェント GitHub laravel-agent-mcp
「laravel-agent-mcp」は、Laravelアプリケーションのデータベーススキーマ、クエリ、ログ、キュー、キャッシュ、ル…
★ 5 ⑂ 1 MIT 2026-06-22
画像生成 GitHub drawthings-grpc-hermes-plugin
このツールは、Hermes AgentがDraw Thingsのローカル画像生成機能を利用できるようにするgRPCプラグインです。Draw T…
★ 5 ⑂ 1 MIT 2026-06-02
ASR / 音声認識 GitHub youtube-caption-tool
「Verbatim · YouTube逐字稿工具」は、YouTube動画の文字起こしを支援するローカルで動作するウェブツールです。主な…
★ 5 2026-05-10
マルチモーダル GitHub multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
ASR / 音声認識 GitHub wisprflow-sdk
WisprFlow SDKは、Wispr Flowデスクトップクライアントの非公式Python SDKです。Wispr Flowの音声APIをリバースエン…
★ 5 ⑂ 1 MIT 2026-06-09
AIエージェント GitHub mcpagent
MCPAGENT ($MCPX) は、Baseネットワーク上で動作するトラストレスなエージェントプロトコルです。ERC-8004に基づくエ…
★ 5 MIT 2026-05-17
3D / NeRF GitHub wavelet-splatting
WIPES(Wavelet-based Visual Primitives)は、多次元視覚信号の効率的な表現を目的としたウェーブレットベースの視…
★ 5 MIT 2026-06-04
ASR / 音声認識 GitHub Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
ComfyUI GitHub ComfyUI-Drawer
ComfyUI-Drawerは、ComfyUIの複雑なワークフローをモバイルフレンドリーなモジュール式UIプラットフォームに変革しま…
★ 5 ⑂ 2 NOASSERTION 2026-05-16
動画生成 GitHub llm-video-maker
このLLM Video Makerは、AIコーディングエージェント(Claude Code、Cursor、Codex、Windsurf、Geminiなど)向けのス…
★ 5 MIT 2026-06-17
画像生成 GitHub gpt-magazine-portrait-workflow
このプロジェクトは、Codexの画像生成能力とGPT Imageの基準を活用し、人物の雑誌写真風画像を生成するワークフロー…
★ 5 MIT 2026-06-08
音声生成 / TTS GitHub voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
マルチモーダル GitHub Auto_Translator
Auto-Translatorは、複数のエージェントを活用したPDFコンテンツの自動翻訳ツールです。原文のフォーマットを完璧に…
★ 5 ⑂ 1 2026-04-16