3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
typoless
TypolessはmacOS向けのメニューバーアプリケーションで、グローバルな音声入力を可能にします。ローカルでの自動音声…
★ 6 ⑂ 1 2026-06-04
音声生成 / TTS
GitHub
Bao-Translate
Bao Translateは、Androidデバイス上で動作するプライベートなリアルタイム音声翻訳アプリです。マイクからの音声を…
★ 6 Apache-2.0 2026-06-30
AIエージェント
GitHub
fablize-for-hermes
fablize-for-hermesは、fablizeの検証済み手順をHermes Agentエコシステムに適合させたプロジェクトです。検証の根拠…
★ 5 MIT 2026-06-17
ASR / 音声認識
GitHub
Auto-Vod-Trimmer
VOD Auto Trimmerは、長時間のVODを手動で編集する手間を省くためのマルチスレッドPythonツールです。ローカルAI(Wh…
★ 5 ⑂ 1 GPL-3.0 2026-06-06
ASR / 音声認識
GitHub
PARSE
PARSEは、記述言語学のフィールドワークと、それに続く比較分析を支援するブラウザベースのワークステーションです。…
★ 5 MIT 2026-06-27
画像生成
GitHub
Multi-Modal-105
このプロジェクトは、テキストから画像(T2I)およびテキストから動画(T2V)を生成する、プロダクションレベルかつ…
★ 5 MIT 2026-06-06
動画生成
GitHub
wan2.2-i2v-fast
wan2.2-i2v-fastは、14BパラメータのWan-AI/Wan2.2-I2V-A14B-Diffusersモデルを活用した、実験的かつ高度に最適化さ…
★ 5 ⑂ 1 Apache-2.0 2026-06-15
画像生成
GitHub
CTGMWorkshop
このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…
★ 5 Unlicense 2026-06-23
ComfyUI
GitHub
comfyui-cyberdelia-z-engineer
ComfyUIの「Z-Image Turbo」ワークフロー向けに設計された、LLMを活用した高度なプロンプトエンジニアリングノードで…
★ 5 ⑂ 1 MIT 2026-05-18
AIエージェント
GitHub
Synthos
Synthosは、AIを活用した学術研究のための自己進化型コグニティブオペレーティングシステムです。Pythonスクリプトを…
★ 5 ⑂ 1 MIT 2026-06-30
音声生成 / TTS
GitHub
voice-audition
VoiceAuditionは、AIエージェント向けのTTS(Text-to-Speech)音声ディスカバリー・推薦ツールです。9つのTTSプロバ…
★ 5 ⑂ 1 MIT 2026-07-03
AIエージェント
GitHub
laravel-agent-mcp
「laravel-agent-mcp」は、Laravelアプリケーションのデータベーススキーマ、クエリ、ログ、キュー、キャッシュ、ル…
★ 5 ⑂ 1 MIT 2026-06-22
画像生成
GitHub
drawthings-grpc-hermes-plugin
このツールは、Hermes AgentがDraw Thingsのローカル画像生成機能を利用できるようにするgRPCプラグインです。Draw T…
★ 5 ⑂ 1 MIT 2026-06-02
ASR / 音声認識
GitHub
youtube-caption-tool
「Verbatim · YouTube逐字稿工具」は、YouTube動画の文字起こしを支援するローカルで動作するウェブツールです。主な…
★ 5 2026-05-10
マルチモーダル
GitHub
multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
ASR / 音声認識
GitHub
wisprflow-sdk
WisprFlow SDKは、Wispr Flowデスクトップクライアントの非公式Python SDKです。Wispr Flowの音声APIをリバースエン…
★ 5 ⑂ 1 MIT 2026-06-09
AIエージェント
GitHub
mcpagent
MCPAGENT ($MCPX) は、Baseネットワーク上で動作するトラストレスなエージェントプロトコルです。ERC-8004に基づくエ…
★ 5 MIT 2026-05-17
3D / NeRF
GitHub
wavelet-splatting
WIPES(Wavelet-based Visual Primitives)は、多次元視覚信号の効率的な表現を目的としたウェーブレットベースの視…
★ 5 MIT 2026-06-04
ASR / 音声認識
GitHub
Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
ComfyUI
GitHub
ComfyUI-Drawer
ComfyUI-Drawerは、ComfyUIの複雑なワークフローをモバイルフレンドリーなモジュール式UIプラットフォームに変革しま…
★ 5 ⑂ 2 NOASSERTION 2026-05-16
動画生成
GitHub
llm-video-maker
このLLM Video Makerは、AIコーディングエージェント(Claude Code、Cursor、Codex、Windsurf、Geminiなど)向けのス…
★ 5 MIT 2026-06-17
画像生成
GitHub
gpt-magazine-portrait-workflow
このプロジェクトは、Codexの画像生成能力とGPT Imageの基準を活用し、人物の雑誌写真風画像を生成するワークフロー…
★ 5 MIT 2026-06-08
音声生成 / TTS
GitHub
voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
マルチモーダル
GitHub
Auto_Translator
Auto-Translatorは、複数のエージェントを活用したPDFコンテンツの自動翻訳ツールです。原文のフォーマットを完璧に…
★ 5 ⑂ 1 2026-04-16