3,625 repos GH 3,510 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

画像生成
GitHub
tmpd-public
Topological Motion Planning Diffusion(TMPD)は、障害物が多い環境で係留型ロボットが絡まない経路を生成するため…
★ 10 MIT 2026-04-09
画像生成
GitHub
windinet
WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学(CFD)シミュレーション…
★ 10 ⑂ 3 Apache-2.0 2026-04-15
画像生成
GitHub
awesome-free-ai-image-generator-prompts
このGitHubリポジトリは、「無料のAI画像生成プロンプト、テキスト-to-イメージワークフロー、AIアートプロンプトの…
★ 10 ⑂ 1 2026-04-28
音声生成 / TTS
GitHub
omnivoice-thai-api
nanofatdog/omnivoice-thai-apiは、追加学習不要のタイ語テキスト読み上げ(TTS)APIおよびWeb UIです。Voice Clonin…
★ 9 ⑂ 5 2026-05-22
マルチモーダル
GitHub
Awesome-VLA-Safety
本リポジトリは、Vision-Language-Action(VLA)モデルの安全性に関する厳選された研究論文リストです。データ準備、…
★ 9 2026-05-20
音声生成 / TTS
GitHub
vecslide
VecSlideは、SVGスライドとOpusオーディオを同期させた、ベクトルプレゼンテーションフォーマットです。ZIP形式の`.v…
★ 9 NOASSERTION 2026-04-20
画像生成
GitHub
MoneyPrinterPro
Persona Media Studioは、ペルソナに基づいた画像および動画生成のためのローカルファーストAIクリエイティブパイプ…
★ 9 MIT 2026-05-28
LLM
GitHub
agent-ready-component
このツールは、Convexバックエンドを利用して、AIエージェントがアプリケーションを効率的に認識・発見できるように…
★ 9 NOASSERTION 2026-05-03
AIエージェント
GitHub
lauren
Laurenは、コーディングエージェント向けの自律的なライブタスクキューシステムです。プロジェクトの進行中にタスク…
★ 9 ⑂ 1 MIT 2026-05-27
ASR / 音声認識
GitHub
GameVoiceAssistant
GameVoiceAssistantは、テキストベースのゲームに没入感を高めるための音声アシスタントツールです。AVGやビジュアル…
★ 9 2026-06-25
3D / NeRF
GitHub
map-creator
map-creatorは、DJIドローンを用いた3Dマッピングや写真測量ミッションを計画・視覚化するためのデスクトップアプリ…
★ 9 MIT 2026-05-09
画像生成
GitHub
ComfyUI-PlagueKind-Nodes
「ComfyUI-PlagueKind-Nodes」は、ComfyUIユーザー向けに画像とマスクのリサイズを統合し、LoRAの高度なスタッキング…
★ 9 ⑂ 2 MIT 2026-05-31
音声生成 / TTS
GitHub
voxlert
Voxlertは、Claude Code、Cursor、OpenAI Codex、pi、OpenClawなどのLLM生成AIコーディングエージェント向けに、ゲー…
★ 9 ⑂ 2 MIT 2026-06-28
AIエージェント
GitHub
agent-symphony
Architect — Agent Symphonyは、AnthropicのClaude Agent SDKを基盤とするデスクトップアプリケーションです。このツ…
★ 9 ⑂ 1 MIT 2026-06-03
音声生成 / TTS
GitHub
mimika-ai-voice-studio
Mimika – AI Voice Studioは、macOS向けに開発されたPythonフリーのネイティブなテキスト読み上げ(TTS)アプリケー…
★ 9 ⑂ 1 2026-06-09
ComfyUI
GitHub
ComfyUI-Subworkflow
ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…
★ 9 ⑂ 2 GPL-3.0 2026-04-28
マルチモーダル
GitHub
MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
ASR / 音声認識
GitHub
parakey
Parakeyは、Apple Silicon Mac向けのプッシュトゥトーク方式の音声入力ツールです。キーを押しながら話すと、キーを…
★ 9 MIT 2026-06-27
画像生成
GitHub
CVQ
このリポジトリは、革新的な画像トークン化手法「Channel-wise Vector Quantization (CVQ)」とその応用である「Chann…
★ 9 MIT 2026-06-01
AIエージェント
GitHub
web-speed-oss
Web Speedは、AIエージェント向けのWebページ解析ツールです。複雑なWebコンテンツ(HTML、レイアウト、JavaScript)…
★ 9 ⑂ 1 GPL-3.0 2026-05-10
ASR / 音声認識
GitHub
Premiere-Pro-edit-bibl
Premiere Auto-Editは、話している動画(ロングフォーム・トーク・ライブ)のラフカットを、たった1つのコマンドで自…
★ 9 ⑂ 3 MIT 2026-06-15
ASR / 音声認識
GitHub
afrispeech-selector
AfriSpeech Selectorは、142のアフリカ言語にわたる2200時間以上の音声データに簡単にアクセスできるCLIツールです。…
★ 9 ⑂ 5 2026-06-19
LLM
GitHub
rag-forge
「rag-forge」は、Retrieval-Augmented Generation(RAG)タスクに特化してLLM(大規模言語モデル)を効率的にファイ…
★ 9 ⑂ 1 NOASSERTION 2026-05-01