3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
soyle
SöyleはmacOS向けのプッシュツートーク型音声認識ツールです。キーを押しながら話すと、話した内容がデバイス上で100…
★ 6 MIT 2026-06-21
画像生成
GitHub
nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
3D / NeRF
GitHub
4dgs-human-avatar-comfyui-nodes-dataset
このリポジトリは、ComfyUI向けの究極の4DGS(4D Gaussian Splatting)モジュール「Shramko-Volumetric-Bridge」と、…
★ 6 Apache-2.0 2026-06-19
マルチモーダル
GitHub
Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
動画生成
GitHub
seedance-superprompt
Seedance 2.0 Superpromptは、ByteDance Seedance 2.0の動画生成プロンプト作成を支援するポータブルなプロンプトス…
★ 6 ⑂ 2 MIT 2026-05-23
3D / NeRF
GitHub
StoryCore-Engine
StoryCore Engineは、スクリプトから一貫性のある画像、動画、ストーリー、対話、空間オーディオを生成する、ローカ…
★ 6 ⑂ 1 MIT 2026-06-25
マルチモーダル
GitHub
egobabyvlm
本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ(BabyView …
★ 6 NOASSERTION 2026-06-23
LLM
GitHub
El-Primor
El Primorは、OpenCode環境で開発者を支援するために設計された、自己適応型AIエージェントです。単なる機能性だけで…
★ 6 MIT 2026-06-13
ComfyUI
GitHub
WavTTS-ComfyUI
WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…
★ 6 ⑂ 1 MIT 2026-06-04
3D / NeRF
GitHub
SLAM-X
SLAM-Xは、NeRF-SLAMおよびGaussian Splatting SLAMシステムの動的なシーンにおけるロバスト性を向上させるためのプ…
★ 6 ⑂ 1 GPL-3.0 2025-12-09
音声生成 / TTS
GitHub
kokoro
Kokoro Serverlessは、RunPod上で動作するプロダクションレディな高品質テキスト読み上げ(TTS)サーバーレスエンド…
★ 6 ⑂ 4 Apache-2.0 2026-02-10
AIエージェント
GitHub
Hive
Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…
★ 6 MIT 2026-06-11
ASR / 音声認識
GitHub
murmur
Murmurは、macOSユーザー向けのローカルファーストなホールド・トゥ・トーク音声文字変換アプリです。ホットキーを押…
★ 6 MIT 2026-06-29
動画生成
GitHub
pollo-skills
Pollo SkillsはPollo AIが提供するAgent Skillsプラグインで、AIコーディングエージェントに動画生成やメディア処理…
★ 6 MIT 2026-03-14
画像生成
GitHub
awesome-ai-product-photography-prompts
このGitHubリポジトリは、AIによる商品写真のプロンプト、Eコマース向けの画像ワークフロー、広告クリエイティブテン…
★ 6 2026-04-28
ComfyUI
GitHub
MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 6 ⑂ 3 MIT 2026-06-04
ASR / 音声認識
GitHub
hush
HushはmacOS向けのローカルプッシュトゥトーク音声入力ツールです。指定されたショートカットキー(デフォルトはfnキ…
★ 6 ⑂ 1 MIT 2026-06-10
ASR / 音声認識
GitHub
game_voice_trans
VoxGoは、PCゲームプレイヤー向けに開発されたオープンソースのリアルタイム音声翻訳フロートウィンドウツールです。…
★ 6 GPL-3.0 2026-06-29
3D / NeRF
GitHub
generative-ai-start-to-surrender
このGitHubリポジトリは、「Generative AI: From Start to Surrender – A Practical Guide to Mastering and Struggl…
★ 6 ⑂ 1 NOASSERTION 2025-10-08
画像生成
GitHub
awesome-gpt-image-2-playground
「awesome-gpt-image-2-playground」は、ブラウザで無料で利用できる唯一のGPT Image 2プロンプトライブラリです。ユ…
★ 6 NOASSERTION 2026-05-06
AIエージェント
GitHub
noah-gen3-type2
「noah-gen3-type2」は、コンテキスト管理、記憶閉ループ、自律進化を特徴とする汎用型AI認知アーキテクチャです。「…
★ 6 2026-06-24
マルチモーダル
GitHub
Operator-on-Android
Operatorは、PCに接続することなく、視覚言語モデル(VLM)を使用してAndroidスマートフォンを直接操作できるオンデ…
★ 6 ⑂ 1 MIT 2026-07-04
画像生成
GitHub
CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01