3,634 repos GH 3,519 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

画像生成
GitHub
M2GenCO
M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…
★ 6 2026-05-26
音声生成 / TTS
GitHub
chorus
Chorusは、YouTubeの長い動画コンテンツを効率的に消費するための画期的なツールです。YouTubeのURLまたは思想家の名…
★ 6 2026-04-25
音声生成 / TTS
GitHub
kokopop
「kokopop」は、Pythonの依存関係なしにGGUF形式のKokoroテキスト読み上げモデルを実行するためのスタンドアロンC++…
★ 6 MIT 2026-05-29
ComfyUI
GitHub
TrendCut-Studio
TrendCut Studioは、短編動画運用向けのローカル自動化ワークベンチです。ホットスポット発見、素材分析、スクリプト…
★ 6 ⑂ 2 MIT 2026-06-05
音声生成 / TTS
HF
mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 6 ↓ 131 mit 2026-05-01
画像生成
GitHub
chatgpt-web-gen
このツールは、ChatGPT Plus/Pro/Teamアカウントを持つユーザー向けに、APIキーなしでChatGPT Webの画像生成機能を利…
★ 6 ⑂ 1 MIT 2026-06-07
AIエージェント
GitHub
Local-Model
このツールは、Kali Linux上でQwen 2.5-7Bモデル(LM Studio経由)を活用する、完全にローカルで自律的なサイバーセ…
★ 6 ⑂ 2 MIT 2026-06-17
ComfyUI
GitHub
WavTTS-ComfyUI
WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。参照音声とテキス…
★ 6 ⑂ 1 MIT 2026-06-04
3D / NeRF
GitHub
higs
HiGSは、SIGGRAPH Asia 2025で発表された「Inverse Radiative Transport for Infrared Scenes with Gaussian Primiti…
★ 6 ⑂ 1 2026-06-09
ComfyUI
GitHub
ComfyUI-Wildcard-Pipeline
ComfyUIのためのモジュール式プロシージャルプロンプト生成ツールです。ワイルドカード、固定値、結合、派生、制約を…
★ 6 ⑂ 2 GPL-3.0 2026-06-22
AIエージェント
GitHub
Hive
Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…
★ 6 MIT 2026-06-11
ASR / 音声認識
GitHub
soyle
SöyleはmacOS向けのプッシュツートーク型音声認識ツールです。キーを押しながら話すと、話した内容がデバイス上で100…
★ 6 MIT 2026-06-21
画像生成
GitHub
codex-gpt-image-2-subscription
このツールは、ChatGPT/Codexのサブスクリプションを利用し、APIキーや従量課金なしでgpt-image-2モデルによる画像生…
★ 6 ⑂ 2 MIT 2026-06-07
ComfyUI
GitHub
comfyui-ai-studio
ComfyUI AI Studioは、AI画像、動画、音楽生成のためのワークフロー駆動型クリエイティブスタジオです。ComfyUIの強…
★ 6 ⑂ 1 MIT 2026-05-03
ASR / 音声認識
GitHub
typoless
TypolessはmacOS向けのメニューバーアプリケーションで、グローバルな音声入力を可能にします。ローカルでの自動音声…
★ 6 ⑂ 1 2026-06-04
AIエージェント
GitHub
noah-gen3-type2
「noah-gen3-type2」は、コンテキスト管理、記憶閉ループ、自律進化を特徴とする汎用型AI認知アーキテクチャです。「…
★ 6 2026-06-18
音声生成 / TTS
GitHub
claude-code-audio-recap
このツールは、Claude Codeの作業内容を画面を見ずに音声で把握できるプラグインです。Claude Codeの各ターンの要約…
★ 6 Apache-2.0 2026-06-18
マルチモーダル
GitHub
egobabyvlm
本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ(BabyView …
★ 6 NOASSERTION 2026-06-23
ComfyUI
GitHub
MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 6 ⑂ 3 MIT 2026-06-04
ASR / 音声認識
GitHub
Live-Church-Captions
Church Capは、教会向けに開発されたオープンソースかつローカルファーストのリアルタイムキャプションアプリです。…
★ 6 MIT 2026-06-23
ASR / 音声認識
GitHub
murmur
Murmurは、macOSユーザー向けのローカルファーストなホールド・トゥ・トーク音声文字変換アプリです。ホットキーを押…
★ 6 MIT 2026-06-09
音声生成 / TTS
GitHub
BridgeSpeak
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…
★ 6 ⑂ 2 MIT 2026-05-10
画像生成
GitHub
spade
SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…
★ 6 MIT 2026-06-09