3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
voxrt-asr-android
このツールは、Androidデバイス向けに設計されたストリーミング音声認識ライブラリです。VoxRT独自のオンデバイス推…
★ 10 Apache-2.0 2026-06-04
画像生成
HF
Qwen_Image_Edit-Remix-v2_0_GGUF
Qwen Image Edit Remix v2.0 を GGUF 量子化形式で配布するための軽量モデルリポジトリです。README上では元モデルへ…
❤ 10 ↓ 767 2026-04-05
画像生成
GitHub
tmpd-public
Topological Motion Planning Diffusion(TMPD)は、障害物が多い環境で係留型ロボットが絡まない経路を生成するため…
★ 10 MIT 2026-04-09
画像生成
GitHub
windinet
WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学(CFD)シミュレーション…
★ 10 ⑂ 3 Apache-2.0 2026-04-15
LLM
GitHub
astro-slop
astro-slopは、AstroプロジェクトでLLM(大規模言語モデル)向けにウェブコンテンツを最適化し、Markdown形式で出力…
★ 10 ⑂ 1 MIT 2026-05-11
LLM
GitHub
SWE-Model-Arena
SWE-Model-Arenaは、ソフトウェアエンジニアリングタスク向けのツール呼び出しモデルをペアで比較評価するためのオー…
★ 10 ⑂ 1 2026-04-04
画像生成
GitHub
openai-compatible-imagegen
このリポジトリは、OpenAI互換の画像APIを通じてエージェントクライアントが画像生成、編集、バッチ処理を行うための…
★ 10 ⑂ 2 MIT 2026-06-22
動画生成
GitHub
phyco-sim
PhyCo-Sim(非公式)は、CVPR 2026で発表されたPhyCoの物理シミュレーションデータ生成パイプラインを独自に実装した…
★ 10 NOASSERTION 2026-06-08
ASR / 音声認識
GitHub
AtomVoice
AtomVoiceは、Mac向けに設計された、プライバシーを最優先する軽量な音声テキスト化ツールです。ユーザーはキーを押…
★ 10 NOASSERTION 2026-06-17
画像生成
GitHub
Cross-Modality-Conditional-Diffusion-Model
このプロジェクトは、T1加重MRI画像とT2加重MRIスキャン間の医療画像モダリティ変換を行う、条件付き拡散モデルの実…
★ 10 MIT 2026-05-13
マルチモーダル
GitHub
MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
LLM
GitHub
agent-ready-component
このツールは、Convexバックエンドを利用して、AIエージェントがアプリケーションを効率的に認識・発見できるように…
★ 9 NOASSERTION 2026-05-03
音声生成 / TTS
GitHub
vecslide
VecSlideは、SVGスライドとOpusオーディオを同期させた、ベクトルプレゼンテーションフォーマットです。ZIP形式の`.v…
★ 9 NOASSERTION 2026-04-20
音声生成 / TTS
GitHub
voxlert
Voxlertは、Claude Code、Cursor、OpenAI Codex、pi、OpenClawなどのLLM生成AIコーディングエージェント向けに、ゲー…
★ 9 ⑂ 2 MIT 2026-06-20
画像生成
GitHub
CVQ
このリポジトリは、革新的な画像トークン化手法「Channel-wise Vector Quantization (CVQ)」とその応用である「Chann…
★ 9 MIT 2026-06-01
ASR / 音声認識
GitHub
Premiere-Pro-edit-bibl
Premiere Auto-Editは、話している動画(ロングフォーム・トーク・ライブ)のラフカットを、たった1つのコマンドで自…
★ 9 ⑂ 3 MIT 2026-06-15
ASR / 音声認識
GitHub
afrispeech-selector
AfriSpeech Selectorは、142のアフリカ言語にわたる2200時間以上の音声データに簡単にアクセスできるCLIツールです。…
★ 9 ⑂ 5 2026-06-19
画像生成
GitHub
ComfyUI-PlagueKind-Nodes
「ComfyUI-PlagueKind-Nodes」は、ComfyUIユーザー向けに画像とマスクのリサイズを統合し、LoRAの高度なスタッキング…
★ 9 ⑂ 2 MIT 2026-05-31
マルチモーダル
GitHub
SynCLIP
SynCLIPは、セマンティクス的に同等な表現でも空間的注意が異なるという、オープンボキャブラリー高密度知覚(OVDP)…
★ 9 ⑂ 1 Apache-2.0 2026-06-04
ComfyUI
GitHub
ComfyUI-Subworkflow
ComfyUI-Subworkflowは、ComfyUIの既存ワークフローを再利用可能な「サブワークフロー」として活用するための拡張機…
★ 9 ⑂ 2 GPL-3.0 2026-04-28
ASR / 音声認識
GitHub
find-influencer-skill
このスキルは、AIエージェントが小紅書、抖音、Bilibili、YouTubeなどの複数のプラットフォームでインフルエンサーを…
★ 9 2026-05-07
マルチモーダル
GitHub
mlx-serve
mlx-serveは、Apple Silicon搭載Mac (M1+以降) 向けのローカル推論サーバーです。このツールは、AppleのネイティブML…
★ 9 ⑂ 1 MIT 2026-06-23