3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
画像生成 GitHub IDLM
IDLM(Inverse-distilled Diffusion Language Models)は、ICML 2026で発表された画期的な技術です。本技術は、高品…
★ 16 MIT 2026-06-08
ASR / 音声認識 GitHub speaky
SpeakyはmacOS向けの音声テキスト変換ツールです。ホットキーを押して話すだけで、オンデバイスAIまたはオプションで…
★ 16 ⑂ 4 MIT 2026-03-09
音声生成 / TTS GitHub ZastTranslate
ZastTranslateは、動画の翻訳とAI音声クローンによる吹き替えを100%ローカルで実行するツールです。APIキー不要で、…
★ 16 ⑂ 1 2026-06-08
画像生成 GitHub av-pedestrian-diffusion-mppi
このツールは、UIUC Polaris GEM e4向けの歩行者認識自律走行スタック「ADAPT」です。拡散ベースの歩行者軌道予測器…
★ 16 ⑂ 3 MIT 2026-06-09
3D / NeRF HF VoxTell
VoxTellは、自然文のテキスト指示からCT・MRI・PETなどの3D医用画像に対するセグメンテーションマスクを生成できる医…
❤ 16 ↓ 264 cc-by-nc-sa-4.0 2026-06-26
ComfyUI GitHub NixKits
NixKitsは、ソフトウェア、パッチ、NixOSモジュール、AIコーディングアシスタント向けスキルを集約したプロジェクト…
★ 16 MIT 2026-06-26
ComfyUI GitHub ComfyClaw
ComfyClawは、ComfyUIワークフローの発見、検査、実行を可能にするCLIツールです。タグベースのパラメータ上書きとサ…
★ 16 ⑂ 6 MIT 2026-04-14
マルチモーダル GitHub sattxt
SATtxtは、衛星画像を解析するための最先端のビジョン・言語基盤モデルです。DINOv3のビジョンエンコーダとLLM2Vecの…
★ 16 ⑂ 1 2026-03-21
LLM GitHub awesome-gen-ai-fails
「Awesome GenAI Fails」は、生成AI、LLM、AIエージェントへの過信が企業、個人、社会に害をもたらした主要なインシ…
★ 16 ⑂ 1 CC0-1.0 2026-06-19
3D / NeRF GitHub 3DTiles-Inspector
3DTiles-Inspectorは、Node.jsパッケージとCLIツールであり、3D Tilesタイルセットのインタラクティブな編集を可能に…
★ 16 ⑂ 2 Apache-2.0 2026-06-23
音声生成 / TTS GitHub Auris
Aurisは、EPUB、PDF、TXT形式の電子書籍をオフラインでオーディオブックとして楽しむためのツールです。ローカルで動…
★ 15 ⑂ 1 MIT 2026-05-12
LLM GitHub Forge-Agentic-Coding-CLI
Forgeは、ローカルファーストで計画重視のマルチエージェント型ソフトウェアエンジニアリング実行環境です。Claude C…
★ 15 ⑂ 9 MIT 2026-06-29
画像生成 GitHub npedit
NP-Editは、画像編集モデルの学習において画像編集ペアデータが不要な画期的な手法を提案する、ICLR 2026で発表され…
★ 15 ⑂ 1 MIT 2026-05-05
マルチモーダル GitHub paddleocr-pdf-api
このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。PaddleOCRとPaddleOCR-VLモデルを搭…
★ 15 ⑂ 4 2026-06-10
LLM GitHub permafrost
Permafrostは、Claude CodeとDeepSeekの間に入り、Claude Codeのプロンプト接頭辞を固定することで、DeepSeekの自動…
★ 15 ⑂ 2 MIT 2026-06-23
3D / NeRF GitHub SLARM
SLARMは、動的なシーンの再構築、セマンティックな理解、リアルタイムストリーミング推論を統合するフィードフォワー…
★ 15 MIT 2026-06-09
マルチモーダル GitHub WikiSeeker
WikiSeekerは、知識ベースの視覚的質問応答(KB-VQA)のために開発された革新的なマルチモーダルRAGフレームワークで…
★ 15 Apache-2.0 2026-04-18
ASR / 音声認識 GitHub OpenFlow
Openflowは、Windowsデスクトップ向けに設計されたディクテーションアプリです。ユーザーが`Ctrl + Win`を押している…
★ 15 ⑂ 2 MIT 2026-05-28
マルチモーダル GitHub Qwen3-VL-Video-Grounding
Qwen3-VL-Video-Groundingは、Qwen3-VL多モーダル画像言語モデルを活用したGradioベースのWebアプリケーションです。…
★ 15 ⑂ 3 Apache-2.0 2026-02-28
LLM GitHub ECG-Language-Models
このリポジトリは、ECG(心電図)言語モデル(ELM)のファインチューニングと評価のための研究フレームワークです。…
★ 15 ⑂ 2 MIT 2026-06-24
3D / NeRF GitHub VLM-Instruct-FastGS
VLM-Instruct-FastGSは、3D Gaussian Splatting技術を拡張し、Vision-Language Models (VLM) からのセマンティックガ…
★ 15 NOASSERTION 2026-03-05
3D / NeRF GitHub UnrealEngine5-Skills
UnrealEngine5-Skillsは、Unreal Engine 5.6/5.7向けの再利用可能なワークフローを提供するスキルパックです。ブルー…
★ 15 ⑂ 2 MIT 2026-06-29
マルチモーダル GitHub GalamseyWatch
このツールは、Sentinel-2衛星画像から違法な小規模金採掘(ガラッセイ)を検出するエージェント型地球観測システム…
★ 15 ⑂ 6 MIT 2026-05-05
動画生成 GitHub clipforge
ClipForgeは、AIを活用してYouTubeショートやTikTok向けの短編動画を自動生成するツールです。トピックを与えるだけ…
★ 15 ⑂ 3 MIT 2026-03-17