3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音楽生成 GitHub rl-beat-generation
このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…
★ 1 MIT 2026-05-10
動画生成 GitHub shotlist-forge
「shotlist-forge」は、1つのコンセプトからテキストtoビデオモデル(Seedance, Kling, Runway, Veoなど)向けの構造…
★ 1 MIT 2026-06-03
3D / NeRF GitHub SparseNeRF-pytorch
本ツールは、SparseNeRFに触発された、スパースビュー(少数の視点からの画像)からの新しい視点合成を目的とした非…
★ 1 MIT 2026-06-07
3D / NeRF GitHub comfyui-splat-loader
Splat Loaderは、人気のある画像生成UIであるComfyUI用のカスタムノードです。このツールは、Gaussian Splatting形式…
★ 1 ⑂ 1 MIT 2026-06-11
音声生成 / TTS GitHub VoiceReaderApp
VoiceReaderAppは、PDF、EPUB、Markdown、またはWeb記事を、AIでクローンした自分自身の声で読み上げるiOS用リーダー…
★ 1 MIT 2026-06-24
ASR / 音声認識 GitHub funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14
マルチモーダル GitHub whatfirst-small
whatfirst · smallは、タスクの優先順位付けを支援する、ローカルで動作する小型のビジョン言語モデル(Qwen2.5-VL-3…
★ 1 Apache-2.0 2026-06-19
画像生成 GitHub freebieai
「FreebieAI」は、APIキー、サインアップ、課金が一切不要な無料のAI画像生成ツールです。単一の`index.html`ファイ…
★ 1 2026-06-14
AIエージェント GitHub coder-crew
coder-crewは、テスト駆動型のエージェントAIコーディングツールです。マネージャーモデルがコーディングタスクをサ…
★ 1 MIT 2026-06-18
ComfyUI GitHub comfyui-weaver
comfyui-weaverは、Claude CodeがComfyUI(ローカルおよびComfy Cloud)を操作できるようにする自己完結型MCPサーバ…
★ 1 MIT 2026-06-11
3D / NeRF GitHub Ghost-Eye
Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU(ピーク時…
★ 1 Apache-2.0 2026-05-10
画像生成 GitHub DSCA-ReID-Framework
本リポジトリは、人再識別における「拡散ベースのセマンティックカモフラージュ攻撃(DSCA)」に特化した軽量なPyTor…
★ 1 MIT 2026-05-28
動画生成 GitHub seedance-2.0-api
Seedance 2.0 APIは、fal.aiを通じて提供されるByteDanceの最先端AI動画生成モデルです。テキスト、画像、または参照…
★ 1 ⑂ 2 MIT 2026-04-16
マルチモーダル GitHub PROSOPO
「Face AI」は、バイアス軽減に重点を置いた最先端の公平な顔認識システムです。顔検出、アライメント、埋め込み抽出…
★ 1 2026-05-22
AIエージェント GitHub loom
loomは、耐久性のあるエージェント実行エンジン「Sibyl」のためのSlackフロントエンドです。Slackのメッセージやコマ…
★ 1 2026-05-25
音声生成 / TTS GitHub lux-tts
LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…
★ 1 NOASSERTION 2026-05-10
3D / NeRF GitHub pose-from-silhouette
このリポジトリは、CVPR 2026に採択された「Globally Optimal Pose from Orthographic Silhouettes」の公式MATLAB実…
★ 1 AGPL-3.0 2026-06-03
マルチモーダル GitHub qwen-visual-training-lab
「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…
★ 1 2026-05-15
ComfyUI GitHub Centraliza.AI
Centraliza.AIは、LM Studio、Ollama、ComfyUI、Llama.cppなどのローカルAIモデルを一元管理するためのプレミアムダ…
★ 1 2026-06-04
音声生成 / TTS GitHub agentic-podcast
このツールは、データ駆動型のポッドキャストを人間が介入することなく毎日自動で生成し、ナレーションを付け、Spoti…
★ 1 MIT 2026-06-10
画像生成 GitHub f1-physics-engine
F1物理エンジンは、F1レースにおける車の動きを言語指示に基づいてビデオ生成するAIツールです。開始フレームと「急…
★ 1 ⑂ 1 MIT 2026-06-06
マルチモーダル GitHub ragonfire
RagOnFireは、Apple Silicon Mac向けに設計された完全ローカルなマルチモーダルRAG(検索拡張生成)システムです。Ol…
★ 1 MIT 2026-05-21
音楽生成 GitHub Conditional-Music-Generation
このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…
★ 1 MIT 2026-05-12
画像生成 GitHub nano-banana-2-api
APIDotのNano Banana 2 APIは、GoogleのGemini 3.1 Flash Imageモデルを活用し、高速で高品質な画像生成と自然言語に…
★ 1 MIT 2026-05-25