3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ComfyUI GitHub comfyui-cyberdelia-z-engineer
ComfyUIの「Z-Image Turbo」ワークフロー向けに設計された、LLMを活用した高度なプロンプトエンジニアリングノードで…
★ 5 ⑂ 1 MIT 2026-05-18
動画生成 GitHub opencli-plugin-flow
このツールは、Google Labs FlowのOmni Flashビデオ生成機能をコマンドラインから利用するためのopencliプラグインで…
★ 5 ⑂ 2 2026-05-19
音声生成 / TTS GitHub openvoice-cloning
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…
★ 5 MIT 2026-06-13
動画生成 GitHub veo-api
Veo 3 APIは、Googleの最新AI動画生成モデルであるGoogle Veo 3(Veo3, Veo 3.1, Veo 3 Fast)へ、最も安価で容易に…
★ 5 MIT 2026-05-27
画像生成 GitHub bizyair-skill
BizyAir Skillは、AI Agent向けにAIGC(AI生成コンテンツ)機能を提供するスキルパッケージです。BizyAirのクラウド…
★ 5 ⑂ 1 MIT 2026-05-27
音声生成 / TTS GitHub awesome-voice-ai
このGitHubリポジトリは、音声AIツールの厳選されたリストを提供しており、音声エージェント、テキスト読み上げ (TTS…
★ 5 ⑂ 8 MIT 2026-04-10
3D / NeRF GitHub photo-to-mesh
「photo-to-mesh」は、オブジェクトの写真をクリーンでスケーリングされたダウンロード可能な3Dメッシュに変換するツ…
★ 5 MIT 2026-06-15
LLM GitHub spark-1822
このリポジトリは、NVIDIA DGX Sparkワークステーション向けの包括的な設定を提供します。Caddyリバースプロキシ、Op…
★ 5 ⑂ 1 MIT 2026-06-08
ASR / 音声認識 GitHub Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
ComfyUI GitHub comfyui-image-tiled-nodes
「ComfyUI Image Tiled Nodes」は、ComfyUI用のカスタムノードセットです。このツールは、大規模な画像を重複するタ…
★ 5 ⑂ 1 MIT 2026-06-10
ComfyUI GitHub n8n-nodes-comfyui-toolkit
このツールは、ワークフロー自動化ツールであるn8nから、高性能な画像・動画生成AIであるComfyUIを操作するためのコ…
★ 5 MIT 2026-03-25
AIエージェント GitHub ai-security-methodology
AI Security Methodologyは、AIエージェント向けのセキュリティ研究方法論を提供するリポジトリです。攻撃パターン、…
★ 5 MIT 2026-05-23
音声生成 / TTS GitHub Supertonic_3_TTS_App
「Supertonic 3 TTS App」は、Supertone Supertonic 3エンジンを搭載した、Windows向けのオンデバイス・ニューラルテ…
★ 5 MIT 2026-05-31
画像生成 GitHub CUIG
CUIGは、テキストから画像を生成する拡散モデルにおける概念忘却の研究コードベースです。本リポジトリは、独立、シ…
★ 5 MIT 2026-06-12
AIエージェント GitHub AgentRearrange-Paper
AgentRearrangeは、Swarmsフレームワーク向けの汎用マルチエージェントオーケストレーションプリミティブです。本ツ…
★ 5 ⑂ 1 Apache-2.0 2026-06-04
画像生成 GitHub CTGMWorkshop
このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…
★ 5 Unlicense 2026-06-23
マルチモーダル GitHub glm-ocr-rs
saravananravi08/glm-ocrは、GLM-OCRビジョン言語モデルを搭載した純粋なRust製OCR推論エンジンです。PythonやPyTorc…
★ 5 2026-03-04
LLM GitHub synthron
SYNTHRONは、実用的なマルチエージェントAIフレームワークで、毎日3500万以上の無料トークンを提供します。7つのLLM…
★ 5 MIT 2026-05-20
画像生成 GitHub FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01
動画生成 GitHub awesome-wam-2026
このリポジトリは、World Action Model (WAM) に関する2026年版の分類済み研究論文索引です。4つの主要な調査論文と7…
★ 4 2026-05-29
音声生成 / TTS GitHub CosyVoiceUI
CosyVoiceUIは、NVIDIA Triton Inference ServerとFastAPIを基盤とした高性能なCosyVoiceテキスト読み上げ(TTS)管…
★ 4 2026-06-10
LLM GitHub A-LLM-learning-lecture
本講義は大言語モデル(LLM)の体系的な学習ノートで、Transformerの基礎からマルチエージェントシステムまで、15週…
★ 4 NOASSERTION 2026-06-23
3D / NeRF GitHub ReMap
ReMapは、3DキャプチャデータをGaussian SplattingやNeRFなどの高度なトレーニング用に準備するための強力なデスクト…
★ 4 NOASSERTION 2026-06-21
音声生成 / TTS GitHub voxcpm-easy-launcher
「VoxCPM Easy Launcher」は、OpenBMB/VoxCPM(優れたオープンソースのテキスト音声変換および音声クローンモデル)…
★ 4 ⑂ 1 MIT 2026-07-03