3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub watch-video-skill
このスキルは、Claude AIに動画を「視聴」させ、タイム同期された文字起こしと自動スケーリングされた静止画を組み合…
★ 29 ⑂ 2 MIT 2026-04-30
LLM GitHub LongParser
LongParserは、プライバシーを重視したドキュメントインテリジェンスエンジンです。PDF、DOCX、PPTX、XLSX、CSVとい…
★ 29 ⑂ 2 NOASSERTION 2026-05-05
動画生成 GitHub seedance2.0-rehber
このリポジトリは、トルコのAIコミュニティ向けにSeedance 2.0マルチショットプロンプティングに関するガイドを提供…
★ 29 ⑂ 3 MIT 2026-04-30
画像生成 GitHub ai-megalist
AI Megalistは、200以上のAIツールを「実行する仕事」に基づいて分類し、キュレーションされたインデックスです。コ…
★ 29 ⑂ 14 MIT 2026-06-16
LLM GitHub awaek
X(旧Twitter)で保存したブックマークをパーソナルAIとして活用できるツールです。散逸しがちな保存投稿を「チャッ…
★ 29 ⑂ 1 2026-05-24
画像生成 GitHub gpt-image-2-for-e-commerce
本リポジトリは、GPT Image 2を用いてEコマース向けの商品画像を効率的に生成するためのプロンプト集です。商品の出…
★ 29 ⑂ 2 NOASSERTION 2026-06-18
ComfyUI GitHub ComfyUI-Win-Blackwell
「ComfyUI for GeForce RTX 50-Series (Blackwell)」は、NVIDIA GeForce RTX 50シリーズ(Blackwellアーキテクチャ)…
★ 29 ⑂ 1 MIT 2026-03-02
3D / NeRF GitHub iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
ComfyUI GitHub ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
音声生成 / TTS GitHub supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
マルチモーダル GitHub weld-anomaly-classifier
WeldFusionNetは、センサー、オーディオ、ビデオデータといった多様な情報を統合するマルチモーダル深層学習モデルを…
★ 28 ⑂ 1 MIT 2026-03-06
ComfyUI GitHub comfyui-custom-node-color
ComfyUI上でノードやグループの背景色をGUIで直感的に変更できる拡張です。色相・明度を使うビジュアルピッカー、HEX…
★ 28 ⑂ 3 MIT 2026-01-02
3D / NeRF GitHub maplibre-gl-splat
「maplibre-gl-splat」は、MapLibre GL JS地図上で3D Gaussian Splatを視覚化するためのプラグインです。このツール…
★ 28 ⑂ 5 MIT 2026-06-22
ASR / 音声認識 GitHub live-translator
Live Translatorは、macOS上でシステムオーディオをリアルタイムで翻訳するアプリケーションです。YouTube動画、ポッ…
★ 28 ⑂ 1 MIT 2026-05-20
ComfyUI GitHub ComfyInject
ComfyInjectはSillyTavernの拡張機能で、ボットメッセージ内の`[[IMG: ... ]]`マーカーからローカルのComfyUIインス…
★ 28 ⑂ 8 AGPL-3.0 2026-03-20
LLM GitHub n8n-claude-skills
n8n-claude-skillsは、AnthropicのClaude Skillsを活用し、n8nワークフローの構築、デバッグ、デプロイをプロダクシ…
★ 28 ⑂ 7 MIT 2026-04-26
画像生成 GitHub comfyui-ReferenceLatentPlus
このツールはComfyUIの標準`ReferenceLatent`ノードを強化したドロップイン代替品です。画像ごとに参照強度、タイム…
★ 28 ⑂ 4 2026-06-07
ASR / 音声認識 GitHub codex-asr
「codex-asr」は、ローカルの「Codex Desktop ChatGPT」のログインセッションを再利用し、ワンショットの自動音声認…
★ 28 ⑂ 5 MIT 2026-05-06
音声生成 / TTS GitHub pronounce
「Pronounce」は、`kubectl`、`GIF`、`JSON`などの開発者用語の正しい発音を音声で聞けるCLIツールです。544以上の用…
★ 28 MIT 2026-06-28
マルチモーダル GitHub SSM
このリポジリは、顔の動作単位(AU)と顔の表情(FE)の双方向学習を可能にするStructured Semantic Mapping(SSM)…
★ 28 2026-04-17
ASR / 音声認識 GitHub pod2wiki
pod2wikiは、YouTubeやRSSからの高品質なポッドキャストや長文コンテンツを自動的に中国語の要約と英語の原文に変換…
★ 28 ⑂ 5 MIT 2026-04-29
ASR / 音声認識 GitHub chough
choughは、Parakeet TDT 0.6b V3とsherpa-onnxを基盤とする、高速かつメモリ効率に優れたCLIベースの音声認識(ASR)…
★ 27 ⑂ 2 MIT 2026-03-08
3D / NeRF GitHub QuestRoomScan
QuestRoomScanは、Meta Quest 3向けのリアルタイム3Dルーム再構築ツールです。GPU TSDFとSurface Netsメッシュ抽出を…
★ 27 ⑂ 2 NOASSERTION 2026-04-20
3D / NeRF GitHub UniVerse
UniVerseは、ICCV 2025で発表された「動画拡散モデルのシーン事前分布を活用したロバストなラディアンスフィールド再…
★ 27 2025-10-03