3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
watch-video-skill
このスキルは、Claude AIに動画を「視聴」させ、タイム同期された文字起こしと自動スケーリングされた静止画を組み合…
★ 29 ⑂ 2 MIT 2026-04-30
LLM
GitHub
LongParser
LongParserは、プライバシーを重視したドキュメントインテリジェンスエンジンです。PDF、DOCX、PPTX、XLSX、CSVとい…
★ 29 ⑂ 2 NOASSERTION 2026-05-05
動画生成
GitHub
seedance2.0-rehber
このリポジトリは、トルコのAIコミュニティ向けにSeedance 2.0マルチショットプロンプティングに関するガイドを提供…
★ 29 ⑂ 3 MIT 2026-04-30
LLM
GitHub
awaek
X(旧Twitter)で保存したブックマークをパーソナルAIとして活用できるツールです。散逸しがちな保存投稿を「チャッ…
★ 29 ⑂ 1 2026-05-24
画像生成
GitHub
gpt-image-2-for-e-commerce
本リポジトリは、GPT Image 2を用いてEコマース向けの商品画像を効率的に生成するためのプロンプト集です。商品の出…
★ 29 ⑂ 2 NOASSERTION 2026-06-18
ComfyUI
GitHub
ComfyUI-Win-Blackwell
「ComfyUI for GeForce RTX 50-Series (Blackwell)」は、NVIDIA GeForce RTX 50シリーズ(Blackwellアーキテクチャ)…
★ 29 ⑂ 1 MIT 2026-03-02
3D / NeRF
GitHub
iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
ComfyUI
GitHub
ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
音声生成 / TTS
GitHub
supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
マルチモーダル
GitHub
weld-anomaly-classifier
WeldFusionNetは、センサー、オーディオ、ビデオデータといった多様な情報を統合するマルチモーダル深層学習モデルを…
★ 28 ⑂ 1 MIT 2026-03-06
ComfyUI
GitHub
comfyui-custom-node-color
ComfyUI上でノードやグループの背景色をGUIで直感的に変更できる拡張です。色相・明度を使うビジュアルピッカー、HEX…
★ 28 ⑂ 3 MIT 2026-01-02
ASR / 音声認識
GitHub
live-translator
Live Translatorは、macOS上でシステムオーディオをリアルタイムで翻訳するアプリケーションです。YouTube動画、ポッ…
★ 28 ⑂ 1 MIT 2026-05-20
ComfyUI
GitHub
ComfyInject
ComfyInjectはSillyTavernの拡張機能で、ボットメッセージ内の`[[IMG: ... ]]`マーカーからローカルのComfyUIインス…
★ 28 ⑂ 8 AGPL-3.0 2026-03-20
LLM
GitHub
n8n-claude-skills
n8n-claude-skillsは、AnthropicのClaude Skillsを活用し、n8nワークフローの構築、デバッグ、デプロイをプロダクシ…
★ 28 ⑂ 7 MIT 2026-04-26
画像生成
GitHub
comfyui-ReferenceLatentPlus
このツールはComfyUIの標準`ReferenceLatent`ノードを強化したドロップイン代替品です。画像ごとに参照強度、タイム…
★ 28 ⑂ 4 2026-06-07
ASR / 音声認識
GitHub
codex-asr
「codex-asr」は、ローカルの「Codex Desktop ChatGPT」のログインセッションを再利用し、ワンショットの自動音声認…
★ 28 ⑂ 5 MIT 2026-05-06
音声生成 / TTS
GitHub
pronounce
「Pronounce」は、`kubectl`、`GIF`、`JSON`などの開発者用語の正しい発音を音声で聞けるCLIツールです。544以上の用…
★ 28 MIT 2026-06-28
マルチモーダル
GitHub
SSM
このリポジリは、顔の動作単位(AU)と顔の表情(FE)の双方向学習を可能にするStructured Semantic Mapping(SSM)…
★ 28 2026-04-17
ASR / 音声認識
GitHub
pod2wiki
pod2wikiは、YouTubeやRSSからの高品質なポッドキャストや長文コンテンツを自動的に中国語の要約と英語の原文に変換…
★ 28 ⑂ 5 MIT 2026-04-29
ASR / 音声認識
GitHub
chough
choughは、Parakeet TDT 0.6b V3とsherpa-onnxを基盤とする、高速かつメモリ効率に優れたCLIベースの音声認識(ASR)…
★ 27 ⑂ 2 MIT 2026-03-08
3D / NeRF
GitHub
UniVerse
UniVerseは、ICCV 2025で発表された「動画拡散モデルのシーン事前分布を活用したロバストなラディアンスフィールド再…
★ 27 2025-10-03