3,631 repos GH 3,516 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub video-podcast-clipper
「Video Podcast Clipper」は、長尺動画からTikTokやYouTube Shorts向けのバイラルな縦型ショートクリップを自動生成…
★ 5 MIT 2026-05-28
ASR / 音声認識 GitHub handy-companion
macOS向けの「handy-companion」は、無料のオフライン音声認識アプリ「Handy」で生成された文字起こしテキストを、大…
★ 5 MIT 2026-05-24
マルチモーダル GitHub SkinAid
SkinAidは、皮膚疾患の分析を支援する高度なクロスモーダルAIフレームワークです。ユーザーは皮膚の画像と年齢、性別…
★ 5 ⑂ 1 MIT 2026-05-30
動画生成 GitHub prompt-kb
Prompt-KBは、AIプロンプトの学習、再利用、振り返りを目的とした知識蓄積システムです。DAIR.AIのPrompt Engineerin…
★ 5 MIT 2026-06-03
画像生成 GitHub FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01
画像生成 GitHub Multi-Modal-105
このプロジェクトは、テキストから画像(T2I)およびテキストから動画(T2V)を生成する、プロダクションレベルかつ…
★ 5 MIT 2026-06-06
ASR / 音声認識 GitHub MicType
MicTypeは、macOSユーザー向けの革新的な音声入力ツールであり、AIコマンド機能を統合しています。ホットキーの「タ…
★ 5 ⑂ 2 MIT 2026-06-24
3D / NeRF GitHub Spatial-Intelligence-Handbook
この「Spatial Intelligence Handbook」は、SLAM、VIO、3D表現、センサー、デプロイメントの課題を、ロボットアーム…
★ 5 NOASSERTION 2026-06-14
音声生成 / TTS GitHub voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
ComfyUI GitHub comfyui-cyberdelia-z-engineer
ComfyUIの「Z-Image Turbo」ワークフロー向けに設計された、LLMを活用した高度なプロンプトエンジニアリングノードで…
★ 5 ⑂ 1 MIT 2026-05-18
動画生成 GitHub ml-animations
ml-animationsは、機械学習と線形代数の概念を楽しく学習するためのインタラクティブなアニメーションと演習を提供す…
★ 5 2026-06-25
ASR / 音声認識 GitHub whisperx-transcriber
WhisperX Transcriberは、Windowsユーザー向けのオフラインAI音声文字変換ツールです。OpenAIのWhisperモデルとWhisp…
★ 5 ⑂ 1 MIT 2026-06-09
動画生成 GitHub veo-api
Veo 3 APIは、Googleの最新AI動画生成モデルであるGoogle Veo 3(Veo3, Veo 3.1, Veo 3 Fast)へ、最も安価で容易に…
★ 5 MIT 2026-05-27
画像生成 GitHub bizyair-skill
BizyAir Skillは、AI Agent向けにAIGC(AI生成コンテンツ)機能を提供するスキルパッケージです。BizyAirのクラウド…
★ 5 ⑂ 1 MIT 2026-05-27
LLM GitHub spark-1822
このリポジトリは、NVIDIA DGX Sparkワークステーション向けの包括的な設定を提供します。Caddyリバースプロキシ、Op…
★ 5 ⑂ 1 MIT 2026-06-08
AIエージェント GitHub ai-security-methodology
AI Security Methodologyは、AIエージェント向けのセキュリティ研究方法論を提供するリポジトリです。攻撃パターン、…
★ 5 MIT 2026-05-23
音声生成 / TTS GitHub learn-almost-anything
「Learn (Almost) Anything」は、選択したトピックからパーソナライズされたコースを作成し、その学習を支援するデス…
★ 5 2026-06-20
ASR / 音声認識 GitHub ANARCHY
ANARCHYは、クラウドやテレメトリーに依存しない、完全ローカルかつオフラインファーストのWindows向けAIアシスタン…
★ 5 MIT 2026-06-08
AIエージェント GitHub hermes-skill-short-drama-master
「短剧大师™ v6.2」は、一文のアイデアから高品質なAIマイクロ短劇を生成する、世界初の全プロセス閉ループ、精密エ…
★ 5 2026-06-26
AIエージェント GitHub AeroGraph
AeroGraphは、AIエージェントのワークフローに特化したオープンソースの視覚的デバッガー兼フライトレコーダーです。…
★ 5 ⑂ 2 Apache-2.0 2026-06-21
LLM GitHub rag-document-intelligence
このツール「rag-document-intelligence」は、Windows上でPDFやスキャンされた文書を扱うためのアプリケーションです…
★ 4 ⑂ 1 MIT 2026-06-26
音声生成 / TTS GitHub CosyVoiceUI
CosyVoiceUIは、NVIDIA Triton Inference ServerとFastAPIを基盤とした高性能なCosyVoiceテキスト読み上げ(TTS)管…
★ 4 2026-06-10
音声生成 / TTS GitHub bithuman-sdk-public
bitHuman SDKは、音声入力からリアルタイム(25FPS)でリップシンクされたアニメーション顔を生成する開発キットです…
★ 4 Apache-2.0 2026-06-16
画像生成 GitHub civitai-post-splitter
このツールは、Civitaiの複数画像投稿を単一画像投稿に分割し、Civitai、Pixiv、X (Twitter)、小紅書といった複数の…
★ 4 MIT 2026-06-25