3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub ReceiptIQ
このツールは、レシートの画像から支出データを自動的に抽出し、その内容について自然言語で質問できる領収書解析AI…
★ 1 2026-06-03
音声生成 / TTS GitHub md-tts
md-ttsは、技術的なMarkdownファイルを音声で読み上げ、コードブロック、テーブル、フラッシュカードで再生をインタ…
★ 1 MIT 2026-06-04
動画生成 GitHub NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
動画生成 GitHub veo-3.1-api
本リポジトリは、Google DeepMindの高度なビデオ生成モデル「Veo 3.1 API」をAPIDot経由で利用するための豊富なサン…
★ 1 MIT 2026-06-14
ComfyUI GitHub comfy-load-last-image
ComfyUI向けのカスタムノードで、指定フォルダ内の画像を更新日時の新しい順に自動選択して読み込めます。標準のLoad…
★ 1 ⑂ 2 MIT 2025-07-08
3D / NeRF GitHub comfyui-splat-loader
Splat Loaderは、人気のある画像生成UIであるComfyUI用のカスタムノードです。このツールは、Gaussian Splatting形式…
★ 1 ⑂ 1 MIT 2026-06-11
画像生成 GitHub awesome-gpt-image-2
このリポジトリは、OpenAIのGPT Image 2で高品質な画像を生成するための2000以上のクリエイティブなプロンプトをまと…
★ 1 NOASSERTION 2026-05-05
画像生成 GitHub Pic-generator-
FLUX GENは、FLUX.1とNVIDIA NIMによるGLM-5.1プロンプトエンハンサーを搭載した、エンタープライズグレードのAI画像…
★ 1 2026-06-15
音声生成 / TTS GitHub echotwin
EchoTwinは、Discordで利用できるAI音声ボットで、ユーザーの発言にクローンされた声でリアルタイムに返答します。Fi…
★ 1 MIT 2026-06-12
マルチモーダル GitHub japan-ocr-mini-benchmark-public
このツールは、ノイズの多い合成レシート画像、グラウンドトゥルースJSON、ローカルのLM Studioベースライン結果を含…
★ 1 NOASSERTION 2026-06-21
画像生成 GitHub ideogram4-mps
Apple Silicon搭載Mac上で人気の画像生成モデルIdeogram 4を実行可能にするツールです。CUDAやNVIDIA GPUが不要で、M…
★ 1 MIT 2026-06-26
LLM GitHub builder-jobs-scraper
このツールは、企業採用ページからエンジニアリングの求人情報を収集し、Claudeを使って各役割を分類・要約し、レン…
★ 1 ⑂ 1 2026-06-28
画像生成 GitHub Wireless-water-tank-monitoring-lora
このツールは、無線で水槽の水位を監視し、モーターを遠隔制御するためのソリューションです。LoRa通信により長距離…
★ 1 2026-06-29
LLM GitHub pull-request-review
このツールは、GitHubのプルリクエストをAI(LLM)が自動的にレビューするGitHub Actionです。`codellama`などの指定…
★ 1 MIT 2026-06-18
動画生成 GitHub awesome-ai-youtube-shorts-prompts
このリポジトリは、AIを活用したYouTube Shortsの動画制作に特化した実践的なリソース集です。YouTuber、Shortsクリ…
★ 1 2026-04-28
LLM GitHub agent-evaluation-lab
Agent Evaluation Labは、自律エージェントをデプロイ前にテスト・評価するためのオープンなサンドボックス環境です…
★ 1 Apache-2.0 2026-03-15
マルチモーダル GitHub miru
Miru(見る)は、マルチモーダルAIモデルの「ブラックボックス」問題を解決するための説明可能性エンジンです。画像…
★ 1 2026-06-22
ASR / 音声認識 GitHub tiktok-extractor
このツールは、TikTokのURLから動画のメタデータ、完全な文字起こし、シーンのキーフレーム、画面上のOCRテキストを…
★ 1 MIT 2026-05-24
マルチモーダル GitHub agents-connector
agents-connectorは、Claude Code、Codex、Gemini CLIといったAIエージェント間の連携を可能にするローカルメッセー…
★ 1 MIT 2026-06-23
音声生成 / TTS GitHub lux-tts
LuxTTSは、Google Colab上で動作する音声クローニングツールです。5〜20秒の短い音声サンプルから任意の音声をクロー…
★ 1 NOASSERTION 2026-05-10
ComfyUI GitHub MKRShift_Theme_Lab
Theme Labは、ComfyUI専用の全画面テーマワークスペースを提供する拡張機能です。このツールを使用すると、ComfyUIの…
★ 1 ⑂ 1 Apache-2.0 2026-04-05
画像生成 GitHub claude-imagegen-skill
このClaude Codeスキルは、DALL-EによるAI画像生成、デザインシステムのインテリジェンス、およびPencil MCPとの統合…
★ 1 MIT 2026-05-30
画像生成 GitHub comfyui-amd-plug-and-play
miradorventus/comfyui-amd-plug-and-play は、AMD GPU(Ubuntu/Mint)上でComfyUIのセットアップと実行を大幅に簡素…
★ 1 2026-05-31
音声生成 / TTS GitHub Voice-Command
Voice-Commandは、AI(Claude Desktop、Cowork、Claude Code、Codex CLI、Gemini CLI、LM Studioなど)を音声で完全…
★ 1 ⑂ 1 Apache-2.0 2026-06-23