3,626 repos GH 3,511 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub invoice-extractor
この「Invoice Extraction System」は、VLM(Vision Language Models)を活用して、請求書や領収書から構造化された…
★ 1 2026-06-07
動画生成 GitHub sora-2-official-api
Sora 2 Official APIは、APIDotを通じて提供されるOpenAIのSora 2動画生成モデルの公式APIです。テキストプロンプト…
★ 1 MIT 2026-05-25
画像生成 GitHub badhands_scorer
「Bad Hands Scorer」は、拡散モデルが生成する「奇妙な手」の画像を識別し、美的スコアを付与するための軽量な概念…
★ 1 2026-06-03
LLM GitHub Next-Generation-Agent
本リポジトリでは、大規模言語モデル(LLM)が抱えるハルシネーションや推論速度の課題を克服するため、新たなエージ…
★ 1 2026-04-27
LLM GitHub pdf-analyzer
このツールは、PDF文書の内容に基づいた質問応答を可能にするRAG(検索拡張生成)システムです。PDFをアップロードす…
★ 1 2026-05-14
動画生成 GitHub libu-studio
libu-studioは、AIエージェントによって駆動されるオープンソースのコンテンツ生成ツールキットです。liblib.artを基…
★ 1 MIT 2026-06-17
LLM GitHub awesome-llm-training-inference
このリポジリポジトリは、大規模言語モデル(LLM)のトレーニングと推論に関する優れたフレームワーク、ツール、リソ…
★ 1 ⑂ 1 NOASSERTION 2026-03-06
マルチモーダル GitHub zero-shot-video-classifier
このツールは、ビジョン言語基盤モデル(CLIP、SigLIP 2、X-CLIP)を用いたゼロショット動画分類器です。タスク固有…
★ 1 2026-06-09
画像生成 GitHub ComfyUI_SparkVSR_SM
ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…
★ 1 Apache-2.0 2026-07-01
音楽生成 GitHub story-to-music
このツールは、トルコ語のテキスト(物語、コンセプト、下書きなど)をSunoやUdioといった音楽生成AI向けの音楽プロ…
★ 1 MIT 2026-05-23
動画生成 GitHub opencli-skill
opencli-skillは、AIエージェントがWindowsデスクトップ上でブラウザ操作やアプリケーション制御などのタスクを自動…
★ 1 ⑂ 1 MIT 2026-07-02
LLM GitHub yuri-os
Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー(DAG)を設計し、…
★ 1 2026-06-04
マルチモーダル GitHub FootPrint
FootPrint Analyticsは、サッカーの試合映像をAIで分析するパイプラインシステムです。YOLOv8とByteTrackを用いて選…
★ 1 MIT 2026-05-18
ComfyUI GitHub comfyui-touch-numeric
「comfyui-touch-numeric」は、人気の画像生成AIツールComfyUIの数値入力ウィジェット(seedやINT/FLOAT値など)を、…
★ 1 ⑂ 1 MIT 2026-06-24
画像生成 GitHub image-skill-cli
「Image Skill CLI」は、AIエージェント向けに画像生成・編集、動画・音声生成、3D作成をゼロセットアップで実現する…
★ 1 MIT 2026-06-25
LLM GitHub calfcord
Calfcordは、Discordサーバー内で独自のペルソナを持つAIエージェントの分散チームを構築できるツールです。各エージ…
★ 1 Apache-2.0 2026-06-22
ASR / 音声認識 GitHub spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
ASR / 音声認識 GitHub english-vocal-medical-terminology-mini
このリポジトリは、臨床文字起こしモデル、医療音声認識(STT)パイプライン、およびヘルスケア分野の会話型インター…
★ 1 NOASSERTION 2026-06-09
3D / NeRF GitHub splat-slim
splat-slimは、3D Gaussian Splatting(3DGS)モデルを再トレーニングせずに軽量化するためのツールです。既存の.ply…
★ 1 MIT 2026-06-14
ComfyUI GitHub ComfyUI-Orakul-SVP
ComfyUI-Orakul-SVPは、ComfyUIの出力画像を高品質なマスターファイルとしてエクスポートするためのカスタムノードで…
★ 1 MIT 2026-06-20
ComfyUI GitHub runpod-comfyui-controller
RunPod上でComfyUIをインタラクティブに実行するための、費用管理機能を重視したローカルファーストなセッションコン…
★ 1 MIT 2026-06-12
音声生成 / TTS GitHub code-driven-video-template
「Code-Driven Video Template」は、スクリプトからナレーション付きのデータスタイルの動画をコードベースで生成す…
★ 1 MIT 2026-06-14
音楽生成 GitHub nero
Neroは、キャンバスベースの論理回路シミュレーターで、論理シーケンスを生成的なサウンドスケープに変換します。ユ…
★ 1 MIT 2026-06-23
動画生成 GitHub ai-video-generation
このリポジトリは、Frameloop API を用いたAI動画自動化のための実用的な「curlレシピ集」です。顔出しなしのYouTube…
★ 1 2026-05-13