3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

マルチモーダル
GitHub
SmolVLM2-Edge-Vision-Agent
SmolVLM2-2.2Bを搭載したエッジ展開可能なビジョンエージェントで、CPUのみのハードウェア(16GB RAM)で動作します…
★ 3 2026-04-27
ASR / 音声認識
GitHub
scenelens
Scenelensは、Claudeにスマートな動画入力機能を提供するツールです。動画からシーン変化に基づいて最適なフレームを…
★ 3 MIT 2026-05-04
3D / NeRF
GitHub
spz
.SPZファイル形式のRust実装を提供し、この形式を扱うためのCLIツールです。PythonとC言語のバインディングも利用で…
★ 3 ⑂ 2 Apache-2.0 2026-06-27
画像生成
GitHub
SCFlow
SCFlow(Self-Corrected Flow Distillation)は、画像生成プロセスを大幅に効率化するPyTorchベースのフレームワーク…
★ 3 ⑂ 2 GPL-3.0 2026-05-23
LLM
GitHub
detection-engineering-ai-maturity
このフレームワークは、検出エンジニアリングプログラムにおけるAIおよび大規模言語モデル(LLM)の活用状況を評価す…
★ 3 NOASSERTION 2026-05-16
音声生成 / TTS
GitHub
Sanitune
Sanituneは、AIを活用して楽曲から不適切な言葉を自動で除去するツールです。ボーカルと伴奏を分離し、歌詞を文字起…
★ 3 ⑂ 2 GPL-3.0 2026-07-01
LLM
GitHub
multi_agent_rag_system
「Mega AI — Multi-Agent RAG System」は、自己改善型のマルチエージェント検索拡張生成(RAG)APIです。ユーザーか…
★ 3 2026-05-07
ASR / 音声認識
GitHub
athena-whisper
Athena Whisperは、ローカル環境で動作するデスクトップ向け音声入力ウィジェットです。faster-whisperを利用した高…
★ 3 ⑂ 2 2026-06-06
画像生成
GitHub
gugu-gaga-penguin
このリポジトリは、大流行したAIミーム「Gugugaga Penguin(咕咕嘎嘎企鹅)」に関する参照ページを提供します。Arkni…
★ 3 2026-05-27
音声生成 / TTS
GitHub
ghosttone-ai
GhostTone AIは、CPUで動作する無料のオープンソース音声クローンシステムです。わずか6〜10秒の音声サンプルから、…
★ 3 MIT 2026-05-15
ComfyUI
GitHub
ComfyUI-ResizeToCanvasSize
ComfyUI-ResizeToCanvasSizeは、ComfyUI用のカスタムノードパックで、画像を任意のキャンバスサイズに正確にリサイズ…
★ 3 ⑂ 1 MIT 2026-04-16
画像生成
GitHub
ernie-image-mlx
ernie-image-mlxは、Baiduの80億パラメータ画像生成モデルERNIE-Imageを、Apple Silicon向けにMLXフレームワークで純…
★ 3 ⑂ 1 MIT 2026-05-22
音声生成 / TTS
GitHub
kokoro-server
「kokoro-infer」は、高速で軽量なKokoro-82M TTS(Text-to-Speech)推論エンジンおよびサーバーです。CPU、CUDA、そ…
★ 3 2026-05-31
ASR / 音声認識
GitHub
claude-eyes
claude-eyesは、Claude Codeに動画処理能力を付与するためのプラグインです。主な機能として、ビデオ(URLまたはロー…
★ 3 NOASSERTION 2026-06-02
音声生成 / TTS
GitHub
lingo-agent
LINGOは、中小企業向けに設計されたベータ版のAI電話エージェントバックエンドです。リアルな電話番号を持ち、永続的…
★ 3 2026-06-18
動画生成
GitHub
claude-auto-tok
claude-auto-tokは、アイデアや短いプロンプトからTikTokスタイルの動画を自動生成するWindowsアプリケーションです…
★ 3 2026-06-28
3D / NeRF
GitHub
TGS-SLAM
TGS-SLAMは、IEEE Robotics and Automation Letters (RA-L) に採択されたセマンティックRGB-D SLAMシステムです。本…
★ 3 2026-05-28
LLM
GitHub
Text-to-SQL-Queries-Generator
このツールは、自然言語の質問をSQLクエリに変換し、データベースと対話することを可能にする「Text-to-SQL Generato…
★ 3 ⑂ 1 MIT 2026-06-24
音声生成 / TTS
GitHub
seshat-tts
Seshat TTSは、Windows向けのGUIユーティリティで、ゲームやアプリケーション向けにリアルタイムの音声ストリーミン…
★ 3 ⑂ 1 NOASSERTION 2026-06-19
音声生成 / TTS
GitHub
PocketClaude
Pocket Claudeは、AnthropicのClaudeを自己ホストできるチャットフロントエンドです。ユーザー自身のPro/Maxサブスク…
★ 3 ⑂ 1 MIT 2026-06-22
ASR / 音声認識
GitHub
smart-meeting-assistant
「拼好会-智能会議辅助系统」は、AIを活用したリアルタイム会議支援ソフトウェアです。PCの音声とマイク入力を同時に…
★ 3 2026-05-25
画像生成
GitHub
xhs-template
このツールは、Markdown形式の記事を小紅書(Xiaohongshu)向けの画像投稿シリーズに変換するジェネレーターです。5…
★ 3 ⑂ 1 MIT 2026-05-09
動画生成
GitHub
ai-video-generation
このPythonパイプラインは、テキストプロンプト一つから、ナレーションとキャプション付きの完全なMP4ビデオを生成し…
★ 3 ⑂ 1 MIT 2026-05-10
画像生成
GitHub
AI-Canva-Style-Editor
AI-Canva-Style-Editorは、StreamlitとOpenAIを基盤としたAI画像生成・編集プラットフォームです。テキストプロンプ…
★ 3 MIT 2026-06-21