3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
streamscribe
streamscribeは、クラウドやAPIキーに依存せず、通常のCPUで動作するリアルタイム放送転写・分析ツールです。複数の…
★ 3 2026-06-11
ASR / 音声認識
GitHub
WhisperCaption
WhisperCaptionはmacOS向けのリアルタイムキャプションアプリケーションです。マイク入力とMacのシステム音声を同時…
★ 3 MIT 2026-05-17
動画生成
GitHub
ComfyUI-PuLID-Flux2
ComfyUI-PuLID-Flux2は、FLUX.2モデル向けにPuLIDを実装した初のツールです。ComfyUI環境下で、生成画像における顔の…
★ 3 MIT 2026-06-22
LLM
GitHub
spaturzu-sdks
spaturzu SDKは、AIエージェントごとのLLM(大規模言語モデル)利用コストを追跡・帰属させ、予算の強制、およびプロ…
★ 3 MIT 2026-06-11
音声生成 / TTS
GitHub
tube-assistant
TubeAssistantは、YouTubeチャンネルの運営を完全に自動化するツールです。AIがチャンネル分析に基づいてスクリプト…
★ 3 MIT 2026-06-12
マルチモーダル
GitHub
robot-episode-curator
Robot Episode Curatorは、LeRobotデータセット内の外れ値エピソードを効率的に特定し、診断するためのツールです。R…
★ 3 Apache-2.0 2026-05-05
AIエージェント
GitHub
vai-core
vai-coreは、明確な境界線、明示的な契約、そしてテスト可能な実行に焦点を当てた軽量かつ階層化されたPythonエージ…
★ 3 ⑂ 1 MIT 2026-06-23
音楽生成
GitHub
onpu
Onpuは、AIを用いて音楽を生成するSaaSプラットフォームです。シンプルなテキスト記述、カスタム歌詞、またはスタイ…
★ 3 AGPL-3.0 2026-06-15
LLM
GitHub
grounded-forge
grounded-forgeは、複雑で反復的な作業を行うための、ソースに基づいたアシスタントを構築・配布するためのリトリー…
★ 3 MIT 2026-05-20
ASR / 音声認識
GitHub
MyPlayer
MyPlayerは、Windows専用のC++製メディアプレイヤーで、Qt 6、FFmpeg、CUDA、ONNX Runtimeを基盤としています。主な…
★ 3 MIT 2026-05-03
3D / NeRF
GitHub
spz
.SPZファイル形式のRust実装を提供し、この形式を扱うためのCLIツールです。PythonとC言語のバインディングも利用で…
★ 3 ⑂ 2 Apache-2.0 2026-06-20
ASR / 音声認識
GitHub
jp2zh-video-subs
このプロジェクトは、ローカルの日本語動画ファイルから簡体字中国語のSRT字幕を生成するCLIツールです。Qwen3-ASRと…
★ 3 2026-06-14
動画生成
GitHub
bernini-studio-ui
Bernini Studio UIは、ByteDanceの強力な画像・動画生成AIモデル「Bernini」の推論を、より操作しやすくするために開…
★ 3 Apache-2.0 2026-06-14
音声生成 / TTS
GitHub
auto-audiobook
「Auto-Audiobook」は、EPUB、MOBI、PDF形式の電子書籍を、構造化されたMP3オーディオブックに自動変換するエンジン…
★ 3 MIT 2026-06-27
LLM
GitHub
verfix
Verfixは、AIコーディングエージェントが生成するWebアプリケーションのブラウザ検証を自動化するためのローカルファ…
★ 3 ⑂ 1 NOASSERTION 2026-06-22
動画生成
GitHub
ltx-descktop-unlockeds-
「LTX Desktop Unlocked」は、AIによる動画・画像生成を行うデスクトップアプリケーションのアンロック版です。従来…
★ 3 Apache-2.0 2026-04-08
マルチモーダル
GitHub
LangSlice
LangSliceは、Vision-Language Model (VLM) を活用し、組織学的脳切片をBrainGlobeアトラスに自動で高精度に位置合わ…
★ 3 BSD-3-Clause 2026-06-03
AIエージェント
GitHub
agent-smith
agent-smithは、長期的に稼働するAIエンジニアリングエージェントを運用するためのフレームワークです。各エージェン…
★ 3 Apache-2.0 2026-06-23
ASR / 音声認識
GitHub
Chaty
Chatyは、ローカル環境でGGUF形式のAIモデルとプライベートなチャットを実現するデスクトップアプリケーションです。…
★ 3 MIT 2026-06-25
ASR / 音声認識
GitHub
doublage
「Doublage(ドゥブラージュ)」は、任意の動画の好きなシーンをオンラインで友達と一緒に吹き替えできる革新的なツ…
★ 3 MIT 2026-06-12
ComfyUI
GitHub
anima-verse
AIパワードの仮想キャラクター(エージェント)との対話と画像生成を深く統合した、フルスタックのWebアプリケーショ…
★ 3 NOASSERTION 2026-06-25
LLM
GitHub
GEORank
GEOrankは、GEO(生成式エンジン最適化)に特化したオープンソースのワークベンチです。AI検索におけるウェブサイト…
★ 3 ⑂ 1 Apache-2.0 2026-06-18
音声生成 / TTS
GitHub
ghosttone-ai
GhostTone AIは、CPUで動作する無料のオープンソース音声クローンシステムです。わずか6〜10秒の音声サンプルから、…
★ 3 MIT 2026-05-15