3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub afrispeech-selector
AfriSpeech Selectorは、142のアフリカ言語にわたる2200時間以上の音声データに簡単にアクセスできるCLIツールです。…
★ 9 ⑂ 5 2026-06-19
ComfyUI GitHub ComfyUI-Dynamic-Sigmas
このツールは、ComfyUI用のカスタムノード「ComfyUI-Dynamic-Sigmas」です。初心者から上級者まで、拡散モデルのシグ…
★ 9 ⑂ 2 MIT 2026-03-30
LLM GitHub lab
「🧪lab」は、Open WebUIのような既存のAIウェブインターフェースに代わる、ミニマリストで超高速なサーバーレスツー…
★ 9 2026-06-09
音声生成 / TTS GitHub DeepInterview
DeepInterviewは、CVと職務経歴書をアップロードするだけで、AIが模擬面接官として音声で面接練習をサポートするオー…
★ 9 Apache-2.0 2026-06-24
動画生成 GitHub bony-agent
「Bony Agent」は「AI Media Agent」として、AIを活用したフルスタックのコンテンツ制作・配信プラットフォームです…
★ 9 ⑂ 1 2026-06-29
ComfyUI GitHub ComfyUI-HeartMuLa
ComfyUI-HeartMuLaは、音楽生成と歌詞転写を目的としたComfyUIの拡張機能です。HeartMuLaモデルファミリーとheartlib…
★ 9 ⑂ 4 Apache-2.0 2026-02-14
3D / NeRF GitHub map-creator
map-creatorは、DJIドローンを用いた3Dマッピングや写真測量ミッションを計画・視覚化するためのデスクトップアプリ…
★ 9 MIT 2026-05-09
AIエージェント GitHub lauren
Laurenは、コーディングエージェント向けの自律的なライブタスクキューシステムです。プロジェクトの進行中にタスク…
★ 9 ⑂ 1 MIT 2026-05-27
マルチモーダル GitHub goodq4all
GoodQ4Allは、ローカルファーストのマルチモーダル記憶システムで、長期間のビデオ、オーディオ、テキストからの情報…
★ 9 MIT 2026-06-26
ASR / 音声認識 GitHub daisy-app
DaisyはmacOS向けのローカルファーストな会議録音・AIノートアプリです。マイクとシステム音声から会議音声をキャプ…
★ 9 ⑂ 2 Apache-2.0 2026-06-29
LLM GitHub ai-world-cup
AI World Cupは、FIFAワールドカップ2026の試合予測における無料の大規模言語モデル(LLM)の性能を比較するための、…
★ 9 ⑂ 2 MIT 2026-07-04
画像生成 GitHub relay-imagegen
「Relay Imagegen」は、AIアシスタント「Codex」の中継ステーションを用いた画像生成において、解像度やアスペクト比…
★ 9 MIT 2026-06-02
ComfyUI GitHub vibevoice.swift
VibeVoice.swiftは、macOSおよびLinux上でリアルタイム音声処理を実現するアプリケーションです。SwiftとMLXを活用し…
★ 9 ⑂ 1 MIT 2026-07-03
AIエージェント GitHub web-speed-oss
Web Speedは、AIエージェント向けのWebページ解析ツールです。複雑なWebコンテンツ(HTML、レイアウト、JavaScript)…
★ 9 ⑂ 1 GPL-3.0 2026-05-10
音声生成 / TTS GitHub mlx-swift-dots-tts
mlx-swift-dots-ttsは、rednote-hilabのdots.tts-soarモデルをAppleシリコン向けにMLXフレームワークへ移植したもの…
★ 9 ⑂ 3 Apache-2.0 2026-06-10
マルチモーダル GitHub SynCLIP
SynCLIPは、セマンティクス的に同等な表現でも空間的注意が異なるという、オープンボキャブラリー高密度知覚(OVDP)…
★ 9 ⑂ 1 Apache-2.0 2026-06-04
画像生成 GitHub ComfyUI-PlagueKind-Nodes
「ComfyUI-PlagueKind-Nodes」は、ComfyUIユーザー向けに画像とマスクのリサイズを統合し、LoRAの高度なスタッキング…
★ 9 ⑂ 2 MIT 2026-05-31
画像生成 GitHub diffusion-tutorials-cn
本プロジェクトは、Tsuyoshi Matsuzaki氏による「diffusion-tutorials」の中国語翻訳・理論強化版です。拡散モデル(…
★ 9 MIT 2026-03-28
マルチモーダル GitHub GDB
GDB (GraphicDesignBench) は、グラフィックデザインタスクにおけるビジョン言語モデルの性能を評価するためのリアル…
★ 8 ⑂ 1 NOASSERTION 2026-05-05
音声生成 / TTS GitHub Kokoro-82M-ONNX-German-Martin
本リポジトリは、ドイツ語のKokoro音声モデル「Martin」を用いたテキスト読み上げ(TTS)システムのDockerおよびHome…
★ 8 ⑂ 1 2026-05-22
AIエージェント GitHub AutoPilot-DevAgent
AutoPilot Devは、GitHubのプルリクエストURLを入力として受け取り、AIがコードレビュー、バグ修正の提案、テスト検…
★ 8 2026-06-09
動画生成 GitHub cinemorph
Cinemorphは、ユーザーのブリーフ(概要)から、映画のようなローンチビデオ、投資家向けピッチデッキ、または機能の…
★ 8 2026-05-04
ComfyUI GitHub Comfy-Launcher-MultiOS
Comfy-Launcher-MultiOSは、LinuxおよびmacOS環境でComfyUIのインストール、起動、更新、管理を簡素化するシェルスク…
★ 8 ⑂ 3 2026-06-17
ASR / 音声認識 GitHub freestyle
Freestyleは、macOS向けのオープンソースAI音声ディクテーションツールです。ユーザーはホットキーを長押しして話し…
★ 8 ⑂ 1 Apache-2.0 2026-05-24