3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
AIエージェント GitHub heya.skill
本ツールは、Bilibiliの動画投稿者「黒鴉」(Heya)の動画タイトルスタイル(長文、感情を煽る表現、複数の出来事を…
★ 8 MIT 2026-06-22
LLM GitHub durag
Du-RAG (Durable RAG)は、AIエージェント向けに Retrieval-Augmented Generation (RAG) を基盤とした永続的な記憶層…
★ 8 ⑂ 1 Apache-2.0 2026-06-05
動画生成 GitHub adobe2api
「adobe2api」は、Adobe Fireflyの画像・動画生成能力をOpenAI互換のAPIとして提供するゲートウェイです。Adobe Fire…
★ 8 ⑂ 1 2026-05-16
マルチモーダル GitHub modalformer-lowlight
このプロジェクト「modalformer-lowlight」は、低照度環境で撮影された画像のノイズ、色の歪み、細部喪失を改善する…
★ 8 ⑂ 2 MIT 2026-05-01
ASR / 音声認識 GitHub voxrt-asr-ios
VoxrtAsr for iOSは、オンデバイスで動作するストリーミング音声認識ライブラリです。独自開発のRust製推論ランタイ…
★ 8 ⑂ 1 Apache-2.0 2026-06-04
音声生成 / TTS GitHub omnivoice-app
OmniVoiceを搭載したセルフホスト型の音声クローンおよびテキスト読み上げ(TTS)ウェブアプリケーションです。テキ…
★ 8 NOASSERTION 2026-06-12
LLM GitHub LLMs-Tutorials-Projects
このリポジトリは、LLM(大規模言語モデル)に関する実践的なチュートリアルと実装コード集を提供します。ファインチ…
★ 8 ⑂ 3 2026-06-23
ComfyUI GitHub ComfyUI-LocateAnything
「ComfyUI-LocateAnything」は、NVIDIAのLocateAnything-3BビジュアルグラウンディングモデルをComfyUIで利用可能に…
★ 8 ⑂ 3 GPL-3.0 2026-06-01
マルチモーダル GitHub Awesome-VLA-Safety
本リポジトリは、Vision-Language-Action(VLA)モデルの安全性に関する厳選された研究論文リストです。データ準備、…
★ 8 2026-05-20
マルチモーダル GitHub GDB
GDB (GraphicDesignBench) は、グラフィックデザインタスクにおけるビジョン言語モデルの性能を評価するためのリアル…
★ 8 ⑂ 1 NOASSERTION 2026-05-05
ASR / 音声認識 GitHub freestyle
Freestyleは、macOS向けのオープンソースAI音声ディクテーションツールです。ユーザーはホットキーを長押しして話し…
★ 8 ⑂ 1 Apache-2.0 2026-05-24
画像生成 GitHub CivitDeck
CivitDeckは、AIアート生成コミュニティCivitAIのモバイルクライアントで、Kotlin Multiplatform (KMP) を用いてAndr…
★ 8 MIT 2026-06-24
ASR / 音声認識 GitHub cream-typer
Cream Typerは、Apple Siliconデバイス上で動作するローカル音声翻訳・テキスト化ツールです。Caps Lockをタップして…
★ 8 ⑂ 1 MIT 2026-05-02
ComfyUI GitHub J-AI-Studio
J AI Studioは、複雑なグラフエディタを必要とせずに、ローカルで画像や動画を生成するためのComfyUI用シンプルUIで…
★ 8 MIT 2026-05-03
ASR / 音声認識 GitHub Edu_Omni_MyMind
EduMINDは、ベトナム語と英語が混在する学術環境向けに設計された、多モーダルなバイリンガル講義アシスタントおよび…
★ 8 ⑂ 3 MIT 2026-06-23
音声生成 / TTS GitHub SubForge
SubForgeは、AIを駆使した高機能な動画字幕ツールです。音声のテキスト化、意味に基づいたスマートな断句、誤字修正…
★ 8 GPL-3.0 2026-06-18
3D / NeRF GitHub SEAR
SEARは、RGB画像と熱画像を組み合わせてカメラのポーズを推定する3D再構築プロジェクトです。Visual Geometric Trans…
★ 8 NOASSERTION 2026-05-07
AIエージェント GitHub nextjs-skills
このスキルはNext.js 16+のApp Routerプロジェクト向けに、キャッシングアーキテクチャの設計と実装を支援します。単…
★ 8 MIT 2026-05-30
AIエージェント GitHub praxia
Praxiaは、個人の暗黙知を組織の共有ノウハウへと自動昇格させることに特化した、ワークフロー指向のマルチエージェ…
★ 8 Apache-2.0 2026-06-25
ASR / 音声認識 GitHub Seam-LocalFirstMinutes
Seamは、会議の録音・文字起こし・要約をローカル環境中心で完結させるmacOS向けアプリです。マイク録音とシステム音…
★ 8 Apache-2.0 2026-06-23
音声生成 / TTS GitHub DeepInterview
DeepInterviewは、CVと職務経歴書をアップロードするだけで、AIが模擬面接官として音声で面接練習をサポートするオー…
★ 8 Apache-2.0 2026-06-24
画像生成 GitHub DisPOSE
この「DisPOSE」は、自己教師ありマルチビュー3D人体ポーズ推定のための実装です。離散的なクロスビュー人物割り当て…
★ 8 MIT 2026-06-15
動画生成 GitHub bony-agent
「Bony Agent」は「AI Media Agent」として、AIを活用したフルスタックのコンテンツ制作・配信プラットフォームです…
★ 8 ⑂ 1 2026-06-17
画像生成 GitHub MAs-DiT
このGitHubリポジトリは、「Few Channels Draw The Whole Picture: Revealing Massive Activations in Diffusion Tra…
★ 8 2026-05-21