3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識

GitHub

TermSub

TermSubは、AIを活用して動画コンテンツの文字起こし、翻訳、専門用語管理を行うFastAPIアプリケーションです。マル…

#AI搭載 #Python #Web UI

★ 2 MIT 2026-07-01

LLM

GitHub

opencrab

opencrabは、タスクをこなすだけでなく、自己の目標を持ち自己進化を追求する「自律生命体」です。他のエージェント…

#Claude Code #CLI #Codex

★ 2 MIT 2026-06-07

ASR / 音声認識

GitHub

YanXi-KCN

Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…

#CLI #GPU必須 #Python

★ 2 2026-05-29

3D / NeRF

GitHub

catetus

Catetusは、Gaussian Splattingの最適化と本番環境への配信を支援するオープンソースのインフラです。巨大な.plyファ…

#API #CLI #glTF

★ 2 NOASSERTION 2026-05-31

マルチモーダル

GitHub

ai-annotation-rule-doc-skill

このツールは、AIモデル訓練データのアノテーションルール文書を効率的に作成するためのClaudeスキルです。テキスト…

#AIアノテーション #Claude対応 #テキスト処理

★ 2 MIT 2026-06-08

画像生成

GitHub

hermes-image-local-tools

この「hermes-image-local-tools」は、Hermesエージェントでローカルでの画像生成を強力にサポートするためのプラグ…

#CLI #ComfyUI対応 #GPU必須

★ 2 MIT 2026-06-03

動画生成

GitHub

sora-2-official-api

このリポジトリは、PoyoAPIの「sora-2-official」モデルを使用して、サーバーサイドで高品質な動画を生成するための…

#Node.js #PoyoAPI #Sora 2 Official

★ 2 MIT 2026-06-09

動画生成

GitHub

muapi-ai-sdk-provider

「@muapi/ai-sdk-provider」は、Vercel AI SDKと統合するためのMuAPIプロバイダーです。Flux、Veo3、Kling、Midjourn…

#API連携 #JavaScript/TypeScript #Vercel AI SDK

★ 2 2026-06-17

3D / NeRF

GitHub

qi_wu_bo_yan_pointcloud_dataset

このリポジトリは、41件の中国古代文物に関する高品質な3D点群データセットを提供します。点群の品質評価、3D再構築…

#3D点群 #Python #データセット

★ 2 NOASSERTION 2026-05-08

音声生成 / TTS

GitHub

LA-Studio

LA Studioは、音声認識、テキスト読み上げ、音声クローン、音声デザイン、モデルダウンロード、ランタイム管理を一つ…

#GPU対応 #オフライン対応 #デスクトップアプリ

★ 2 GPL-3.0 2026-07-03

ASR / 音声認識

GitHub

one-key-input

One-Key Inputは、特定のキーを押しながら話すだけで、AIが文脈を理解して洗練されたテキストをカーソル位置に直接入…

#AI #Windows #外部API利用

★ 2 ⑂ 1 MIT 2026-06-02

LLM

GitHub

SREAssistaBot

IncidentIQは、Google ADK、FastAPI、マルチエージェントオーケストレーションを用いて構築された、Slackネイティブ…

#Docker #LLM対応 #Python

★ 2 MIT 2026-05-23

音声生成 / TTS

GitHub

podcast-workflow

「Podcast Workflow」は、AIを活用しポッドキャスト制作の全工程を自動化するClaude Codeスキルです。ユーザーが指定…

#AI #Claude Code #CLI

★ 2 MIT 2026-05-28

画像生成

GitHub

aether

Aetherは、参考画像や生成結果から「視覚的記憶」を生成・管理し、美的スタイルの一貫した画像を継続的に創作するた…

#CLI #Codex対応 #プラグイン

★ 2 MIT 2026-06-28

ASR / 音声認識

GitHub

memorised-them-all

「Memorised them All」は、Claudeユーザー向けのローカルで完結する知識グラフ生成ツールです。PDF、Officeドキュメ…

#AIツール連携 #CLI #Python

★ 2 MIT 2026-06-24

ASR / 音声認識

GitHub

slidoc

slidocは、講義ビデオを各スライドとそのクリーンアップされたナレーションが対になったマークダウン形式に変換する…

#CLI #Python #whisper.cpp

★ 2 ⑂ 1 MIT 2026-05-15

マルチモーダル

GitHub

rag-multimodal

このプロジェクトは、複雑な表や図を含むPDF文書から情報を抽出するマルチモーダルRAGシステムの実装デモです。マル…

#AWS #LangGraph #OpenSearch

★ 2 MIT 2026-07-01

3D / NeRF

GitHub

Awesome-Embodied-3DV

この「Awesome-Embodied-3DV」は、Embodied AIの分野における3D/4D知覚、再構築、生成、シミュレーション対応アセッ…

#3Dグラフィックス #AI/機械学習 #GitHubリポジトリ

★ 2 MIT 2026-06-27

ASR / 音声認識

GitHub

runningapp

RunTrack GPSは、SwiftUIとMVVMアーキテクチャで構築された、ネイティブiOS向けの軽量GPSランニングアプリです。ユー…

#GPS追跡 #iOS #SwiftUI

★ 2 2026-06-25

音声生成 / TTS

GitHub

Project-Siren

Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成（TTS）モデルを作成するための、エ…

#CLI #GPU必須 #HuggingFace

★ 2 2026-05-04

AIエージェント

GitHub

mu-brand

MUは、AIがデザイン生成から販売、製造、配送、会社運営まで全てを自律的に行う、人間不介入のアパレルブランドです…

#AI #CLI #E-commerce

★ 2 ⑂ 1 NOASSERTION 2026-07-01

画像生成

GitHub

FluidFlow

FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…

#CLI #GPU必須 #Python

★ 2 MIT 2026-06-10

ComfyUI

GitHub

ComfyUI-MemoryVisualization

ComfyUI-MemoryVisualizationは、画像生成AIツールComfyUI向けに設計された視覚的なダッシュボードです。このツール…

#ComfyUI対応 #GPU必須 #Web UI

★ 2 2026-07-01

音声生成 / TTS

GitHub

UAL

UAL（Understand Any Language）は、ESP32-S3を基盤としたIoT音声翻訳プロトタイプです。距離センサーでユーザーを検…

#C++ #ESP32-S3 #IoT

★ 2 MIT 2026-05-23