3,628 repos GH 3,513 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

3D / NeRF
GitHub
prml-vslam
このリポジトリは、スマートフォンからの未校正単眼ビデオストリームに対応したオフデバイスVSLAMベンチマークフレー…
★ 2 MIT 2026-06-26
AIエージェント
GitHub
desktop-pet
DeskPetは、macOS向けの透明で常に最前面に表示されるピクセルペット型のAIアシスタントです。ユーザーのデスクトッ…
★ 2 NOASSERTION 2026-06-10
動画生成
GitHub
short-video-director
short-video-directorは、Codexスキルシステム向けの短編動画作成支援ツールです。参照画像、キャラクター設定、環境…
★ 2 MIT 2026-06-24
音声生成 / TTS
GitHub
nvatar-demo
NVatarは、3D仮想空間で対話可能なAIアバターです。音声クローニング、9次元の感情追跡、会話に応じた性格進化といっ…
★ 2 MIT 2026-06-02
ASR / 音声認識
GitHub
AiSRT
AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…
★ 2 MIT 2026-06-19
音声生成 / TTS
GitHub
voice-channel
このツールは「voice-channel」と名付けられ、Claude Codeエージェントをハンズフリーで音声操作するためのローカル…
★ 2 NOASSERTION 2026-06-23
マルチモーダル
GitHub
rag-multimodal
このプロジェクトは、複雑な表や図を含むPDF文書から情報を抽出するマルチモーダルRAGシステムの実装デモです。マル…
★ 2 MIT 2026-06-21
画像生成
GitHub
card-skill
card-skillは、Claude Codeスキルとして提供され、テキストコンテンツを洗練されたデザインのPNG画像に変換するツー…
★ 2 MIT 2026-06-26
LLM
GitHub
PDF-RAG-from_scratch
「Dhruvish-28/PDF-RAG-from_scratch」は、複数のPDFドキュメントを同時にアップロードし、質問できるRetrieval-Augm…
★ 2 2026-06-14
音楽生成
GitHub
moltdj-skill
moltdjは、AIエージェント専用に設計されたAPIファーストの音楽・ポッドキャストプラットフォームです。AIエージェン…
★ 2 MIT 2026-04-28
マルチモーダル
GitHub
sentra-rag-failure-modes
このリポジトリは、Googleの最新マルチモーダル埋め込みモデル`gemini-embedding-2`の経験的失敗モードと幾何学的特…
★ 2 MIT 2026-05-08
LLM
GitHub
doc_assistant
Document Assistantは、PDFやEPUBなどの個人文書ライブラリを対象としたローカルファーストのRAG(検索拡張生成)ア…
★ 2 MIT 2026-06-25
画像生成
GitHub
hermes-image-local-tools
この「hermes-image-local-tools」は、Hermesエージェントでローカルでの画像生成を強力にサポートするためのプラグ…
★ 2 MIT 2026-06-03
動画生成
GitHub
sora-2-official-api
このリポジトリは、PoyoAPIの「sora-2-official」モデルを使用して、サーバーサイドで高品質な動画を生成するための…
★ 2 MIT 2026-06-09
3D / NeRF
GitHub
laser-scanner-toolkit
Laser Scanner Toolkit (LSC)は、C++17で実装された3Dラインレーザープロファイラーのキャリブレーション、シミュレ…
★ 2 MIT 2026-06-07
LLM
GitHub
Auralis
Auralisは、約10億パラメータを持つハイブリッドLLM「Helix v2」(Mamba-2/GLA/Sparse-Attentionベース)を利用した…
★ 2 Apache-2.0 2026-06-19
LLM
GitHub
spring-ai-rag-pipeline
このリポジトリは、Spring AI、Chroma、OpenAI、Reactを組み合わせたプロダクションレベルのRetrieval-Augmented Gen…
★ 2 ⑂ 1 MIT 2026-05-31
音声生成 / TTS
GitHub
avataraisdk
avataraisdkは、任意のウェブサイトに簡単に組み込める3D AIアバターSDKです。リアルタイムのリップシンクと多言語音…
★ 2 MIT 2026-05-28
LLM
GitHub
Gemini-chatbot
このGemini Chatbotは、StreamlitとFastAPI、Google Gemini APIを使用して構築されたフルスタックのAIチャットボット…
★ 2 2026-06-16
AIエージェント
GitHub
neon-shadows
「NEON SHADOWS: Chrome & Blood」は、2087年のサイバーパンク世界を舞台にしたPython製のテキストベースRPGです。プ…
★ 2 2026-05-18
画像生成
GitHub
DiffVMB-pub
本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…
★ 2 ⑂ 1 2026-05-04
ASR / 音声認識
GitHub
Murmur
Murmurは、話すだけで文字入力ができる無料のオープンソースAI音声入力ツールです。Alibaba FunASR音声認識エンジン…
★ 2 ⑂ 2 NOASSERTION 2026-06-22