3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#日本語対応 (212 repos)

「日本語対応」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS

GitHub

Doppelvoice

Doppelvoiceは、リアルタイムで中国語・英語を含む9言語間の音声翻訳とゼロショット音声クローニングを提供するツー…

#GUI #Python #Windows

★ 2 ⑂ 1 MIT 2026-04-26

音声生成 / TTS

GitHub

obsidian-mac-tts

「Local Mac TTS for Obsidian」は、ObsidianのノートをmacOSに内蔵された高品質なテキスト読み上げエンジンで読み上…

#macOSのみ #Obsidianプラグイン #オフライン利用可能

★ 2 2026-05-08

音声生成 / TTS

GitHub

tianyan-tts-mobile

「天眼 TTS Mobile」は、軽量なAndroid WebViewブラウザアプリです。PaseoやZCodeの遠隔操作ページ、あるいは一般的…

#Android #CLI #Python

★ 2 MIT 2026-06-16

音声生成 / TTS

GitHub

react-native-tts-kit

react-native-tts-kitは、React NativeおよびExpoアプリ向けに、デバイス上で動作するニューラル音声合成（TTS）ライ…

#AI音声合成 #Android #Expo

★ 2 ⑂ 1 MIT 2026-05-21

画像生成

GitHub

sdxl_container

SDXL Containerは、SDXL (Stable Diffusion XL) のLoRAアダプターの訓練と推論を実行するためのDockerコンテナです。…

#CLI #Docker #GPU必須

★ 2 Apache-2.0 2026-05-27

ASR / 音声認識

GitHub

TermSub

TermSubは、AIを活用して動画コンテンツの文字起こし、翻訳、専門用語管理を行うFastAPIアプリケーションです。マル…

#AI搭載 #Python #Web UI

★ 2 MIT 2026-06-11

ASR / 音声認識

GitHub

YanXi-KCN

Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…

#CLI #GPU必須 #Python

★ 2 2026-05-29

音声生成 / TTS

GitHub

Velora

Veloraは、Groqの高速LLMを活用したAI駆動の多言語翻訳プラットフォームです。単なる単語の翻訳にとどまらず、語彙、…

#AI #JavaScript #LLM

★ 2 MIT 2026-06-14

LLM

GitHub

TrustRAG

TrustRAGは、信頼性の高いRetrieval-Augmented Generation (RAG) 知識ワークベンチです。アップロードされたドキュメ…

#RAG #Web UI #デスクトップアプリ

★ 2 ⑂ 1 Apache-2.0 2026-06-04

マルチモーダル

GitHub

awesome-awesome

本リポジトリは、AI研究の各分野を対象に、「awesome list」、サーベイリポジトリ、学会論文リスト、特定モデルのコ…

#日本語対応

★ 2 CC0-1.0 2026-06-15

画像生成

GitHub

image-prompt-layers

このリポジトリは、AI画像生成の品質を高めるための「7層構造画像プロンプトライブラリ」です。Meta、Subject、Scene…

#Gemini Image対応 #Midjourney対応 #プロンプトエンジニアリング

★ 2 NOASSERTION 2026-05-16

マルチモーダル

GitHub

-deepseek-skills

このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識（OCR機能を含む）と音声認識（…

#AI Skills 套装 #CLI #GPU必須

★ 1 2026-06-04

LLM

GitHub

kura

Kuraは、人間とAIエージェントの両方に最適化された、エージェントネイティブなドキュメント基盤です。Markdown形式…

#Agent-native #CLI #JavaScript/TypeScript

★ 1 MIT 2026-06-19

音声生成 / TTS

GitHub

Cadence

Cadenceは、Windowsユーザー向けのプライベートかつローカルファーストな会議録音・文字起こしツールです。会議音声…

#GPU必須 #Python (内部利用) #Windows 10/11

★ 1 MIT 2026-06-16

マルチモーダル

GitHub

roboclaw-reports

MechMind Chronicleは、AIロボット実験の不透明性を解消し、リッチでレビュー可能なHTMLレポートを生成するオープン…

#AI/Robotics #CLI #Python

★ 1 2026-06-19

動画生成

GitHub

awesome-ai-film

「awesome-ai-film」は、AIが映画制作にもたらす変革を探求し、関連するツールや技術を厳選して紹介するキュレーショ…

#AI #キュレーション #日本語対応

★ 1 MIT 2026-06-04

3D / NeRF

GitHub

vision-embodied-ai-roadmap

このプロジェクトは、コンピュータビジョン、3Dビジョン、自動運転、マルチモーダル知覚、具身知能、ロボティクスと…

#Embodied AI #Learning Resource #Newcomer-friendly

★ 1 NOASSERTION 2026-06-10

ComfyUI

GitHub

ComfyUI-Voice

ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…

#ComfyUI対応 #GPU推奨 #Python

★ 1 Apache-2.0 2026-06-18

画像生成

GitHub

image-to-prompt

このツールは、AIを活用したデスクトップアプリケーションで、画像からAI画像生成のための構造化されたプロンプトを…

#GUI #OpenAI API互換 #Python

★ 1 MIT 2026-06-15

画像生成

GitHub

diffusion-models-from-scratch

NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル（DDPM、U-Net、CFG、CLIPコサイン類似度）をFashionMNIS…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-08

その他

GitHub

my-podcast

「My Podcast Studio」は、AI音声合成とポッドキャストナレーションを提供するオープンソースのSaaSプラットフォーム…

#AI #SaaS #Stripe

★ 1 ⑂ 3 2026-06-09

音声生成 / TTS

GitHub

HiggsAudio-Studio-pinokio

本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…

#GPU必須 #Pinokio対応 #Python

★ 1 ⑂ 1 MIT 2026-06-14

音声生成 / TTS

GitHub

s2s

S2Sは、Rustとsherpa-onnxフレームワークを活用した、高性能で軽量なローカルSTT（音声認識）およびTTS（音声合成）A…

#API #CLI #Rust

★ 1 GPL-3.0 2026-06-10

画像生成

GitHub

awesome-gpt-image-2

このリポジトリは、OpenAIのGPT Image 2で高品質な画像を生成するための2000以上のクリエイティブなプロンプトをまと…

#AI生成 #GPT Image 2対応 #Web UI

★ 1 NOASSERTION 2026-05-05