3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#日本語対応 (212 repos)
「日本語対応」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub Doppelvoice
Doppelvoiceは、リアルタイムで中国語・英語を含む9言語間の音声翻訳とゼロショット音声クローニングを提供するツー…
★ 2 ⑂ 1 MIT 2026-04-26
音声生成 / TTS GitHub obsidian-mac-tts
「Local Mac TTS for Obsidian」は、ObsidianのノートをmacOSに内蔵された高品質なテキスト読み上げエンジンで読み上…
★ 2 2026-05-08
音声生成 / TTS GitHub tianyan-tts-mobile
「天眼 TTS Mobile」は、軽量なAndroid WebViewブラウザアプリです。PaseoやZCodeの遠隔操作ページ、あるいは一般的…
★ 2 MIT 2026-06-16
音声生成 / TTS GitHub react-native-tts-kit
react-native-tts-kitは、React NativeおよびExpoアプリ向けに、デバイス上で動作するニューラル音声合成(TTS)ライ…
★ 2 ⑂ 1 MIT 2026-05-21
画像生成 GitHub sdxl_container
SDXL Containerは、SDXL (Stable Diffusion XL) のLoRAアダプターの訓練と推論を実行するためのDockerコンテナです。…
★ 2 Apache-2.0 2026-05-27
ASR / 音声認識 GitHub TermSub
TermSubは、AIを活用して動画コンテンツの文字起こし、翻訳、専門用語管理を行うFastAPIアプリケーションです。マル…
★ 2 MIT 2026-06-11
ASR / 音声認識 GitHub YanXi-KCN
Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…
★ 2 2026-05-29
音声生成 / TTS GitHub Velora
Veloraは、Groqの高速LLMを活用したAI駆動の多言語翻訳プラットフォームです。単なる単語の翻訳にとどまらず、語彙、…
★ 2 MIT 2026-06-14
LLM GitHub TrustRAG
TrustRAGは、信頼性の高いRetrieval-Augmented Generation (RAG) 知識ワークベンチです。アップロードされたドキュメ…
★ 2 ⑂ 1 Apache-2.0 2026-06-04
マルチモーダル GitHub awesome-awesome
本リポジトリは、AI研究の各分野を対象に、「awesome list」、サーベイリポジトリ、学会論文リスト、特定モデルのコ…
★ 2 CC0-1.0 2026-06-15
画像生成 GitHub image-prompt-layers
このリポジトリは、AI画像生成の品質を高めるための「7層構造画像プロンプトライブラリ」です。Meta、Subject、Scene…
★ 2 NOASSERTION 2026-05-16
マルチモーダル GitHub -deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
LLM GitHub kura
Kuraは、人間とAIエージェントの両方に最適化された、エージェントネイティブなドキュメント基盤です。Markdown形式…
★ 1 MIT 2026-06-19
音声生成 / TTS GitHub Cadence
Cadenceは、Windowsユーザー向けのプライベートかつローカルファーストな会議録音・文字起こしツールです。会議音声…
★ 1 MIT 2026-06-16
マルチモーダル GitHub roboclaw-reports
MechMind Chronicleは、AIロボット実験の不透明性を解消し、リッチでレビュー可能なHTMLレポートを生成するオープン…
★ 1 2026-06-19
動画生成 GitHub awesome-ai-film
「awesome-ai-film」は、AIが映画制作にもたらす変革を探求し、関連するツールや技術を厳選して紹介するキュレーショ…
★ 1 MIT 2026-06-04
3D / NeRF GitHub vision-embodied-ai-roadmap
このプロジェクトは、コンピュータビジョン、3Dビジョン、自動運転、マルチモーダル知覚、具身知能、ロボティクスと…
★ 1 NOASSERTION 2026-06-10
ComfyUI GitHub ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
画像生成 GitHub image-to-prompt
このツールは、AIを活用したデスクトップアプリケーションで、画像からAI画像生成のための構造化されたプロンプトを…
★ 1 MIT 2026-06-15
画像生成 GitHub diffusion-models-from-scratch
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNIS…
★ 1 MIT 2026-05-08
その他 GitHub my-podcast
「My Podcast Studio」は、AI音声合成とポッドキャストナレーションを提供するオープンソースのSaaSプラットフォーム…
★ 1 ⑂ 3 2026-06-09
音声生成 / TTS GitHub HiggsAudio-Studio-pinokio
本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…
★ 1 ⑂ 1 MIT 2026-06-14
音声生成 / TTS GitHub s2s
S2Sは、Rustとsherpa-onnxフレームワークを活用した、高性能で軽量なローカルSTT(音声認識)およびTTS(音声合成)A…
★ 1 GPL-3.0 2026-06-10
画像生成 GitHub awesome-gpt-image-2
このリポジトリは、OpenAIのGPT Image 2で高品質な画像を生成するための2000以上のクリエイティブなプロンプトをまと…
★ 1 NOASSERTION 2026-05-05