3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub nvatar-demo
NVatarは、3D仮想空間で対話可能なAIアバターです。音声クローニング、9次元の感情追跡、会話に応じた性格進化といっ…
★ 2 MIT 2026-06-02
音声生成 / TTS GitHub saaki-audios
このツールは、Unitree G1ロボットと互換性のある音声ファイルを生成するためのPythonスクリプトです。システムのTex…
★ 2 MIT 2026-06-11
ComfyUI GitHub ComfyUI-MemoryVisualization
ComfyUI-MemoryVisualizationは、画像生成AIツールComfyUI向けに設計された視覚的なダッシュボードです。このツール…
★ 2 2026-06-23
音声生成 / TTS GitHub storyvox
Storyvoxは、TechEmpowerが提供するオープンソースのAndroid向けニューラル音声オーディオブックプレーヤーです。Roy…
★ 2 ⑂ 1 GPL-3.0 2026-06-22
音声生成 / TTS GitHub Read-It-Out
「Read It Out」は、Webページや選択したテキストを自然なAI音声で読み上げるChrome拡張機能です。ブラウザ内蔵エン…
★ 2 2026-05-29
画像生成 GitHub sdxl_container
SDXL Containerは、SDXL (Stable Diffusion XL) のLoRAアダプターの訓練と推論を実行するためのDockerコンテナです。…
★ 2 Apache-2.0 2026-05-27
ComfyUI GitHub comfyui-gallery-loader
comfyui-gallery-loaderは、ComfyUIの画像およびパスウィジェット向けに設計された、タッチフレンドリーなギャラリー…
★ 2 ⑂ 1 MIT 2026-06-24
画像生成 GitHub aether
Aetherは、参考画像や生成結果から「視覚的記憶」を生成・管理し、美的スタイルの一貫した画像を継続的に創作するた…
★ 2 MIT 2026-06-22
LLM GitHub schoolwork-rag
schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…
★ 2 MIT 2026-05-25
LLM GitHub kg-rag
KG-RAGは、Jiraサポートチケットの問い合わせに特化したRAG(検索拡張生成)システムです。ChromaDBによるセマンティ…
★ 2 2026-06-10
ASR / 音声認識 GitHub speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-26
画像生成 GitHub muapi-python
MuAPIの公式Python SDKで、画像、動画、音声の生成、AIによる画像強化、背景除去、動画編集(リップシンク)、ファイ…
★ 2 ⑂ 1 MIT 2026-06-18
LLM GitHub GenAI-PDF-QA-Assistant
このGenAI PDF Q&Aアシスタントは、Streamlit、LangChain、FAISS、OllamaローカルLLMを活用したAI駆動型ツールです。…
★ 2 2026-05-13
音楽生成 GitHub awesome-suno
「Awesome Suno AI」は、テキストプロンプトからボーカルを含む楽曲を生成するAI音楽プラットフォーム「Suno AI」向…
★ 2 ⑂ 3 2026-04-19
LLM GitHub SmallMind
SmallMindは、C#のみで構築されたプロダクション対応のローカル言語モデル推論エンジンです。外部MLフレームワークや…
★ 2 MIT 2026-05-19
LLM GitHub DocLens
DocLensは、PDF、研究論文、レポートなどの文書を、検索可能で構造化されたAI対応の知識に変換するオープンソースの…
★ 2 MIT 2026-06-21
マルチモーダル GitHub visualdocqa-kit
VisoRAGは、ローカルGPU環境で動作する、PDF、DOCX、画像ファイルの質問応答や情報抽出に特化したビジョンファースト…
★ 2 MIT 2026-06-22
AIエージェント GitHub ashlr-md
Ashlr MDは、macOS、Windows、Linuxに対応したオープンソースのAIネイティブMarkdownアプリです。従来のテキストエデ…
★ 2 MIT 2026-06-09
音声生成 / TTS GitHub newscriber
NewScriberは、AIを活用した自律型の多言語ニュース編集・ポッドキャストスクリプト作成・音声ブリーフィング配信ネ…
★ 2 NOASSERTION 2026-06-10
その他 GitHub Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
動画生成 GitHub grokcli
grokcliは、xAI Grokの全機能をCLIで利用できる、ゼロ依存のスタンドアロンツールです。SuperGrokまたはX Premium+の…
★ 2 MIT 2026-06-02
音声生成 / TTS GitHub refinery
Refineryは、Fish AudioおよびFish-Speechの音声クローンモデルにおいて、最適な参照クリップの組み合わせを見つけ出…
★ 2 MIT 2026-06-14
マルチモーダル GitHub aiyeah
AIyeahは、AIアプリケーション開発を簡素化するモジュール型AIプラットフォームです。複数のAIツールやプロバイダー…
★ 2 MIT 2026-05-26
ASR / 音声認識 GitHub Qvoice
Qvoiceは、macOS向けのローカル音声テキスト変換ツールです。Controlキーをダブルタップするだけで録音の開始、停止…
★ 2 ⑂ 1 MIT 2026-06-05