3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-26
画像生成
GitHub
muapi-python
MuAPIの公式Python SDKで、画像、動画、音声の生成、AIによる画像強化、背景除去、動画編集(リップシンク)、ファイ…
★ 2 ⑂ 1 MIT 2026-06-18
音楽生成
GitHub
SunoCli
Suno CLIは、Suno AIの音楽生成機能をAceDataCloud API経由でコマンドラインから利用できるPython製ツールです。プロ…
★ 2 ⑂ 1 MIT 2026-06-29
画像生成
GitHub
reference_anomaly_generation
このツール「Reference Anomaly Generation and Segmentation」は、参照画像から欠陥パターンを抽出して通常の背景画…
★ 2 Apache-2.0 2026-05-08
音声生成 / TTS
GitHub
refinery
Refineryは、Fish AudioおよびFish-Speechの音声クローンモデルにおいて、最適な参照クリップの組み合わせを見つけ出…
★ 2 MIT 2026-06-14
AIエージェント
GitHub
ApocData-skill
ApocDataは、中国A株市場のAIネイティブな金融データベースを提供するツールです。株価、財務データ、資金流動、各種…
★ 2 ⑂ 1 Apache-2.0 2026-06-09
音声生成 / TTS
GitHub
Silero-TTS-Portable
このツールは、Windows向けのポータブルなオフラインTTS(テキスト読み上げ)ソリューションです。Sileroモデルを使…
★ 2 MIT 2026-06-04
画像生成
GitHub
sdxl_container
SDXL Containerは、SDXL (Stable Diffusion XL) のLoRAアダプターの訓練と推論を実行するためのDockerコンテナです。…
★ 2 Apache-2.0 2026-05-27
その他
GitHub
Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
LLM
GitHub
schoolwork-rag
schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…
★ 2 MIT 2026-05-25
動画生成
GitHub
grokcli
grokcliは、xAI Grokの全機能をCLIで利用できる、ゼロ依存のスタンドアロンツールです。SuperGrokまたはX Premium+の…
★ 2 MIT 2026-06-02
ComfyUI
GitHub
ComfyUI-PromptLibrary
このツールは「GrimmRibbity — ComfyUI Custom Node Suite」であり、ComfyUI向けの強力なカスタムノードスイートです…
★ 2 MIT 2026-06-22
画像生成
GitHub
rainfield-diffusion-models
本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…
★ 2 NOASSERTION 2026-05-21
ASR / 音声認識
GitHub
voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
ComfyUI
GitHub
comfyui-cinema-pipeline
このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…
★ 2 NOASSERTION 2026-06-15
LLM
GitHub
agent-rag-app
SmartDoc Assistantは、AIエージェントとRAG(検索拡張生成)を組み合わせたドキュメントアシスタントです。PDF、TXT…
★ 2 ⑂ 1 2026-05-30
動画生成
GitHub
mjj-ai-studio
mjj-ai-studioは、AIアニメーションのストーリーボードとビジュアルワークフローに特化したスタジオです。アイデアか…
★ 2 MIT 2026-06-01
ASR / 音声認識
GitHub
echopilot
EchoPilotは、macOS向けの会議記録および文字起こしアプリケーションです。システムオーディオとマイクオーディオを…
★ 2 Apache-2.0 2026-06-09
LLM
GitHub
production-rag-assistant
この「Production RAG Assistant」は、FastAPI、Postgres/pgvector、ハイブリッド検索、評価ゲート、可観測性などを…
★ 2 2026-05-28
音声生成 / TTS
GitHub
tongues
「Tongues」は、書かれたテキストと発音の間の可逆マッピング(Grapheme-to-PhonemeおよびPhoneme-to-Grapheme)に特…
★ 2 MIT 2026-07-02
音声生成 / TTS
GitHub
say-lab
Say Labは、大規模言語モデルとクラウドTTS(Text-to-Speech)を活用した軽量な自ホスト型発音練習Webページです。単…
★ 2 2026-05-14
ComfyUI
GitHub
semcanvas-ai
SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…
★ 2 MIT 2026-05-13
ASR / 音声認識
GitHub
CWX-Transcribe
CWX-Transcribeは、OpenAIの`gpt-4o-transcribe-diarize`モデルを基盤とした、長時間の2話者インタビュー向け高精度…
★ 2 Apache-2.0 2026-05-06