3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-26
画像生成 GitHub muapi-python
MuAPIの公式Python SDKで、画像、動画、音声の生成、AIによる画像強化、背景除去、動画編集(リップシンク)、ファイ…
★ 2 ⑂ 1 MIT 2026-06-18
音楽生成 GitHub SunoCli
Suno CLIは、Suno AIの音楽生成機能をAceDataCloud API経由でコマンドラインから利用できるPython製ツールです。プロ…
★ 2 ⑂ 1 MIT 2026-06-29
画像生成 GitHub reference_anomaly_generation
このツール「Reference Anomaly Generation and Segmentation」は、参照画像から欠陥パターンを抽出して通常の背景画…
★ 2 Apache-2.0 2026-05-08
音声生成 / TTS GitHub refinery
Refineryは、Fish AudioおよびFish-Speechの音声クローンモデルにおいて、最適な参照クリップの組み合わせを見つけ出…
★ 2 MIT 2026-06-14
AIエージェント GitHub ApocData-skill
ApocDataは、中国A株市場のAIネイティブな金融データベースを提供するツールです。株価、財務データ、資金流動、各種…
★ 2 ⑂ 1 Apache-2.0 2026-06-09
音声生成 / TTS GitHub Silero-TTS-Portable
このツールは、Windows向けのポータブルなオフラインTTS(テキスト読み上げ)ソリューションです。Sileroモデルを使…
★ 2 MIT 2026-06-04
画像生成 GitHub sdxl_container
SDXL Containerは、SDXL (Stable Diffusion XL) のLoRAアダプターの訓練と推論を実行するためのDockerコンテナです。…
★ 2 Apache-2.0 2026-05-27
その他 GitHub Neural-Zero-Shot-Voice-Cloning
本システムは、最先端のニューラルネットワーク技術を活用したエンドツーエンドの音声AIで、テキストから高品質な音…
★ 2 MIT 2026-06-11
LLM GitHub schoolwork-rag
schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…
★ 2 MIT 2026-05-25
動画生成 GitHub grokcli
grokcliは、xAI Grokの全機能をCLIで利用できる、ゼロ依存のスタンドアロンツールです。SuperGrokまたはX Premium+の…
★ 2 MIT 2026-06-02
ComfyUI GitHub ComfyUI-PromptLibrary
このツールは「GrimmRibbity — ComfyUI Custom Node Suite」であり、ComfyUI向けの強力なカスタムノードスイートです…
★ 2 MIT 2026-06-22
ASR / 音声認識 GitHub speaknow
SpeakNowは、Windowsデスクトップ向けの軽量な音声入力ツールです。ホットキーを押して話すだけで、認識されたテキス…
★ 2 MIT 2026-04-22
画像生成 GitHub rainfield-diffusion-models
本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…
★ 2 NOASSERTION 2026-05-21
ASR / 音声認識 GitHub voice-sentiment-streamlit
「Voice Sentiment AI」は、音声とテキストの両方からリアルタイムで感情やセンチメントを分析するAI搭載のWebアプリ…
★ 2 2026-04-22
ComfyUI GitHub comfyui-cinema-pipeline
このリポジトリは、プロの映画制作に特化したAI/ジェネレーティブパイプラインアーキテクチャ「ComfyUI Cinema Pipel…
★ 2 NOASSERTION 2026-06-15
LLM GitHub agent-rag-app
SmartDoc Assistantは、AIエージェントとRAG(検索拡張生成)を組み合わせたドキュメントアシスタントです。PDF、TXT…
★ 2 ⑂ 1 2026-05-30
動画生成 GitHub mjj-ai-studio
mjj-ai-studioは、AIアニメーションのストーリーボードとビジュアルワークフローに特化したスタジオです。アイデアか…
★ 2 MIT 2026-06-01
ASR / 音声認識 GitHub echopilot
EchoPilotは、macOS向けの会議記録および文字起こしアプリケーションです。システムオーディオとマイクオーディオを…
★ 2 Apache-2.0 2026-06-09
LLM GitHub production-rag-assistant
この「Production RAG Assistant」は、FastAPI、Postgres/pgvector、ハイブリッド検索、評価ゲート、可観測性などを…
★ 2 2026-05-28
音声生成 / TTS GitHub tongues
「Tongues」は、書かれたテキストと発音の間の可逆マッピング(Grapheme-to-PhonemeおよびPhoneme-to-Grapheme)に特…
★ 2 MIT 2026-07-02
音声生成 / TTS GitHub say-lab
Say Labは、大規模言語モデルとクラウドTTS(Text-to-Speech)を活用した軽量な自ホスト型発音練習Webページです。単…
★ 2 2026-05-14
ComfyUI GitHub semcanvas-ai
SemCanvas AIは、AIを活用した意味論的な画像編集キャンバスです。画像をアップロードまたは生成し、AIが自動で画像…
★ 2 MIT 2026-05-13
ASR / 音声認識 GitHub CWX-Transcribe
CWX-Transcribeは、OpenAIの`gpt-4o-transcribe-diarize`モデルを基盤とした、長時間の2話者インタビュー向け高精度…
★ 2 Apache-2.0 2026-05-06