3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ComfyUI GitHub ComfyUI_AB_Wildcard
「AB Wildcard - ComfyUI Wildcard Processor」は、ComfyUIのプロンプト作成を劇的に強化するカスタムノードです。ワ…
★ 2 ⑂ 1 MIT 2026-06-13
動画生成 GitHub ai-video-pipeline
このツールは、AIを活用してスクリプト作成、画像検索、音声合成、最終的なMP4動画生成までを完全に自動化する、無料…
★ 2 2026-05-13
画像生成 GitHub ReCo-Diff
ReCo-Diffは、スパースビューCT(低線量CT)における画像再構成のための、残差条件付き決定論的サンプリングに基づく…
★ 2 MIT 2026-06-15
ASR / 音声認識 GitHub agentdictate
AgentDictateは、Linux環境向けのプッシュツートーク音声入力アプリケーションです。OpenAIの音声テキスト変換APIを…
★ 2 MIT 2026-05-14
LLM GitHub GameAgent
DB GameAgentは、ローカルで動作するゲームデータベースアシスタントです。現状は「アークナイツ」のゲームデータ、…
★ 2 MIT 2026-05-16
LLM GitHub rusty-gpt
rusty-gptは、RustとBurnライブラリを用いてゼロから開発されたGPTモデルで、埋め込みから完全なトランスフォーマー…
★ 2 Apache-2.0 2026-06-18
画像生成 GitHub image-prompt-layers
このリポジトリは、AI画像生成の品質を高めるための「7層構造画像プロンプトライブラリ」です。Meta、Subject、Scene…
★ 2 NOASSERTION 2026-05-16
音声生成 / TTS GitHub strands-omnivoice
strands-omnivoiceは、Strands Agents向けの多言語ゼロショットTTSツールキットです。600以上の言語に対応し、わずか…
★ 2 Apache-2.0 2026-05-16
画像生成 GitHub DiffVMB-pub
本リポジトリは、拡散モデルを利用した浅層から深層への速度モデル構築に関する、学術論文の公式かつ再現可能な資料…
★ 2 ⑂ 1 2026-05-04
ComfyUI GitHub Prompt808
Prompt808は、ComfyUI用のビジョンLLMプロンプト生成ノードです。画像からコンテンツやスタイルを学習し、ユーザーの…
★ 2 ⑂ 1 MIT 2026-04-25
3D / NeRF GitHub tju-cv-course-project
このリポジトリは、医用画像の分類、セグメンテーション、および3D再構築に特化したコンピュータビジョンの学術プロ…
★ 2 MIT 2026-03-21
LLM GitHub AI-consultant-for-the-store
このプロジェクトは、自然言語を理解し、カタログからの商品推奨、カート管理、注文処理、およびマネージャーへの通…
★ 2 MIT 2026-06-22
音声生成 / TTS GitHub voice-ai-chat
このツールは、オープンソース技術(Whisper、Groq、LLaMA 3.3、gTTS、FastAPIなど)を基にゼロから構築された音声AI…
★ 2 MIT 2026-05-25
LLM GitHub Awesome-Self-Distillation
「Awesome Large Model Self-Distillation」は、大規模言語モデル(LLMs)、マルチモーダルLLMs(MLLMs)、推論モデ…
★ 2 Apache-2.0 2026-05-26
動画生成 GitHub AI-E-Commerce-Media-Studio
このAI Eコマースメディアスタジオは、AIを活用してEコマース向けの商用利用可能な商品画像やシネマティックビデオを…
★ 2 ⑂ 1 2026-06-15
3D / NeRF GitHub ARIS-in-AI-Offer
このツールは、「ARIS(Auto Research in Sleep)」エージェントフレームワークを活用し、AI分野での就職活動(特に…
★ 2 MIT 2026-06-25
音声生成 / TTS GitHub obsidian-mac-tts
「Local Mac TTS for Obsidian」は、ObsidianのノートをmacOSに内蔵された高品質なテキスト読み上げエンジンで読み上…
★ 2 2026-05-08
ASR / 音声認識 GitHub hey-claude
「Hey Claude」は、ブラウザからハンズフリーでAnthropicのClaude Codeを音声操作できるツールです。ウェイクワード…
★ 2 MIT 2026-06-10
音声生成 / TTS GitHub Velora
Veloraは、Groqの高速LLMを活用したAI駆動の多言語翻訳プラットフォームです。単なる単語の翻訳にとどまらず、語彙、…
★ 2 MIT 2026-06-14
画像生成 GitHub rainfield-diffusion-models
本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…
★ 2 NOASSERTION 2026-05-21
動画生成 GitHub seedance2-video-gen-skill-for-openclaw
本ツールは、OpenClaw、Claude Code、OpenCodeといったAIエージェント向けに、GPT Image 2を活用したAI画像生成・編…
★ 2 ⑂ 1 MIT 2026-06-16
画像生成 GitHub prompt-to-skill
prompt-to-skillは、AIプロンプトを再利用可能なAIスキルに変換し、標準化、検証を支援するツールです。異なるAIモデ…
★ 2 2026-06-23
ASR / 音声認識 GitHub AiSRT
AISRTは、Windowsデスクトップおよびコマンドラインで動作するAI字幕生成ツールです。動画や音声ファイルからタイム…
★ 2 MIT 2026-06-19
画像生成 GitHub media-routing-mesh
Media-OSは、AIアシストメディア制作のためのルーティングオペレーティングシステムであり、特にClaude Code向けに設…
★ 2 2026-06-23