3,636 repos GH 3,521 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ComfyUI GitHub ideogram4_prompter-ComfyUI
このComfyUIカスタムノードは、Ideogram 4のMagic Prompt APIを活用し、ユーザーが入力した簡単なプロンプトを、Ideo…
★ 7 ⑂ 1 MIT 2026-06-04
AIエージェント GitHub Operon
Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…
★ 7 ⑂ 1 MIT 2026-06-01
マルチモーダル GitHub 35gateway
「35Gateway」は、35m.aiが開発・運営するソース利用可能なAIゲートウェイです。テキスト、画像、動画、音声、音楽と…
★ 6 ⑂ 1 NOASSERTION 2026-04-15
音声生成 / TTS GitHub vocalis
Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…
★ 6 MIT 2026-05-21
画像生成 GitHub CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
音声生成 / TTS GitHub ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 6 ⑂ 1 MIT 2026-06-23
3D / NeRF GitHub 4dgs-human-avatar-comfyui-nodes-dataset
このリポジトリは、ComfyUI向けの究極の4DGS(4D Gaussian Splatting)モジュール「Shramko-Volumetric-Bridge」と、…
★ 6 Apache-2.0 2026-06-19
マルチモーダル GitHub CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 6 ⑂ 1 MIT 2026-05-19
マルチモーダル GitHub wgram-lm
W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…
★ 6 AGPL-3.0 2026-06-21
音楽生成 GitHub mlx-swift-audio
mlx-swift-audioは、テキストから音声への変換(TTS)と音声からテキストへの変換(STT)機能をアプリケーションに提…
★ 6 ⑂ 2 MIT 2026-06-25
画像生成 GitHub rocmroll
ComfyUI ROCmRollは、Windowsプラットフォーム向けのComfyUIインスタンス管理ツールです。AMD GPUとROCmパッケージに…
★ 6 MIT 2026-06-25
マルチモーダル GitHub Operator-on-Android
Operatorは、PCに接続することなく、視覚言語モデル(VLM)を使用してAndroidスマートフォンを直接操作できるオンデ…
★ 6 ⑂ 1 MIT 2026-06-17
音声生成 / TTS GitHub uttera-tts-hotcold
uttera-tts-hotcoldは、ハイブリッドな「Hot/Cold」ワーカーアーキテクチャとプラグ可能なバックエンド(Coqui XTTS-…
★ 6 ⑂ 2 Apache-2.0 2026-05-15
3D / NeRF GitHub LandmarkDiff-public
LandmarkDiffは、単一の顔写真から美容整形手術後の予測画像を生成する革新的なツールです。解剖学的に条件付けされ…
★ 6 ⑂ 11 MIT 2026-05-01
音声生成 / TTS GitHub ghost-narrator
Ghost Narratorは、ブログや静的サイト向けに自己ホスト型のAI音声ナレーションを提供するツールです。ElevenLabsの…
★ 6 ⑂ 1 MIT 2026-06-15
ASR / 音声認識 GitHub voxrt-asr-models
このリポジトリは、VoxRTオンデバイスランタイム向けに最適化されたASR(自動音声認識)モデルのウェイトを提供しま…
★ 6 NOASSERTION 2026-05-28
AIエージェント GitHub commerce-agents
commerce-agentsは、Eコマースアプリケーション向けに自律型エージェントを構築するためのツール群です。在庫管理、…
★ 6 MIT 2026-05-01
ASR / 音声認識 GitHub ai_interview
このツールは、リアルタイム音声対話、多段階面接、ライブ採点、詳細レポート生成機能を備えたAI駆動型模擬面接プラ…
★ 6 2026-06-15
画像生成 GitHub kimodo-houdini-bridge
このツールは、NVIDIA Kimodo(テキスト駆動の3D人体モーション生成AIモデル)をSideFX Houdiniに連携させるブリッジ…
★ 6 ⑂ 1 2026-06-10
マルチモーダル GitHub AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 6 MIT 2026-06-12
動画生成 GitHub ai-film-skills
AI Film Studioは、Claude Code向けに設計されたエンドツーエンドのAI映画制作エージェントスキルです。ストーリーボ…
★ 6 ⑂ 1 MIT 2026-05-05
LLM GitHub CRIMENET
CRIMENETは、世界中の犯罪組織間の同盟と敵対関係をマッピングしたオープンソースのデータベースおよびインタラクテ…
★ 6 MIT 2026-06-17
LLM GitHub pioneer
Pioneerは、手元PCや自分で管理するサーバー上で動かせるローカルファーストの個人向けAIアシスタント基盤です。永続…
★ 6 MIT 2026-06-28
LLM GitHub crawl-rag
crawl-ragは、RAG(Retrieval Augmented Generation)の知識ベースファイルを生成するためのWebクローラーライブラリ…
★ 6 NOASSERTION 2026-05-01