3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
画像生成 GitHub kimodo-houdini-bridge
このツールは、NVIDIA Kimodo(テキスト駆動の3D人体モーション生成AIモデル)をSideFX Houdiniに連携させるブリッジ…
★ 7 ⑂ 2 2026-06-10
ASR / 音声認識 GitHub nexo-whisper
Nexo Whisperは、macOS向けのネイティブアプリで、音声による文字起こしを100%ローカルで行います。ホットキーを押し…
★ 7 ⑂ 2 NOASSERTION 2026-05-31
マルチモーダル GitHub AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 7 MIT 2026-06-27
動画生成 GitHub claude-video-editor
Claude video editorは、AIアシスタントのClaudeを活用し、コマンドラインで動画編集や動画生成を行うツールです。フ…
★ 6 ⑂ 1 NOASSERTION 2026-06-12
ComfyUI GitHub comfyui-ai-studio
ComfyUI AI Studioは、AI画像、動画、音楽生成のためのワークフロー駆動型クリエイティブスタジオです。ComfyUIの強…
★ 6 ⑂ 1 MIT 2026-05-03
LLM GitHub agentsync
agentsyncは、複数のデバイス間でMarkdownファイルなどのフォルダをリアルタイムに同期し、ポイントインタイムリカバ…
★ 6 2026-05-17
ASR / 音声認識 GitHub game_voice_trans
VoxGoは、PCゲームプレイヤー向けに開発されたオープンソースのリアルタイム音声翻訳フロートウィンドウツールです。…
★ 6 GPL-3.0 2026-06-29
AIエージェント GitHub otto
ottoは、AIエージェントの行動を改善・永続化するための「行動層」を提供するツールです。エージェントが過去の修正…
★ 6 ⑂ 1 MIT 2026-06-22
音声生成 / TTS GitHub the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 6 ⑂ 1 MIT 2026-05-27
画像生成 GitHub comfyui-lighthouse
ComfyUI用のLighthouseは、ノード間の接続関係を視覚的に明確にする非破壊的なオーバーレイツールです。クリックした…
★ 6 ⑂ 2 2026-06-07
ASR / 音声認識 GitHub hush
HushはmacOS向けのローカルプッシュトゥトーク音声入力ツールです。指定されたショートカットキー(デフォルトはfnキ…
★ 6 ⑂ 1 MIT 2026-06-10
ASR / 音声認識 GitHub Clippos
Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…
★ 6 ⑂ 1 MIT 2026-04-26
AIエージェント GitHub commerce-agents
commerce-agentsは、Eコマースアプリケーション向けに自律型エージェントを構築するためのツール群です。在庫管理、…
★ 6 MIT 2026-05-01
LLM GitHub agent-engineering-roadmap
このリポジトリは、プロンプトやRAGの段階を超え、本番環境で利用可能なAIエージェントの構築を目指す開発者向けの、…
★ 6 ⑂ 1 MIT 2026-06-26
音楽生成 GitHub mlx-swift-audio
mlx-swift-audioは、テキストから音声への変換(TTS)と音声からテキストへの変換(STT)機能をアプリケーションに提…
★ 6 ⑂ 2 MIT 2026-07-03
動画生成 GitHub ai-film-skills
AI Film Studioは、Claude Code向けに設計されたエンドツーエンドのAI映画制作エージェントスキルです。ストーリーボ…
★ 6 ⑂ 1 MIT 2026-05-05
画像生成 GitHub M2GenCO
M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…
★ 6 2026-05-26
画像生成 GitHub nanoDLM
「nanoDLM」は、最もシンプルで、実際に学習・デバッグ・学習が可能なマスク拡散言語モデル(MDM)の実装です。約110…
★ 6 ⑂ 1 2026-05-16
LLM GitHub crawl-rag
crawl-ragは、RAG(Retrieval Augmented Generation)の知識ベースファイルを生成するためのWebクローラーライブラリ…
★ 6 NOASSERTION 2026-05-01
AIエージェント GitHub noah-gen3-type2
「noah-gen3-type2」は、コンテキスト管理、記憶閉ループ、自律進化を特徴とする汎用型AI認知アーキテクチャです。「…
★ 6 2026-06-24
3D / NeRF GitHub StoryCore-Engine
StoryCore Engineは、スクリプトから一貫性のある画像、動画、ストーリー、対話、空間オーディオを生成する、ローカ…
★ 6 ⑂ 1 MIT 2026-06-25
画像生成 GitHub CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
動画生成 GitHub seedance-superprompt
Seedance 2.0 Superpromptは、ByteDance Seedance 2.0の動画生成プロンプト作成を支援するポータブルなプロンプトス…
★ 6 ⑂ 2 MIT 2026-05-23
ASR / 音声認識 GitHub MicType
MicTypeは、macOSユーザー向けの革新的な音声入力ツールであり、AIコマンド機能を統合しています。ホットキーの「タ…
★ 6 ⑂ 2 MIT 2026-06-24