3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
画像生成 GitHub FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01
画像生成 GitHub Multi-Modal-105
このプロジェクトは、テキストから画像(T2I)およびテキストから動画(T2V)を生成する、プロダクションレベルかつ…
★ 5 MIT 2026-06-06
ASR / 音声認識 GitHub MicType
MicTypeは、macOSユーザー向けの革新的な音声入力ツールであり、AIコマンド機能を統合しています。ホットキーの「タ…
★ 5 ⑂ 2 MIT 2026-06-24
3D / NeRF GitHub Spatial-Intelligence-Handbook
この「Spatial Intelligence Handbook」は、SLAM、VIO、3D表現、センサー、デプロイメントの課題を、ロボットアーム…
★ 5 NOASSERTION 2026-06-14
ASR / 音声認識 GitHub ditto
DittoはWindows向けに開発された、無料かつオープンソースのローカル音声テキスト変換デスクトップアプリケーション…
★ 5 ⑂ 1 MIT 2026-05-10
動画生成 GitHub ml-animations
ml-animationsは、機械学習と線形代数の概念を楽しく学習するためのインタラクティブなアニメーションと演習を提供す…
★ 5 2026-06-25
ASR / 音声認識 GitHub whisperx-transcriber
WhisperX Transcriberは、Windowsユーザー向けのオフラインAI音声文字変換ツールです。OpenAIのWhisperモデルとWhisp…
★ 5 ⑂ 1 MIT 2026-06-09
AIエージェント GitHub ai-security-methodology
AI Security Methodologyは、AIエージェント向けのセキュリティ研究方法論を提供するリポジトリです。攻撃パターン、…
★ 5 MIT 2026-05-23
音声生成 / TTS GitHub learn-almost-anything
「Learn (Almost) Anything」は、選択したトピックからパーソナライズされたコースを作成し、その学習を支援するデス…
★ 5 2026-06-20
ComfyUI GitHub ComfyUI_834t_scene_composer
ComfyUI上でレイヤー単位のリージョナルプロンプト作業をまとめて行えるカスタムノードです。色別レイヤーごとにプロ…
★ 5 ⑂ 1 MIT 2026-04-03
ASR / 音声認識 GitHub ANARCHY
ANARCHYは、クラウドやテレメトリーに依存しない、完全ローカルかつオフラインファーストのWindows向けAIアシスタン…
★ 5 MIT 2026-06-08
AIエージェント GitHub hermes-skill-short-drama-master
「短剧大师™ v6.2」は、一文のアイデアから高品質なAIマイクロ短劇を生成する、世界初の全プロセス閉ループ、精密エ…
★ 5 2026-06-26
AIエージェント GitHub AeroGraph
AeroGraphは、AIエージェントのワークフローに特化したオープンソースの視覚的デバッガー兼フライトレコーダーです。…
★ 5 ⑂ 2 Apache-2.0 2026-06-21
LLM GitHub mosaic
Mosaicは、AIエージェントの記憶をローカル環境で効率的かつ安全に管理するためのMCP(Model Context Protocol)サー…
★ 5 MIT 2026-06-04
音楽生成 GitHub PiAPI-Skills
このツールは、AIコーディングエージェントがPiAPIを介してMidjourney、Suno、Kling、Lumaなどの多様なAIモデル群を…
★ 5 MIT 2026-06-24
画像生成 GitHub ai-toolkit-Ostris-bonememory
AI-Toolkit向けの「Viking Engine」は、非同期CUDAメモリマネージャーとbf16精度強制により、LoRA学習におけるVRAMの…
★ 5 MIT 2026-06-24
3D / NeRF GitHub Future-Droidux
Future Droiduxは、動き、知能、適応型インターフェースデザインの交差点を探索する次世代の没入型Web体験です。人間…
★ 5 2026-05-21
マルチモーダル GitHub thesis-iot-monitoring
このツールは、自然言語の指示に基づいてIoTデバイスが自律的に視覚監視を行うシステムです。AIエージェントがユーザ…
★ 5 ⑂ 1 NOASSERTION 2026-06-05
動画生成 GitHub claude-video-editor
Claude video editorは、AIアシスタントのClaudeを活用し、コマンドラインで動画編集や動画生成を行うツールです。フ…
★ 5 ⑂ 1 NOASSERTION 2026-06-12
LLM GitHub mini-rag
miniRは、AIエージェント向けの軽量でセルフホスト型のRAG(検索拡張生成)検索バックエンドです。Markdown、Word、P…
★ 5 ⑂ 1 MIT 2026-06-02
音声生成 / TTS GitHub openvoice-cloning
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…
★ 5 MIT 2026-06-13
音声生成 / TTS GitHub nano-codec
nano-codecは、最小限のニューラルオーディオコーデックであり、16kHzモノラルの音声を128倍に圧縮し、10.2kbpsの低…
★ 5 2026-03-31
LLM GitHub SocialSim
本リポジトリは、AAAI 2025論文「SocialSim: Towards Socialized Simulation of Emotional Support Conversation」に…
★ 5 ⑂ 1 NOASSERTION 2026-05-20
音声生成 / TTS GitHub voice-audition
VoiceAuditionは、AIエージェント向けのTTS(Text-to-Speech)音声ディスカバリー・推薦ツールです。9つのTTSプロバ…
★ 5 ⑂ 1 MIT 2026-06-24