3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
画像生成 GitHub GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
マルチモーダル GitHub loop-antigravity
loop-antigravityは、Google Antigravity (agy CLI) とGeminiの1Mトークンコンテキストおよびマルチモーダル推論能力…
★ 1 Apache-2.0 2026-06-14
ASR / 音声認識 GitHub Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
ASR / 音声認識 GitHub VoiceOfIU
VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…
★ 1 Apache-2.0 2026-06-18
画像生成 GitHub DSCA-ReID-Framework
本リポジトリは、人再識別における「拡散ベースのセマンティックカモフラージュ攻撃(DSCA)」に特化した軽量なPyTor…
★ 1 MIT 2026-05-28
LLM GitHub lore
loreは、AIコーディングエージェントがプロジェクトの知識やコンテキストを記憶し、同じ間違いを繰り返さないように…
★ 1 NOASSERTION 2026-06-26
画像生成 GitHub knx-skills
knx-skillsは、AIコーディングアシスタントの能力を向上させるための実用的なスキルセットを提供します。マークダウ…
★ 1 2026-06-23
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
マルチモーダル GitHub lfm2.5-vl-ane
LFM2.5-VL on the Apple Neural Engineは、LiquidAIのLFM2.5-VL-450MモデルをApple Neural Engine上で完全に動作させ…
★ 1 NOASSERTION 2026-06-16
音声生成 / TTS GitHub Porta
Portaは、iPhoneから任意のWebブラウザへファイルを直接ストリーミングできる、一時的でグローバルなデバイス間ファ…
★ 1 Apache-2.0 2026-06-25
音声生成 / TTS GitHub logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
動画生成 GitHub p-video-avatar-generator
「P-Video Avatar generator」は、PrunaAIのP-Video Avatarモデルを搭載した、無料のAIトークアバター動画生成デスク…
★ 1 ⑂ 1 MIT 2026-06-10
ASR / 音声認識 GitHub Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
動画生成 GitHub ai-video-generation
このリポジトリは、Frameloop API を用いたAI動画自動化のための実用的な「curlレシピ集」です。顔出しなしのYouTube…
★ 1 2026-05-13
ComfyUI GitHub Comfy_Storyboard
「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…
★ 1 MIT 2026-04-13
ASR / 音声認識 GitHub kokkai-webtv-captions
「kokkai-webtv-captions」は、国立国会図書館の国会会議録が公式に公開されるまでの未収録期間を埋めるための個人用…
★ 1 MIT 2026-05-25
動画生成 GitHub WaveSpeedAI-Skills
WaveSpeedAI Skillsは、700以上のメディアモデルと290以上のOpenAI互換LLMを統合したWaveSpeedAI推論プラットフォー…
★ 1 MIT 2026-05-21
AIエージェント GitHub the-agents-of-nations
「The Agents of Nations」は、自律AIエージェントがタスクを発見し、スキーマに従ってペイロードを準備し、安全に動…
★ 1 2026-06-12
動画生成 GitHub HappyHorse-1.0
Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…
★ 1 2026-04-11
ASR / 音声認識 GitHub TEL-Voice-Controlled-Smart-Home-Assistant
このツールは、モジュール式のスマートホームアシスタントシステムです。React製のモダンなウェブインターフェースと…
★ 1 2026-06-05
ComfyUI GitHub comfyui-prompt-library-nodes
このツールは、ComfyUIユーザー向けのカスタムノードコレクションです。大規模なComfyUIワークフローで、プロンプト…
★ 1 MIT 2026-05-31
LLM GitHub logal-rag
「logal-rag」は、ローカルのプライベートファイルを対象に、RAG(Retrieval Augmented Generation)技術を用いてユ…
★ 1 MIT 2026-06-25
マルチモーダル GitHub vision-bridge-skill
「vision-bridge-skill」は、多モーダル対応ではないAIモデルに対し、画像、PDF、スクリーンショット、図表などの視…
★ 1 2026-06-11