3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
画像生成 GitHub diffusion-models-from-scratch
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNIS…
★ 1 MIT 2026-05-08
ASR / 音声認識 GitHub VoiceOfIU
VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…
★ 1 Apache-2.0 2026-06-18
3D / NeRF GitHub classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
AIエージェント GitHub txfence
txfenceは、EVM、Solana、Cosmosといった主要なブロックチェーン上で動作する自律エージェントの行動を安全に管理す…
★ 1 MIT 2026-05-19
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
マルチモーダル GitHub lfm2.5-vl-ane
LFM2.5-VL on the Apple Neural Engineは、LiquidAIのLFM2.5-VL-450MモデルをApple Neural Engine上で完全に動作させ…
★ 1 NOASSERTION 2026-06-16
音声生成 / TTS GitHub Porta
Portaは、iPhoneから任意のWebブラウザへファイルを直接ストリーミングできる、一時的でグローバルなデバイス間ファ…
★ 1 Apache-2.0 2026-06-25
音声生成 / TTS GitHub logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
動画生成 GitHub p-video-avatar-generator
「P-Video Avatar generator」は、PrunaAIのP-Video Avatarモデルを搭載した、無料のAIトークアバター動画生成デスク…
★ 1 ⑂ 1 MIT 2026-06-10
画像生成 GitHub GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
LLM GitHub Content-Vigilante
Content Vigilanteは、ブランドガイドと対象コンテンツをもとに、文章がブランドの文体や語彙、構成、読みやすさに合…
★ 1 MIT 2026-06-22
ASR / 音声認識 GitHub Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
マルチモーダル GitHub vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-14
音声生成 / TTS GitHub MiniBox
MiniBoxは、キャラクターロールプレイに特化した音声チャットボットです。GPT-SoVITSによる高品質な音声合成とクラウ…
★ 1 MIT 2026-07-01
AIエージェント GitHub pi-context-pruner
pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…
★ 1 2026-06-24
AIエージェント GitHub the-agents-of-nations
「The Agents of Nations」は、自律AIエージェントがタスクを発見し、スキーマに従ってペイロードを準備し、安全に動…
★ 1 2026-06-12
動画生成 GitHub HappyHorse-1.0
Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…
★ 1 2026-04-11
ASR / 音声認識 GitHub TEL-Voice-Controlled-Smart-Home-Assistant
このツールは、モジュール式のスマートホームアシスタントシステムです。React製のモダンなウェブインターフェースと…
★ 1 2026-06-05
ComfyUI GitHub comfyui-prompt-library-nodes
このツールは、ComfyUIユーザー向けのカスタムノードコレクションです。大規模なComfyUIワークフローで、プロンプト…
★ 1 MIT 2026-05-31
LLM GitHub logal-rag
「logal-rag」は、ローカルのプライベートファイルを対象に、RAG(Retrieval Augmented Generation)技術を用いてユ…
★ 1 MIT 2026-06-25
マルチモーダル GitHub vision-bridge-skill
「vision-bridge-skill」は、多モーダル対応ではないAIモデルに対し、画像、PDF、スクリーンショット、図表などの視…
★ 1 2026-06-11
画像生成 GitHub ComfyUI-Mutantwork
ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…
★ 1 ⑂ 1 2026-06-12