3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
動画生成 GitHub seedance-2-api
Seedance 2 APIは、APIDotを通じて利用できる、ByteDance Seedが開発した高度なマルチモーダル動画生成モデルです。…
★ 1 MIT 2026-05-25
マルチモーダル GitHub mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23
画像生成 GitHub GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
マルチモーダル GitHub loop-antigravity
loop-antigravityは、Google Antigravity (agy CLI) とGeminiの1Mトークンコンテキストおよびマルチモーダル推論能力…
★ 1 Apache-2.0 2026-06-14
ASR / 音声認識 GitHub Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
マルチモーダル GitHub vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-14
ASR / 音声認識 GitHub VoiceOfIU
VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…
★ 1 Apache-2.0 2026-06-18
画像生成 GitHub knx-skills
knx-skillsは、AIコーディングアシスタントの能力を向上させるための実用的なスキルセットを提供します。マークダウ…
★ 1 2026-06-23
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
マルチモーダル GitHub lfm2.5-vl-ane
LFM2.5-VL on the Apple Neural Engineは、LiquidAIのLFM2.5-VL-450MモデルをApple Neural Engine上で完全に動作させ…
★ 1 NOASSERTION 2026-06-16
音声生成 / TTS GitHub Porta
Portaは、iPhoneから任意のWebブラウザへファイルを直接ストリーミングできる、一時的でグローバルなデバイス間ファ…
★ 1 Apache-2.0 2026-06-25
音声生成 / TTS GitHub logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
動画生成 GitHub p-video-avatar-generator
「P-Video Avatar generator」は、PrunaAIのP-Video Avatarモデルを搭載した、無料のAIトークアバター動画生成デスク…
★ 1 ⑂ 1 MIT 2026-06-10
ASR / 音声認識 GitHub Voice-RAG-Assistant
このVoice-RAG-Assistantは、Python、Groq LLM、Whisper、Google Generative AIを活用した音声対応のRetrieval-Augme…
★ 1 2026-06-18
動画生成 GitHub awesome-ai-music-video-prompts
このGitHubリポジトリは、AIによるミュージックビデオのプロンプト、ビジュアライザーのワークフロー、歌詞ビデオの…
★ 1 2026-04-28
LLM GitHub sibyl
Sibylは、TemporalとGo言語で構築された、堅牢なマルチエージェント収束フレームワークです。ResearcherとCriticの2…
★ 1 2026-05-21
画像生成 GitHub Wireless-water-tank-monitoring-lora
このツールは、無線で水槽の水位を監視し、モーターを遠隔制御するためのソリューションです。LoRa通信により長距離…
★ 1 2026-06-29
3D / NeRF GitHub sfm-monocular-reconstruction
このプロジェクトは、単一の画像シーケンスから3D再構築を行うための2つの主要なアプローチ、Structure from Motion …
★ 1 MIT 2026-04-27
ASR / 音声認識 GitHub kokkai-webtv-captions
「kokkai-webtv-captions」は、国立国会図書館の国会会議録が公式に公開されるまでの未収録期間を埋めるための個人用…
★ 1 MIT 2026-05-25
動画生成 GitHub WaveSpeedAI-Skills
WaveSpeedAI Skillsは、700以上のメディアモデルと290以上のOpenAI互換LLMを統合したWaveSpeedAI推論プラットフォー…
★ 1 MIT 2026-05-21
AIエージェント GitHub the-agents-of-nations
「The Agents of Nations」は、自律AIエージェントがタスクを発見し、スキーマに従ってペイロードを準備し、安全に動…
★ 1 2026-06-12
動画生成 GitHub HappyHorse-1.0
Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…
★ 1 2026-04-11
ASR / 音声認識 GitHub TEL-Voice-Controlled-Smart-Home-Assistant
このツールは、モジュール式のスマートホームアシスタントシステムです。React製のモダンなウェブインターフェースと…
★ 1 2026-06-05