AIエージェント GitHub minds-platform
Minds Platformは、最先端のAIシステムをユーザーが完全に制御、拡張、デプロイできるオープンな基盤を提供するプラ…
★ 39.3k ⑂ 6.2k MIT 2026-06-18
AIエージェント GitHub agents-course
Hugging Face Agents Courseは、AIエージェントの基礎から応用までを網羅した包括的な学習コースです。大規模言語モ…
★ 29.6k ⑂ 2.1k Apache-2.0 2026-06-05
LLM GitHub RAG_Techniques
このリポジトリは、RAG (Retrieval-Augmented Generation) システムにおける様々な高度なテクニックを詳細なノートブ…
★ 28.2k ⑂ 3.4k NOASSERTION 2026-06-17
動画生成 GitHub ViMax
ViMaxは、単一のコンセプト入力から脚本、絵コンテ、キャラクターデザイン、そして最終的な動画生成まで、動画制作プ…
★ 10.6k ⑂ 1.5k MIT 2026-06-13
マルチモーダル GitHub deeplake
Deep LakeはAIワークロードに特化したデータベースで、深層学習アプリケーション向けのストレージ形式を採用していま…
★ 9.2k ⑂ 717 Apache-2.0 2026-05-21
マルチモーダル GitHub all-in-rag
このプロジェクト「All-in-RAG」は、大規模言語モデル(LLM)アプリケーション開発者向けのRAG(検索拡張生成)技術…
★ 9.0k ⑂ 4.5k 2026-06-05
LLM GitHub ai-engineering-interview-questions
本リポジトリは、AIエンジニア、Gen AIエンジニア、LLMエンジニア、MLOpsエンジニアといったAI関連職種の面接に役立…
★ 2.0k ⑂ 368 Apache-2.0 2026-06-24
LLM GitHub knowhere
Knowhereは、AIエージェントとRAG(検索拡張生成)のために非構造化データを準備する記憶層ツールです。PDFやOffice…
★ 1.8k ⑂ 211 Apache-2.0 2026-06-29
音楽生成 GitHub genmusic_demo_list
このGitHubリポジトリは、自動音楽生成の研究領域における最新のデモウェブサイトを集めたリンク集です。歌詞からボ…
★ 790 ⑂ 59 2026-05-20
LLM GitHub AwesomeOPD
AwesomeOPDは、LLM(大規模言語モデル)、VLM(視覚言語モデル)、エージェント、ドラフトモデルを対象としたオンポ…
★ 695 ⑂ 14 2026-06-23
AIエージェント GitHub mobilegym
MobileGymは、モバイルGUIエージェントの研究を目的とした、検証可能で高並列なシミュレーションプラットフォームで…
★ 653 ⑂ 107 Apache-2.0 2026-06-20
動画生成 GitHub ai-shortVideo-pipeline
myAiVideosは、AIを活用した中国語短編動画の自動制作パイプラインです。トピック発見からクリエイティブ生成、視覚…
★ 427 ⑂ 3 MIT 2026-06-15
マルチモーダル GitHub RISE
RISEは、自己改善型のロボットポリシーを構築するためのフレームワークです。ワールドモデルを実世界でのロボット操…
★ 296 ⑂ 18 2026-06-04
AIエージェント GitHub agent-platform
GoogleのGemini Enterprise Agent Platform(旧Vertex AI)上でAIエージェントを構築するためのコードサンプルとチュ…
★ 222 ⑂ 40 Apache-2.0 2026-05-27
ASR / 音声認識 GitHub wispr
Wisprは、macOSユーザー向けのプライバシーを重視した音声書き起こしアプリケーションです。OpenAI WhisperとNVIDIA …
★ 124 ⑂ 18 Apache-2.0 2026-06-24
音声生成 / TTS GitHub erm
このツールは、英語音声の録音から「um」「uh」といった言い淀みを自動で除去するローカルCLIツールです。`faster-wh…
★ 108 ⑂ 2 MIT 2026-06-14
ComfyUI GitHub ComfyUI-Forbidden-Vision
「ComfyUI Forbidden Vision」は、ComfyUIユーザー向けの革新的な顔検出、セグメンテーション、画像エンハンスメント…
★ 93 ⑂ 5 AGPL-3.0 2026-06-14
3D / NeRF GitHub guidance-for-open-source-3d-reconstruction-toolbox-for-gaussian-splats-on-aws
AWS向けオープンソース3D再構築ツールボックスは、画像や動画入力から3Dシーンやオブジェクトを再構築するためのエン…
★ 84 ⑂ 5 MIT-0 2026-06-25
AIエージェント GitHub uv-scripts-for-ai
このツールは、OCR、画像処理、音声処理など、データおよび機械学習タスク向けの自己完結型UVスクリプト集です。各ス…
★ 76 ⑂ 4 Apache-2.0 2026-06-23
ASR / 音声認識 GitHub docker-whisper
hwdsl2/docker-whisperは、Docker上で動作する自己ホスト型Whisper音声認識サーバーを提供します。高速なfaster-whis…
★ 62 ⑂ 10 NOASSERTION 2026-06-29
LLM GitHub llm-flashcards
「LLM Flashcards」は、大規模言語モデル(LLM)の概念とアーキテクチャを視覚的に解説する300枚以上のフラッシュカ…
★ 59 ⑂ 5 NOASSERTION 2026-06-08
マルチモーダル GitHub GEditBench_v2
GEditBench v2は、汎用画像編集モデルの性能を人間が調整した基準で評価するための包括的なベンチマークです。1,200…
★ 57 ⑂ 1 2026-06-18
LLM GitHub ATM-Bench
ATM-Benchは、画像、動画、メールなどのマルチモーダルデータに対し、約4年間にわたる長期的なパーソナライズされた…
★ 48 ⑂ 2 MIT 2026-06-28
3D / NeRF GitHub wanderland
Wanderlandは、オープンワールドの具現化されたAI向けに、幾何学的に根拠のあるシミュレーションを提供する包括的な…
★ 47 Apache-2.0 2026-06-24