LLM GitHub awesome-ai-auto-research
AIによる自動研究やAI支援研究に関する論文を体系的に追跡・整理するリポジトリです。論文「AI for Auto-Research: R…
★ 402 ⑂ 31 MIT 2026-06-21
LLM GitHub Nova3D
Nova3Dは、テキストまたは参照画像から編集可能で、パーツごとに分割された3Dモデルを生成するAIツールです。従来の…
★ 401 ⑂ 42 MIT 2026-06-28
動画生成 GitHub World-R1
World-R1は、テキストからビデオを生成する際に、3Dの幾何学的制約を強化学習で強化する新しいフレームワークです。…
★ 400 ⑂ 15 MIT 2026-06-03
マルチモーダル GitHub antfly
Antflyは、etcdのRaftライブラリを基盤とした分散型検索エンジンです。フルテキスト検索(BM25)、ベクトル類似性、…
★ 400 ⑂ 27 NOASSERTION 2026-06-29
音声生成 / TTS GitHub unified-audio
QuarkAudioは、音声、音楽、一般的なオーディオイベントの処理と生成を統一するオープンソースプロジェクトです。こ…
★ 397 ⑂ 27 Apache-2.0 2026-05-07
画像生成 GitHub FluxRT
FluxRTは、FLUX.2-klein-4Bモデルを搭載し、消費者向けGPUに最適化されたリアルタイムストリーム編集パイプラインで…
★ 397 ⑂ 56 Unlicense 2026-06-13
AIエージェント GitHub bux
Browser Use Box (bux)は、Claude Codeエージェントと実際のChromiumブラウザを組み合わせて、Playwrightスタイルの…
★ 395 ⑂ 48 MIT 2026-06-17
音声生成 / TTS GitHub personalized-podcast
このツールは、任意のコンテンツ(テキスト、ファイル、URL)を、ユーザーがスクリプト、プロンプト、ホストの役割、…
★ 393 ⑂ 47 2026-04-08
ASR / 音声認識 GitHub LiveTranslate
LiveTranslateは、Windows向けのリアルタイム音声翻訳ツールです。システムオーディオとマイク入力をキャプチャし、A…
★ 392 ⑂ 36 MIT 2026-06-20
ASR / 音声認識 GitHub freestyle
Freestyleは、音声を瞬時にテキストへ変換するディクテーションアプリです。ホットキーを押しながら話すだけで、カー…
★ 391 ⑂ 51 MIT 2026-06-23
3D / NeRF GitHub HDR-GS
HDR-GSは、Gaussian Splatting技術を用いて、HDR(ハイダイナミックレンジ)の新規視点合成を1000倍の速度で効率的に…
★ 390 ⑂ 14 MIT 2025-10-10
動画生成 GitHub awesome-seedance-2-guide
Seedance 2.0は、画像、動画、音声、テキストの4つのモダリティを同時に入力として受け付け、自然言語で詳細な効果を…
★ 389 ⑂ 46 NOASSERTION 2026-06-15
マルチモーダル GitHub Awesome-Multimodal-Modeling
このリポジトリは、マルチモーダルモデリングに関する包括的な調査と厳選されたリストです。伝統的なマルチモーダル…
★ 388 ⑂ 23 2026-06-23
AIエージェント GitHub beever-atlas
Beever Atlasは、チームのSlack、Discord、Microsoft Teams、Mattermostなどのチャット履歴を自動的に解析し、知識ベ…
★ 386 ⑂ 47 Apache-2.0 2026-06-22
AIエージェント GitHub alook
Alookは、ローカルのAIコーディングエージェントを協調的な作業部隊として機能させるオープンソースのセルフホスト型…
★ 385 ⑂ 56 Apache-2.0 2026-06-23
ComfyUI GitHub ComfyUI_FlashVSR
ComfyUI_FlashVSRは、リアルタイム拡散ベースのストリーミングビデオ超解像技術「FlashVSR」をComfyUI上で利用可能に…
★ 373 ⑂ 23 Apache-2.0 2026-02-23
LLM GitHub awesome-claude-api
このGitHubリポジトリは、Claude中転APIリソースを収集・整理し、開発者が安定した高コストパフォーマンスのClaude A…
★ 371 ⑂ 16 MIT 2026-06-09
LLM GitHub sqz
sqzは、LLM (大規模言語モデル) のコンテキストを圧縮することで、トークン消費量を削減し、コストを抑えるためのツ…
★ 367 ⑂ 25 NOASSERTION 2026-06-21
AIエージェント GitHub late-cli
Late CLIは、AI開発チームの作業を効率的にオーケストレーションするためのCLIツールです。エフェメラルなサブエージ…
★ 365 ⑂ 37 NOASSERTION 2026-06-25
AIエージェント GitHub token-tracker
Token Tracker (tt)は、ローカルAIエージェントであるClaude CodeとCodexのトークン使用量を詳細に追跡・分析するた…
★ 363 ⑂ 30 MIT 2026-06-28
ASR / 音声認識 GitHub BiliSum
BiliSumは、Bilibili、YouTube、ローカル動画を対象としたAI動画要約・知識ベースツールです。動画コンテンツを検索…
★ 360 ⑂ 30 MIT 2026-06-22
LLM GitHub TrueMemory
TrueMemoryは、AIエージェントのための高度な記憶システムです。セッションを越えてユーザーの事実、好み、決定など…
★ 360 ⑂ 46 AGPL-3.0 2026-06-24
LLM GitHub KeyType
KeyTypeは、macOSシステム全体で動作するオープンソースのAIオートコンプリートユーティリティです。ローカルLLM(大…
★ 359 ⑂ 15 MIT 2026-06-12
ComfyUI GitHub ComfyUI-Depthflow-Nodes
「ComfyUI-Depthflow-Nodes」は、2D画像を魅力的な2.5Dパララックスアニメーションに変換するためのComfyUI用ノード…
★ 359 ⑂ 22 AGPL-3.0 2026-02-15