動画生成 GitHub LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.6k ⑂ 1.9k NOASSERTION 2026-06-01
ASR / 音声認識 GitHub pyvideotrans
pyVideoTransは、動画を多言語に翻訳し、吹き替えと字幕を埋め込むための強力なオープンソースツールです。音声認識…
★ 18.1k ⑂ 2.2k GPL-3.0 2026-06-23
LLM GitHub openfang
OpenFangは、Rustで構築されたオープンソースのエージェントオペレーティングシステムです。チャットボットフレーム…
★ 17.9k ⑂ 2.3k Apache-2.0 2026-06-25
AIエージェント GitHub pentagi
PentAGIは、AI技術を活用して複雑なペネトレーションテストタスクを完全に自律的に実行できる革新的なシステムです。…
★ 17.9k ⑂ 2.4k MIT 2026-06-20
マルチモーダル GitHub Janus
Janus-Seriesは、DeepSeek AIによって開発された、統合されたマルチモーダル理解および生成モデルです。Janus-Proは…
★ 17.8k ⑂ 2.2k MIT 2025-02-01
AIエージェント GitHub SuperAGI
SuperAGIは、実用的な自律型AIエージェントを構築、管理、実行するためのオープンソースフレームワークです。このツ…
★ 17.6k ⑂ 2.2k MIT 2025-01-22
音声生成 / TTS GitHub VideoLingo
VideoLingoは、YouTube動画のダウンロードから翻訳、ローカライズ、吹き替えまでをオールインワンで行うツールです。…
★ 17.6k ⑂ 1.9k Apache-2.0 2026-06-13
音声生成 / TTS GitHub NeMo
NVIDIA NeMo Speechは、大規模言語モデル、マルチモーダル、音声AI(自動音声認識、Text-to-Speech)向けにNVIDIAが…
★ 17.5k ⑂ 3.5k Apache-2.0 2026-06-24
3D / NeRF GitHub instant-ngp
「NVlabs/instant-ngp」は、ニューラル放射輝度フィールド(NeRF)や符号付き距離関数(SDF)などを雷のように高速に…
★ 17.5k ⑂ 2.1k NOASSERTION 2026-02-02
ASR / 音声認識 GitHub leon
Leonは、ツール、コンテキスト、メモリ、エージェント実行を中心に構築されたオープンソースの個人AIアシスタントで…
★ 17.3k ⑂ 1.5k MIT 2026-06-29
動画生成 GitHub Wan2.2
Wan2.2は、オープンで先進的な大規模ビデオ生成モデルWanの主要なアップグレード版です。専門家混合(MoE)アーキテ…
★ 16.4k ⑂ 2.0k Apache-2.0 2026-03-17
3D / NeRF GitHub engine
PlayCanvas Engineは、WebGL2とWebGPUをベースにしたオープンソースのゲームエンジンです。Webブラウザ上で動作する…
★ 16.1k ⑂ 1.9k MIT 2026-06-27
AIエージェント GitHub edict
Edictは、中国の古代帝国の統治機構「三省六部制」にインスパイアされた、AIマルチエージェントオーケストレーション…
★ 16.1k ⑂ 1.7k MIT 2026-06-22
画像生成 GitHub stable-diffusion-webui-colab
このリポジトリは、Stable Diffusion WebUIをGoogle Colabで利用するためのもので、DreamBoothやLoRAトレーナーの機…
★ 15.9k ⑂ 2.6k Unlicense 2025-12-16
LLM GitHub agency-agents-zh
本リポジトリは、エンジニアリング、デザイン、マーケティング、金融など18部門をカバーする215種類のAI専門家エージ…
★ 15.8k ⑂ 2.7k MIT 2026-06-20
LLM GitHub memvid
Memvidは、AIエージェントのためのサーバーレスかつシングルファイルのメモリレイヤーです。複雑なRAGパイプラインや…
★ 15.7k ⑂ 1.4k Apache-2.0 2026-05-27
LLM GitHub browser-harness
Browser Harnessは、大規模言語モデル(LLM)をChrome DevTools Protocolを介して実際のブラウザに直接接続し、ウェ…
★ 15.4k ⑂ 1.4k MIT 2026-06-21
ASR / 音声認識 GitHub kaldi
Kaldiは、音声認識技術の開発と研究のための包括的なオープンソースツールキットです。UNIX系OS、Windows、Linuxとい…
★ 15.4k ⑂ 5.4k NOASSERTION 2025-09-22
ASR / 音声認識 GitHub vosk-api
Voskは、20以上の言語と方言(日本語含む)に対応したオフライン・オープンソースの音声認識ツールキットです。50MB…
★ 14.9k ⑂ 1.7k Apache-2.0 2026-06-04
LLM GitHub llmware
llmwareは、エンタープライズ向けのRAG(検索拡張生成)パイプライン構築に特化した統合フレームワークです。小規模…
★ 14.8k ⑂ 2.9k Apache-2.0 2026-05-17
ASR / 音声認識 GitHub DeepLearningExamples
NVIDIA Deep Learning Examplesは、NVIDIA Volta、Turing、Ampere GPU上でNVIDIA CUDA-Xソフトウェアスタックを用い…
★ 14.8k ⑂ 3.4k 2024-08-12
マルチモーダル GitHub ms-swift
ms-swiftは、ModelScopeコミュニティが提供する、大規模言語モデル(LLM)およびマルチモーダル大規模言語モデル(ML…
★ 14.6k ⑂ 1.5k Apache-2.0 2026-06-24
画像生成 GitHub Hunyuan3D-2
Tencent-Hunyuan/Hunyuan3D-2は、大規模Hunyuan3D拡散モデルを活用した高解像度3Dアセット生成システムです。Hunyuan…
★ 14.1k ⑂ 1.4k NOASSERTION 2025-10-28
AIエージェント GitHub Vibe-Trading
Vibe-Tradingは、個人トレーダー向けのAI取引エージェントで、ワンコマンドで包括的な取引機能を提供します。永続メ…
★ 14.0k ⑂ 2.6k MIT 2026-06-28