LLM GitHub turbovec
turbovecは、Google ResearchのTurboQuantアルゴリズムに基づきRustで開発された、Pythonバインディングを持つ高速か…
★ 12.4k ⑂ 1.1k MIT 2026-06-10
画像生成 GitHub HunyuanVideo
HunyuanVideoは、Tencentが開発した大規模動画生成モデルのための体系的なフレームワークです。テキストからの動画生…
★ 12.3k ⑂ 1.3k NOASSERTION 2026-06-29
ASR / 音声認識 GitHub speechbrain
SpeechBrainは、PyTorchを基盤としたオープンソースのツールキットで、会話型AI(音声アシスタント、チャットボット…
★ 11.6k ⑂ 1.7k Apache-2.0 2026-06-15
マルチモーダル GitHub rerun
Rerunは、マルチモーダルなロボットデータ(画像、点群、変換、時系列、関節状態、ビデオなど)のロギング、クエリ、…
★ 11.0k ⑂ 774 Apache-2.0 2026-06-24
AIエージェント GitHub hive
Hiveは、プロダクションAI向けのマルチエージェントハーネスで、複雑なビジネスワークフローを効率的に実行するため…
★ 10.6k ⑂ 5.6k Apache-2.0 2026-05-29
動画生成 GitHub ViMax
ViMaxは、単一のコンセプト入力から脚本、絵コンテ、キャラクターデザイン、そして最終的な動画生成まで、動画制作プ…
★ 10.6k ⑂ 1.5k MIT 2026-06-13
画像生成 GitHub openvino
OpenVINO™は、ディープラーニングモデルの最適化とデプロイメントを目的としたオープンソースのソフトウェアツールキ…
★ 10.4k ⑂ 3.3k Apache-2.0 2026-06-23
音声生成 / TTS GitHub KrillinAI
KrillinAIは、AIを活用したビデオの翻訳・吹き替えを可能にする多機能ツールです。ビデオのダウンロード、音声認識、…
★ 10.4k ⑂ 973 GPL-3.0 2026-06-25
ASR / 音声認識 GitHub RealtimeSTT
RealtimeSTTは、音声アクティビティ検出、高速な文字起こし、リアルタイムテキスト更新、ウェイクワード機能を備えた…
★ 9.9k ⑂ 843 MIT 2026-06-12
マルチモーダル GitHub pyod
PyOD 3は、表形式、時系列、グラフ、テキスト、画像といった多様なデータ形式に対応した、包括的なPython異常検知ラ…
★ 9.9k ⑂ 1.5k BSD-2-Clause 2026-06-17
ASR / 音声認識 GitHub espnet
ESPnetは、音声認識、音声合成、音声翻訳など、様々なエンドツーエンドの音声処理タスクに対応する包括的なツールキ…
★ 9.9k ⑂ 2.4k Apache-2.0 2026-06-24
マルチモーダル GitHub X-AnyLabeling
X-AnyLabelingは、Segment Anythingなどの強力なAIモデルを活用し、データラベリングを効率化するツールです。自動ラ…
★ 9.6k ⑂ 1.0k GPL-3.0 2026-06-28
ASR / 音声認識 GitHub inference
Xorbits Inference (Xinference) は、言語、音声認識、マルチモーダルモデルの提供を容易にする強力で多機能なライブ…
★ 9.4k ⑂ 837 Apache-2.0 2026-06-24
マルチモーダル GitHub deeplake
Deep LakeはAIワークロードに特化したデータベースで、深層学習アプリケーション向けのストレージ形式を採用していま…
★ 9.2k ⑂ 717 Apache-2.0 2026-05-21
ASR / 音声認識 GitHub speech_recognition
このPythonライブラリ「SpeechRecognition」は、多様なオンラインおよびオフラインの音声認識エンジンとAPIに対応し…
★ 9.0k ⑂ 2.4k BSD-3-Clause 2026-06-16
マルチモーダル GitHub all-in-rag
このプロジェクト「All-in-RAG」は、大規模言語モデル(LLM)アプリケーション開発者向けのRAG(検索拡張生成)技術…
★ 9.0k ⑂ 4.5k 2026-06-05
マルチモーダル GitHub MobileAgent
Mobile-Agentは、Alibaba GroupのTongyi Labが開発した強力なGUIエージェントファミリーです。デスクトップ、モバイ…
★ 8.9k ⑂ 891 MIT 2026-05-14
LLM GitHub garden-skills
Garden Skillsは、Claude Code、Cursor、CodexなどのAIコーディングエージェント向けに、Webデザイン、知識検索、画…
★ 8.8k ⑂ 1.2k MIT 2026-06-10
音声生成 / TTS GitHub Bert-VITS2
Bert-VITS2は、多言語BERTをVITS2バックボーンに統合したテキスト読み上げ(TTS)システムです。このツールは、高度…
★ 8.8k ⑂ 1.3k AGPL-3.0 2026-06-22
3D / NeRF GitHub awesome-3D-gaussian-splatting
「Awesome 3D Gaussian Splatting」は、3D Gaussian Splatting(3DGS)および関連技術に特化した厳選されたリソース…
★ 8.7k ⑂ 538 MIT 2026-06-26
マルチモーダル GitHub BentoML
BentoMLは、AIアプリケーションとモデル推論のために最適化されたオンラインサービングシステムを構築するためのPyth…
★ 8.7k ⑂ 978 Apache-2.0 2026-06-22
ASR / 音声認識 GitHub SenseVoice
SenseVoiceは、自動音声認識(ASR)、話者言語識別、音声感情認識、音声イベント検出、そして最新のアップデートでは…
★ 8.7k ⑂ 787 NOASSERTION 2026-06-22
音声生成 / TTS GitHub moonshine
Moonshine Voiceは、開発者向けのオープンソースAIツールキットで、リアルタイムの音声エージェントやアプリケーショ…
★ 8.6k ⑂ 464 NOASSERTION 2026-06-26
動画生成 GitHub Sana
SANAは、NVIDIAが開発した高解像度画像および動画生成のための効率的なコードベースです。線形拡散トランスフォーマ…
★ 8.4k ⑂ 671 Apache-2.0 2026-06-25