ASR / 音声認識 GitHub leon
Leonは、ツール、コンテキスト、メモリ、エージェント実行を中心に構築されたオープンソースの個人AIアシスタントで…
★ 17.3k ⑂ 1.5k MIT 2026-06-29
AIエージェント GitHub edict
Edictは、中国の古代帝国の統治機構「三省六部制」にインスパイアされた、AIマルチエージェントオーケストレーション…
★ 16.1k ⑂ 1.7k MIT 2026-06-22
LLM GitHub browser-harness
Browser Harnessは、大規模言語モデル(LLM)をChrome DevTools Protocolを介して実際のブラウザに直接接続し、ウェ…
★ 15.4k ⑂ 1.4k MIT 2026-06-21
ASR / 音声認識 GitHub vosk-api
Voskは、20以上の言語と方言(日本語含む)に対応したオフライン・オープンソースの音声認識ツールキットです。50MB…
★ 14.9k ⑂ 1.7k Apache-2.0 2026-06-04
マルチモーダル GitHub ms-swift
ms-swiftは、ModelScopeコミュニティが提供する、大規模言語モデル(LLM)およびマルチモーダル大規模言語モデル(ML…
★ 14.6k ⑂ 1.5k Apache-2.0 2026-06-24
AIエージェント GitHub Vibe-Trading
Vibe-Tradingは、個人トレーダー向けのAI取引エージェントで、ワンコマンドで包括的な取引機能を提供します。永続メ…
★ 14.0k ⑂ 2.6k MIT 2026-06-28
動画生成 GitHub Duix-Avatar
Duix.Avatarは、Duix.comによって開発された、完全にオープンソースのAIアバターツールキットです。本ツールは、ユー…
★ 13.8k ⑂ 2.3k NOASSERTION 2026-04-21
AIエージェント GitHub react-doctor
React Doctorは、Reactコードの品質を分析し、0から100のヘルススコアと具体的な診断結果を提供するツールです。この…
★ 13.2k ⑂ 421 NOASSERTION 2026-06-28
LLM GitHub Auto-claude-code-research-in-sleep
ARIS (Auto-claude-code-research-in-sleep) は、機械学習研究の自律的な自動化を支援する軽量ツールです。フレーム…
★ 12.7k ⑂ 1.2k MIT 2026-06-28
ASR / 音声認識 GitHub PaddleSpeech
PaddleSpeechは、PaddlePaddleプラットフォーム上で動作するオープンソースの音声処理ツールキットです。自己教師あ…
★ 12.6k ⑂ 2.0k Apache-2.0 2026-06-21
LLM GitHub turbovec
turbovecは、Google ResearchのTurboQuantアルゴリズムに基づきRustで開発された、Pythonバインディングを持つ高速か…
★ 12.4k ⑂ 1.1k MIT 2026-06-10
ASR / 音声認識 GitHub speechbrain
SpeechBrainは、PyTorchを基盤としたオープンソースのツールキットで、会話型AI(音声アシスタント、チャットボット…
★ 11.6k ⑂ 1.7k Apache-2.0 2026-06-15
マルチモーダル GitHub rerun
Rerunは、マルチモーダルなロボットデータ(画像、点群、変換、時系列、関節状態、ビデオなど)のロギング、クエリ、…
★ 11.0k ⑂ 774 Apache-2.0 2026-06-24
動画生成 GitHub ViMax
ViMaxは、単一のコンセプト入力から脚本、絵コンテ、キャラクターデザイン、そして最終的な動画生成まで、動画制作プ…
★ 10.6k ⑂ 1.5k MIT 2026-06-13
画像生成 GitHub openvino
OpenVINO™は、ディープラーニングモデルの最適化とデプロイメントを目的としたオープンソースのソフトウェアツールキ…
★ 10.4k ⑂ 3.3k Apache-2.0 2026-06-23
音声生成 / TTS GitHub KrillinAI
KrillinAIは、AIを活用したビデオの翻訳・吹き替えを可能にする多機能ツールです。ビデオのダウンロード、音声認識、…
★ 10.4k ⑂ 973 GPL-3.0 2026-06-25
ASR / 音声認識 GitHub RealtimeSTT
RealtimeSTTは、音声アクティビティ検出、高速な文字起こし、リアルタイムテキスト更新、ウェイクワード機能を備えた…
★ 9.9k ⑂ 843 MIT 2026-06-12
マルチモーダル GitHub pyod
PyOD 3は、表形式、時系列、グラフ、テキスト、画像といった多様なデータ形式に対応した、包括的なPython異常検知ラ…
★ 9.9k ⑂ 1.5k BSD-2-Clause 2026-06-17
LLM GitHub learn-harness-engineering
AIコーディングエージェントが確実に動作するためのHarness Engineeringに特化したプロジェクトベースの学習コースで…
★ 9.1k ⑂ 964 MIT 2026-06-16
ASR / 音声認識 GitHub speech_recognition
このPythonライブラリ「SpeechRecognition」は、多様なオンラインおよびオフラインの音声認識エンジンとAPIに対応し…
★ 9.0k ⑂ 2.4k BSD-3-Clause 2026-06-16
LLM GitHub garden-skills
Garden Skillsは、Claude Code、Cursor、CodexなどのAIコーディングエージェント向けに、Webデザイン、知識検索、画…
★ 8.8k ⑂ 1.2k MIT 2026-06-10
マルチモーダル GitHub BentoML
BentoMLは、AIアプリケーションとモデル推論のために最適化されたオンラインサービングシステムを構築するためのPyth…
★ 8.7k ⑂ 978 Apache-2.0 2026-06-22
ASR / 音声認識 GitHub SenseVoice
SenseVoiceは、自動音声認識(ASR)、話者言語識別、音声感情認識、音声イベント検出、そして最新のアップデートでは…
★ 8.7k ⑂ 787 NOASSERTION 2026-06-22
LLM GitHub hermes-web-ui
「Hermes Web UI」は、AIエージェントである「Hermes Agent」のための高機能なウェブダッシュボードです。このツール…
★ 8.6k ⑂ 1.1k NOASSERTION 2026-06-27