ASR / 音声認識 GitHub meetily
Meetilyは、プライバシーを最優先したAI会議アシスタントです。Parakeet/Whisperによる高速なライブ文字起こし、話者…
★ 12.9k ⑂ 1.4k MIT 2026-06-05
3D / NeRF GitHub Meshroom
Meshroomは、複雑なデータ処理パイプラインを作成、管理、実行するためのオープンソースのノードベースのビジュアル…
★ 12.8k ⑂ 1.2k NOASSERTION 2026-06-27
LLM GitHub Auto-claude-code-research-in-sleep
ARIS (Auto-claude-code-research-in-sleep) は、機械学習研究の自律的な自動化を支援する軽量ツールです。フレーム…
★ 12.7k ⑂ 1.2k MIT 2026-06-28
LLM GitHub txtai
txtaiは、セマンティック検索、LLMオーケストレーション、言語モデルワークフローのためのオールインワンAIフレーム…
★ 12.7k ⑂ 835 Apache-2.0 2026-06-22
音声生成 / TTS GitHub supertonic
Supertonicは、ONNX Runtimeを介してデバイス上で動作する、超高速かつ高品質な多言語テキスト読み上げシステムです…
★ 12.7k ⑂ 1.3k MIT 2026-05-22
ASR / 音声認識 GitHub PaddleSpeech
PaddleSpeechは、PaddlePaddleプラットフォーム上で動作するオープンソースの音声処理ツールキットです。自己教師あ…
★ 12.6k ⑂ 2.0k Apache-2.0 2026-06-21
画像生成 GitHub awesome-nano-banana-pro-prompts
本リポジトリは、Googleの先進的な大規模言語モデル「Nano Banana Pro」向けに厳選されたクリエイティブなプロンプト…
★ 12.6k ⑂ 1.4k NOASSERTION 2026-06-23
LLM GitHub LEANN
LEANNは、個人用デバイスで高速、高精度、かつ完全にプライベートなRAG(検索拡張生成)アプリケーションを実現する…
★ 12.6k ⑂ 1.1k MIT 2026-06-26
LLM GitHub PocketFlow-Tutorial-Codebase-Knowledge
このプロジェクトは、AIエージェントがGitHubリポジトリを分析し、コードの仕組みを解説する初心者向けのチュートリ…
★ 12.4k ⑂ 1.4k MIT 2026-05-31
LLM GitHub turbovec
turbovecは、Google ResearchのTurboQuantアルゴリズムに基づきRustで開発された、Pythonバインディングを持つ高速か…
★ 12.4k ⑂ 1.1k MIT 2026-06-10
画像生成 GitHub HunyuanVideo
HunyuanVideoは、Tencentが開発した大規模動画生成モデルのための体系的なフレームワークです。テキストからの動画生…
★ 12.3k ⑂ 1.3k NOASSERTION 2026-06-29
ASR / 音声認識 GitHub speechbrain
SpeechBrainは、PyTorchを基盤としたオープンソースのツールキットで、会話型AI(音声アシスタント、チャットボット…
★ 11.6k ⑂ 1.7k Apache-2.0 2026-06-15
マルチモーダル GitHub rerun
Rerunは、マルチモーダルなロボットデータ(画像、点群、変換、時系列、関節状態、ビデオなど)のロギング、クエリ、…
★ 11.0k ⑂ 774 Apache-2.0 2026-06-24
動画生成 GitHub Toonflow-app
Toonflowは、小説や脚本をAIによってアニメーション短編ドラマに迅速に変換するオープンソースツールです。AIスクリ…
★ 10.8k ⑂ 2.0k Apache-2.0 2026-06-29
AIエージェント GitHub hive
Hiveは、プロダクションAI向けのマルチエージェントハーネスで、複雑なビジネスワークフローを効率的に実行するため…
★ 10.6k ⑂ 5.6k Apache-2.0 2026-05-29
動画生成 GitHub ViMax
ViMaxは、単一のコンセプト入力から脚本、絵コンテ、キャラクターデザイン、そして最終的な動画生成まで、動画制作プ…
★ 10.6k ⑂ 1.5k MIT 2026-06-13
画像生成 GitHub openvino
OpenVINO™は、ディープラーニングモデルの最適化とデプロイメントを目的としたオープンソースのソフトウェアツールキ…
★ 10.4k ⑂ 3.3k Apache-2.0 2026-06-23
音声生成 / TTS GitHub KrillinAI
KrillinAIは、AIを活用したビデオの翻訳・吹き替えを可能にする多機能ツールです。ビデオのダウンロード、音声認識、…
★ 10.4k ⑂ 973 GPL-3.0 2026-06-25
画像生成 GitHub runanywhere-sdks
RunAnywhereは、LLM(大規模言語モデル)、音声認識、音声合成、ボイスアシスタントといったAI機能をデバイス上で完…
★ 10.3k ⑂ 359 NOASSERTION 2026-06-27
画像生成 GitHub krita-ai-diffusion
Krita用AI画像生成プラグイン「Generative AI for Krita」は、画像ペイント・編集ワークフローにAIを統合します。本…
★ 10.2k ⑂ 597 GPL-3.0 2026-06-17
ASR / 音声認識 GitHub RTranslator
RTranslatorは、Androidデバイス向けに設計されたほぼオープンソースの無料リアルタイム翻訳アプリです。このアプリ…
★ 10.2k ⑂ 938 Apache-2.0 2026-06-18
LLM GitHub prompt-master
「Prompt Master」は、Claudeのスキルとして動作し、様々なAIツール向けに正確なプロンプトを生成します。トークンや…
★ 10.0k ⑂ 1.2k MIT 2026-06-10
ASR / 音声認識 GitHub RealtimeSTT
RealtimeSTTは、音声アクティビティ検出、高速な文字起こし、リアルタイムテキスト更新、ウェイクワード機能を備えた…
★ 9.9k ⑂ 843 MIT 2026-06-12
マルチモーダル GitHub pyod
PyOD 3は、表形式、時系列、グラフ、テキスト、画像といった多様なデータ形式に対応した、包括的なPython異常検知ラ…
★ 9.9k ⑂ 1.5k BSD-2-Clause 2026-06-17