AIエージェント GitHub planning-with-files
「Planning with Files」は、長時間実行されるエージェントタスクのために永続的なファイルベースのプランニングを提…
★ 24.0k ⑂ 2.1k MIT 2026-06-16
ASR / 音声認識 GitHub faster-whisper
「SYSTRAN/faster-whisper」は、OpenAIのWhisperモデルをCTranslate2で再実装した高速音声転写ツールです。オリジナ…
★ 23.9k ⑂ 2.0k MIT 2025-11-19
ComfyUI GitHub Pixelle-Video
Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…
★ 23.7k ⑂ 3.4k Apache-2.0 2026-06-14
AIエージェント GitHub nocobase
NocoBaseは、オープンソースのAIとノーコードを組み合わせたプラットフォームで、ビジネスシステムの高速構築を可能…
★ 23.1k ⑂ 2.7k NOASSERTION 2026-06-25
AIエージェント GitHub activepieces
Activepiecesは、Zapierのオープンソース代替となるAI自動化プラットフォームです。TypeScriptで構築された型安全な…
★ 23.0k ⑂ 3.9k NOASSERTION 2026-06-26
LLM GitHub Anthropic-Cybersecurity-Skills
「Anthropic Cybersecurity Skills」は、AIエージェントにサイバーセキュリティの専門知識を提供する、オープンソー…
★ 22.9k ⑂ 2.6k Apache-2.0 2026-06-26
AIエージェント GitHub GenAI_Agents
このリポジトリは、NirDiamantによるGenerative AI (GenAI) エージェントに関するチュートリアルと実装の包括的なコ…
★ 22.9k ⑂ 3.8k NOASSERTION 2026-06-17
ASR / 音声認識 GitHub whisperX
WhisperXは、OpenAIのWhisperモデルを基盤とした、単語レベルの正確なタイムスタンプと話者分離(Diarization)機能…
★ 22.7k ⑂ 2.3k BSD-2-Clause 2026-06-26
マルチモーダル GitHub unilm
このGitHubリポジトリ「microsoft/unilm」は、Microsoftが提供する、タスク、言語、モダリティ(テキスト、画像、音…
★ 22.2k ⑂ 2.7k MIT 2026-01-23
音声生成 / TTS GitHub CosyVoice
FunAudioLLMが開発するCosyVoiceは、大規模言語モデル(LLM)を基盤とした多言語対応の音声生成モデルです。最新版の…
★ 21.9k ⑂ 2.5k Apache-2.0 2026-05-25
マルチモーダル GitHub serve
Jina-Serveは、gRPC、HTTP、WebSocketsを介して通信するAIサービスを構築・デプロイするためのフレームワークです。…
★ 21.9k ⑂ 2.2k Apache-2.0 2025-03-24
音声生成 / TTS GitHub readest
Readestは、熱心な読書家のために設計された、没入感のある深い読書体験を提供するオープンソースの電子書籍リーダー…
★ 21.7k ⑂ 1.3k AGPL-3.0 2026-06-23
動画生成 GitHub Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 21.6k ⑂ 3.7k MIT 2026-06-28
LLM GitHub RAG-Anything
RAG-Anythingは、次世代のマルチモーダル対応オールインワンRAG(Retrieval-Augmented Generation)フレームワークで…
★ 21.6k ⑂ 2.5k MIT 2026-06-15
音声生成 / TTS GitHub index-tts
IndexTTS2は、感情豊かで再生時間の厳密な制御が可能な自己回帰型ゼロショットテキスト音声合成(TTS)モデルです。…
★ 21.4k ⑂ 2.6k NOASSERTION 2026-06-23
LLM GitHub QwenPaw
QwenPawは、個人のニーズに合わせてローカルまたはクラウドに容易に導入できるAIアシスタントです。ユーザーはデータ…
★ 20.2k ⑂ 2.7k Apache-2.0 2026-06-26
ASR / 音声認識 GitHub buzz
Buzzは、OpenAIのWhisperを搭載し、個人用コンピューター上で音声の文字起こしと翻訳をオフラインで実行できる高機能…
★ 19.9k ⑂ 1.5k MIT 2026-06-27
ASR / 音声認識 GitHub screenpipe
Screenpipeは、AIにユーザーのデジタル体験を学習させるためのオープンソースツールです。PC上でのあらゆる活動(画…
★ 19.5k ⑂ 1.9k NOASSERTION 2026-06-29
音声生成 / TTS GitHub ebook2audiobook
「ebook2audiobook (E2A)」は、電子書籍(非DRM)を高品質なオーディオブックに変換するツールです。高度なTTSエンジ…
★ 19.3k ⑂ 1.6k Apache-2.0 2026-06-26
音声生成 / TTS GitHub dia
Diaは、Nari Labsが開発した1.6Bパラメータのテキスト読み上げ(TTS)モデルです。このツールは、スクリプトから直接…
★ 19.3k ⑂ 1.7k Apache-2.0 2025-11-19
画像生成 GitHub guizang-ppt-skill
「Guizang PPT Skill」は、Claude CodeやCodexなどのAIエージェント向けに設計されたスキルです。洗練されたHTML形式…
★ 19.2k ⑂ 1.4k AGPL-3.0 2026-06-02
LLM GitHub code-review-graph
code-review-graphは、AIコーディングツールがコードベース全体を毎回読み込むことで生じる非効率性と高コストを解決…
★ 19.0k ⑂ 2.0k MIT 2026-06-14
音声生成 / TTS GitHub pot-desktop
Potは、Windows、macOS、Linuxに対応したクロスプラットフォームのテキスト翻訳およびOCRソフトウェアです。主要機能…
★ 18.9k ⑂ 922 GPL-3.0 2026-06-16
ASR / 音声認識 GitHub FunASR
FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。音声認識(ASR)、音声活…
★ 18.7k ⑂ 1.9k MIT 2026-06-28