LLM GitHub Scrapegraph-ai
ScrapeGraphAIは、LLMとグラフロジックを活用したPython製のウェブスクレイピングライブラリです。ウェブサイトやXML…
★ 27.8k ⑂ 2.6k MIT 2026-06-25
AIエージェント GitHub agenticSeek
AgenticSeekは、Manus AIの完全にローカルな代替となる音声対応AIアシスタントです。クラウド依存なしで、Webブラウ…
★ 26.6k ⑂ 3.0k GPL-3.0 2026-06-10
LLM GitHub haystack
Haystackは、コンテキストを考慮した実用的なLLM(大規模言語モデル)アプリケーションを構築するためのオープンソー…
★ 25.7k ⑂ 2.9k Apache-2.0 2026-06-24
画像生成 GitHub pytorch-CycleGAN-and-pix2pix
本ツールは、PyTorchフレームワーク上で動作する画像から画像への変換(Image-to-Image Translation)を実現するライ…
★ 25.2k ⑂ 6.6k NOASSERTION 2025-08-06
マルチモーダル GitHub LLaVA
LLaVAは、視覚指示チューニングを用いてGPT-4レベルの能力を持つ大規模言語およびビジョンアシスタントです。画像だ…
★ 24.9k ⑂ 2.8k Apache-2.0 2024-08-12
画像生成 GitHub OpenMontage
OpenMontageは、世界初となるオープンソースのエージェント型動画制作システムです。AIコーディングアシスタントを本…
★ 24.5k ⑂ 2.7k AGPL-3.0 2026-06-26
AIエージェント GitHub agentmemory
agentmemoryは、AIコーディングエージェントが過去の対話や作業内容を永続的に記憶し、同じ内容を繰り返し説明する必…
★ 24.2k ⑂ 2.0k Apache-2.0 2026-06-27
AIエージェント GitHub planning-with-files
「Planning with Files」は、長時間実行されるエージェントタスクのために永続的なファイルベースのプランニングを提…
★ 24.0k ⑂ 2.1k MIT 2026-06-16
ASR / 音声認識 GitHub faster-whisper
「SYSTRAN/faster-whisper」は、OpenAIのWhisperモデルをCTranslate2で再実装した高速音声転写ツールです。オリジナ…
★ 23.9k ⑂ 2.0k MIT 2025-11-19
ComfyUI GitHub Pixelle-Video
Pixelle-Videoは、入力されたテーマに基づいて、AIが短尺動画を全自動で生成するエンジンです。動画のスクリプト作成…
★ 23.7k ⑂ 3.4k Apache-2.0 2026-06-14
AIエージェント GitHub GenAI_Agents
このリポジトリは、NirDiamantによるGenerative AI (GenAI) エージェントに関するチュートリアルと実装の包括的なコ…
★ 22.9k ⑂ 3.8k NOASSERTION 2026-06-17
ASR / 音声認識 GitHub whisperX
WhisperXは、OpenAIのWhisperモデルを基盤とした、単語レベルの正確なタイムスタンプと話者分離(Diarization)機能…
★ 22.7k ⑂ 2.3k BSD-2-Clause 2026-06-26
マルチモーダル GitHub unilm
このGitHubリポジトリ「microsoft/unilm」は、Microsoftが提供する、タスク、言語、モダリティ(テキスト、画像、音…
★ 22.2k ⑂ 2.7k MIT 2026-01-23
音声生成 / TTS GitHub CosyVoice
FunAudioLLMが開発するCosyVoiceは、大規模言語モデル(LLM)を基盤とした多言語対応の音声生成モデルです。最新版の…
★ 21.9k ⑂ 2.5k Apache-2.0 2026-05-25
マルチモーダル GitHub serve
Jina-Serveは、gRPC、HTTP、WebSocketsを介して通信するAIサービスを構築・デプロイするためのフレームワークです。…
★ 21.9k ⑂ 2.2k Apache-2.0 2025-03-24
動画生成 GitHub Open-Generative-AI
Open Generative AIは、コンテンツフィルターや制限なくAI画像、ビデオ、リップシンクを生成できる無料のオープンソ…
★ 21.6k ⑂ 3.7k MIT 2026-06-28
LLM GitHub RAG-Anything
RAG-Anythingは、次世代のマルチモーダル対応オールインワンRAG(Retrieval-Augmented Generation)フレームワークで…
★ 21.6k ⑂ 2.5k MIT 2026-06-15
音声生成 / TTS GitHub index-tts
IndexTTS2は、感情豊かで再生時間の厳密な制御が可能な自己回帰型ゼロショットテキスト音声合成(TTS)モデルです。…
★ 21.4k ⑂ 2.6k NOASSERTION 2026-06-23
LLM GitHub QwenPaw
QwenPawは、個人のニーズに合わせてローカルまたはクラウドに容易に導入できるAIアシスタントです。ユーザーはデータ…
★ 20.2k ⑂ 2.7k Apache-2.0 2026-06-26
ASR / 音声認識 GitHub buzz
Buzzは、OpenAIのWhisperを搭載し、個人用コンピューター上で音声の文字起こしと翻訳をオフラインで実行できる高機能…
★ 19.9k ⑂ 1.5k MIT 2026-06-27
音声生成 / TTS GitHub dia
Diaは、Nari Labsが開発した1.6Bパラメータのテキスト読み上げ(TTS)モデルです。このツールは、スクリプトから直接…
★ 19.3k ⑂ 1.7k Apache-2.0 2025-11-19
LLM GitHub code-review-graph
code-review-graphは、AIコーディングツールがコードベース全体を毎回読み込むことで生じる非効率性と高コストを解決…
★ 19.0k ⑂ 2.0k MIT 2026-06-14
ASR / 音声認識 GitHub FunASR
FunASRは、エンドツーエンドの音声認識に特化した、研究者と開発者向けのツールキットです。音声認識(ASR)、音声活…
★ 18.7k ⑂ 1.9k MIT 2026-06-28
動画生成 GitHub LivePortrait
LivePortraitは、人物、猫、犬のポートレートを効率的にアニメーション化するAIツールです。本ツールは、Stitchingと…
★ 18.6k ⑂ 1.9k NOASSERTION 2026-06-01