ASR / 音声認識 GitHub argmax-oss-swift
Argmax Open-Source SDK Swiftは、Apple Siliconデバイス上で動作する高性能なオープンソースAI推論フレームワーク群…
★ 6.2k ⑂ 577 MIT 2026-06-25
ASR / 音声認識 GitHub PaddleX
PaddleX 3.0は、飛桨(PaddlePaddle)フレームワークを基盤とした低コード開発ツールです。200以上の開箱即用な事前…
★ 6.2k ⑂ 1.2k Apache-2.0 2026-06-25
画像生成 GitHub Awesome-Prompt-Engineering
このリポジトリは、プロンプトエンジニアリングとコンテキストエンジニアリングに関する厳選されたリソース集です。…
★ 6.1k ⑂ 717 Apache-2.0 2026-07-01
LLM GitHub atomic-agents
Atomic Agentsは、AIパイプラインとアプリケーションを構築するための軽量でモジュール式のフレームワークです。LEGO…
★ 6.0k ⑂ 514 MIT 2026-06-20
ASR / 音声認識 GitHub silero-models
Silero Modelsは、事前学習済みのテキスト読み上げ(TTS)モデルを開発者向けに提供するライブラリです。このツール…
★ 6.0k ⑂ 366 NOASSERTION 2026-06-04
LLM GitHub enchanted
Enchantedは、Ollama互換のオープンソースアプリで、Llama2やMistralなどのプライベートな自己ホスト型言語モデルと…
★ 6.0k ⑂ 422 Apache-2.0 2026-06-15
LLM GitHub apfel
apfelは、Macに標準搭載されているApple FoundationModelsを活用し、完全にオフラインで動作するAIツールです。CLI、…
★ 5.9k ⑂ 225 MIT 2026-06-26
ASR / 音声認識 GitHub FunClip
FunClipは、オープンソースで高精度かつ使いやすい動画クリッピングツールです。Alibaba TONGYIのFunASR Paraformer…
★ 5.9k ⑂ 705 MIT 2026-06-25
マルチモーダル GitHub PixelRAG
PixelRAGは、ウェブページ、PDF、画像をスクリーンショットとして視覚的にレンダリングし、ビジョン言語モデルで埋め…
★ 5.8k ⑂ 456 Apache-2.0 2026-06-30
3D / NeRF GitHub meshlab
MeshLabは、3Dスキャンで得られる大規模で非構造化な3D三角メッシュの処理と編集に特化したオープンソースシステムで…
★ 5.7k ⑂ 904 GPL-3.0 2026-06-08
動画生成 GitHub Awesome-Video-Diffusion
「Awesome Video Diffusion」は、動画生成、編集、復元、理解、NeRFなど、動画関連の多岐にわたるタスクに対応する最…
★ 5.7k ⑂ 365 2026-06-16
AIエージェント GitHub holaOS
holaOSは、繰り返し発生するコンテキストが複雑な作業をAIワークストリームに変換するツールです。週次調査、コンテ…
★ 5.5k ⑂ 391 NOASSERTION 2026-06-22
LLM GitHub whichllm
「whichllm」は、ユーザーのコンピューターハードウェア(GPU/CPU/RAM)を自動検出し、その環境で最も性能を発揮する…
★ 5.5k ⑂ 293 MIT 2026-06-29
AIエージェント GitHub semble
Sembleは、AIエージェント向けに設計された高速かつ正確なコード検索ライブラリです。`grep+read`と比較して約98%も…
★ 5.4k ⑂ 232 MIT 2026-06-24
マルチモーダル GitHub MineContext
MineContextは、スクリーンショットやコンテンツ理解を活用し、将来的に多種多様なマルチモーダル情報を統合する、能…
★ 5.4k ⑂ 404 Apache-2.0 2026-05-07
LLM GitHub awesome-free-llm-apis
このリポジトリは、永続的な無料利用枠を提供する大規模言語モデル(LLM)APIの厳選されたリストを提供します。コス…
★ 5.4k ⑂ 511 CC0-1.0 2026-06-16
画像生成 GitHub RedInk
RedInkは、Xiaohongshu(小紅書)向けの画像とテキストを生成する統合ツールです。「一文、一画像」のコンセプトで、…
★ 5.4k ⑂ 1.0k NOASSERTION 2026-06-30
ASR / 音声認識 GitHub cactus
Cactusは、モバイルデバイスやウェアラブル向けに設計された低遅延AIエンジンです。ARM CPU上での高速かつ高精度な推…
★ 5.4k ⑂ 432 NOASSERTION 2026-06-26
マルチモーダル GitHub vllm-omni
vLLM-Omniは、既存のvLLMを拡張し、オムニモダリティモデルの効率的かつ低コストな推論と提供を可能にするフレームワ…
★ 5.3k ⑂ 1.2k Apache-2.0 2026-06-29
3D / NeRF GitHub gsplat
gsplatは、3D Gaussian Splatting技術のCUDA高速化ラスタライゼーションを実現するオープンソースライブラリで、Pyth…
★ 5.3k ⑂ 891 Apache-2.0 2026-06-30
ComfyUI GitHub ComfyUI-Copilot
ComfyUI-Copilotは、ComfyUI上で動作するAI搭載のインテリジェントアシスタントです。ワークフローの構築、デバッグ…
★ 5.3k ⑂ 344 MIT 2026-04-07
ASR / 音声認識 GitHub wenet
WeNetは、「Production First and Production Ready」を掲げるエンドツーエンド音声認識ツールキットです。最先端の…
★ 5.2k ⑂ 1.2k Apache-2.0 2026-06-15
3D / NeRF GitHub kaolin
NVIDIA Kaolinは、3D深層学習研究を加速するために設計されたPyTorchライブラリです。GPUに最適化された操作群を提供…
★ 5.1k ⑂ 625 Apache-2.0 2026-07-01
マルチモーダル GitHub mlx-vlm
MLX-VLMは、Apple Silicon Mac上でMLXを利用してVision Language Models(VLM)および音声・動画対応のOmni Modelsの…
★ 5.1k ⑂ 654 MIT 2026-07-02