ASR / 音声認識 GitHub LiveTranslate
LiveTranslateは、Windows向けのリアルタイム音声翻訳ツールです。システムオーディオとマイク入力をキャプチャし、A…
★ 392 ⑂ 36 MIT 2026-06-20
ASR / 音声認識 GitHub freestyle
Freestyleは、音声を瞬時にテキストへ変換するディクテーションアプリです。ホットキーを押しながら話すだけで、カー…
★ 391 ⑂ 51 MIT 2026-06-23
動画生成 GitHub awesome-seedance-2-guide
Seedance 2.0は、画像、動画、音声、テキストの4つのモダリティを同時に入力として受け付け、自然言語で詳細な効果を…
★ 389 ⑂ 46 NOASSERTION 2026-06-15
マルチモーダル GitHub Awesome-Multimodal-Modeling
このリポジトリは、マルチモーダルモデリングに関する包括的な調査と厳選されたリストです。伝統的なマルチモーダル…
★ 388 ⑂ 23 2026-06-23
AIエージェント GitHub beever-atlas
Beever Atlasは、チームのSlack、Discord、Microsoft Teams、Mattermostなどのチャット履歴を自動的に解析し、知識ベ…
★ 386 ⑂ 47 Apache-2.0 2026-06-22
AIエージェント GitHub alook
Alookは、ローカルのAIコーディングエージェントを協調的な作業部隊として機能させるオープンソースのセルフホスト型…
★ 385 ⑂ 56 Apache-2.0 2026-06-23
LLM GitHub awesome-claude-api
このGitHubリポジトリは、Claude中転APIリソースを収集・整理し、開発者が安定した高コストパフォーマンスのClaude A…
★ 371 ⑂ 16 MIT 2026-06-09
マルチモーダル HF YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 370 ↓ 9.3k agpl-3.0 2026-06-26
LLM GitHub sqz
sqzは、LLM (大規模言語モデル) のコンテキストを圧縮することで、トークン消費量を削減し、コストを抑えるためのツ…
★ 367 ⑂ 25 NOASSERTION 2026-06-21
AIエージェント GitHub late-cli
Late CLIは、AI開発チームの作業を効率的にオーケストレーションするためのCLIツールです。エフェメラルなサブエージ…
★ 365 ⑂ 37 NOASSERTION 2026-06-25
AIエージェント GitHub token-tracker
Token Tracker (tt)は、ローカルAIエージェントであるClaude CodeとCodexのトークン使用量を詳細に追跡・分析するた…
★ 363 ⑂ 30 MIT 2026-06-28
LLM GitHub TrueMemory
TrueMemoryは、AIエージェントのための高度な記憶システムです。セッションを越えてユーザーの事実、好み、決定など…
★ 360 ⑂ 46 AGPL-3.0 2026-06-24
ASR / 音声認識 GitHub BiliSum
BiliSumは、Bilibili、YouTube、ローカル動画を対象としたAI動画要約・知識ベースツールです。動画コンテンツを検索…
★ 360 ⑂ 30 MIT 2026-06-22
LLM GitHub KeyType
KeyTypeは、macOSシステム全体で動作するオープンソースのAIオートコンプリートユーティリティです。ローカルLLM(大…
★ 359 ⑂ 15 MIT 2026-06-12
LLM GitHub tessera
Tesseraは、大規模なLLM(教師モデル)を小型のLLM(生徒モデル)に蒸留し、その生徒モデルを効率的に提供することを…
★ 359 ⑂ 4 NOASSERTION 2026-06-05
ASR / 音声認識 GitHub CrispASR
CrispASRは、whisper.cppを基盤とし、主要なASR(自動音声認識)およびTTS(テキスト読み上げ)モデルのためのC++ gg…
★ 356 ⑂ 55 MIT 2026-06-28
音楽生成 GitHub awesome-ai-voice
このリポジトリは、オープンソースのText-to-Speech(TTS)、音声クローン、音楽生成モデルを厳選してまとめたリスト…
★ 356 ⑂ 51 MIT 2026-04-17
マルチモーダル HF Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF
このREADMEは、Qwen 3.6 27Bをベースに検閲緩和と追加ファインチューニングを施し、さらにGGUF量子化版を多数用意し…
❤ 352 ↓ 418.0k apache-2.0 2026-06-11
3D / NeRF GitHub sam-body4d
SAM-Body4Dは、動画からトレーニング不要で一時的に一貫性のある堅牢な4D人体メッシュを復元するツールです。SAM-3、…
★ 351 ⑂ 33 MIT 2026-05-11
AIエージェント GitHub cube-pets-office
Cube Pets Officeは、たった一文のアイデアから製品の全ライフサイクルを管理するAI Agent OSです。可視化されたワー…
★ 347 ⑂ 57 MIT 2026-06-22
AIエージェント GitHub scholar-loop
Scholar Loopは、論文読解、仮説構築、実際の機械学習実験の実行、反省、論文執筆・自己レビューまでを一貫して自律…
★ 346 ⑂ 23 MIT 2026-06-23
AIエージェント GitHub loushang
Loushangは、AIネイティブなコーディングオーケストレーションプラットフォームで、意図から検証済みデリバリーまで…
★ 343 ⑂ 72 Apache-2.0 2026-06-24
画像生成 GitHub webchat2api
webchat2apiは、GPT/ChatGPT Web、Grok/xAI Web、Gemini Webの機能を標準API(OpenAI互換APIおよびGeminiネイティブA…
★ 342 ⑂ 71 MIT 2026-06-07
音声生成 / TTS GitHub video-recap
「video-recap」は、入力された動画に対して自動で中国語のナレーション付き解説動画を生成するスキルです。動画の内…
★ 340 ⑂ 57 MIT 2026-06-27