3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ComfyUI GitHub video-to-prompt
「Video-to-Prompt WebUI」は、動画からAI画像生成プロンプトを抽出するためのGradioベースのウェブアプリケーション…
★ 9 ⑂ 1 NOASSERTION 2026-05-26
LLM GitHub rag-forge
「rag-forge」は、Retrieval-Augmented Generation(RAG)タスクに特化してLLM(大規模言語モデル)を効率的にファイ…
★ 9 ⑂ 1 NOASSERTION 2026-05-01
マルチモーダル GitHub SynCLIP
SynCLIPは、セマンティクス的に同等な表現でも空間的注意が異なるという、オープンボキャブラリー高密度知覚(OVDP)…
★ 9 ⑂ 1 Apache-2.0 2026-06-04
LLM GitHub tokdrift
TokDriftは、LLMがサブワードでコードを生成する一方、実際のコードは文法を持つというギャップを研究するためのフレ…
★ 9 ⑂ 1 2026-04-20
マルチモーダル GitHub mlx-serve
mlx-serveは、Apple Silicon搭載Mac (M1+以降) 向けのローカル推論サーバーです。このツールは、AppleのネイティブML…
★ 9 ⑂ 1 MIT 2026-06-23
音声生成 / TTS GitHub voxlert
Voxlertは、Claude Code、Cursor、OpenAI Codex、pi、OpenClawなどのLLM生成AIコーディングエージェント向けに、ゲー…
★ 9 ⑂ 2 MIT 2026-06-20
AIエージェント GitHub web-speed-oss
Web Speedは、AIエージェント向けのWebページ解析ツールです。複雑なWebコンテンツ(HTML、レイアウト、JavaScript)…
★ 9 ⑂ 1 GPL-3.0 2026-05-10
ComfyUI GitHub ComfyPanel
ComfyPanelは、Adobe PhotoshopとComfyUIを深く統合するプロフェッショナルなツールです。デザイナー向けに開発され…
★ 9 ⑂ 1 NOASSERTION 2026-06-24
画像生成 GitHub CVQ
このリポジトリは、革新的な画像トークン化手法「Channel-wise Vector Quantization (CVQ)」とその応用である「Chann…
★ 9 MIT 2026-06-01
ASR / 音声認識 GitHub Premiere-Pro-edit-bibl
Premiere Auto-Editは、話している動画(ロングフォーム・トーク・ライブ)のラフカットを、たった1つのコマンドで自…
★ 9 ⑂ 3 MIT 2026-06-15
画像生成 GitHub PromptReinjection
「Prompt Reinjection」は、マルチモーダル拡散トランスフォーマーにおいて発生する「プロンプト忘れ」問題に対処す…
★ 9 MIT 2026-05-20
ASR / 音声認識 GitHub afrispeech-selector
AfriSpeech Selectorは、142のアフリカ言語にわたる2200時間以上の音声データに簡単にアクセスできるCLIツールです。…
★ 9 ⑂ 5 2026-06-19
マルチモーダル GitHub MM-FM
MM-FMは、CVPR 2026で発表された、マルチモーダル分布のためのフローマッチング技術です。このツールは、特に高解像…
★ 9 ⑂ 1 MIT 2026-06-12
AIエージェント GitHub hero-harness
HERO(Harness for Engineering and Run-time Orchestration)は、基盤モデルを活用した自律型ソフトウェアエンジニ…
★ 9 MIT 2026-06-10
ASR / 音声認識 GitHub find-influencer-skill
このスキルは、AIエージェントが小紅書、抖音、Bilibili、YouTubeなどの複数のプラットフォームでインフルエンサーを…
★ 9 2026-05-07
ComfyUI GitHub J-AI-Studio
J AI Studioは、複雑なグラフエディタを必要とせずに、ローカルで画像や動画を生成するためのComfyUI用シンプルUIで…
★ 8 MIT 2026-05-03
動画生成 GitHub bony-agent
「Bony Agent」は「AI Media Agent」として、AIを活用したフルスタックのコンテンツ制作・配信プラットフォームです…
★ 8 ⑂ 1 2026-06-17
LLM GitHub corplaw-rag
corplaw-ragは、企業法務に特化した先進的な検索拡張生成(RAG)システムです。このツールは、高度な情報検索とコン…
★ 8 ⑂ 1 NOASSERTION 2026-05-01
マルチモーダル GitHub Awesome-VLA-Safety
本リポジトリは、Vision-Language-Action(VLA)モデルの安全性に関する厳選された研究論文リストです。データ準備、…
★ 8 2026-05-20
LLM GitHub Plasmod
Plasmodは、マルチエージェントシステム向けに設計されたエージェントネイティブデータベースです。粘菌ネットワーク…
★ 8 MIT 2026-06-13
ComfyUI GitHub Comfy-Launcher-MultiOS
Comfy-Launcher-MultiOSは、LinuxおよびmacOS環境でComfyUIのインストール、起動、更新、管理を簡素化するシェルスク…
★ 8 ⑂ 3 2026-06-17
動画生成 GitHub KIVI
KIVIは、テキストから動画を生成するAIモデルの評価に特化したツールです。従来の「動画の見栄え」ではなく、「動画…
★ 8 MIT 2026-06-05
ASR / 音声認識 GitHub Edu_Omni_MyMind
EduMINDは、ベトナム語と英語が混在する学術環境向けに設計された、多モーダルなバイリンガル講義アシスタントおよび…
★ 8 ⑂ 3 MIT 2026-06-23
LLM GitHub LLMs-Tutorials-Projects
このリポジトリは、LLM(大規模言語モデル)に関する実践的なチュートリアルと実装コード集を提供します。ファインチ…
★ 8 ⑂ 3 2026-06-23