3,639 repos GH 3,524 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2217 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ComfyUI GitHub ComfyUI_834t_scene_composer
ComfyUI上でレイヤー単位のリージョナルプロンプト作業をまとめて行えるカスタムノードです。色別レイヤーごとにプロ…
★ 5 ⑂ 1 MIT 2026-04-03
LLM GitHub tensor-serve
tensor-serveは、OpenAI互換AI向けのZIMベースの検索拡張プロキシです。KiwixのOPDSカタログからZIMドキュメントをダ…
★ 5 MIT 2026-05-11
LLM GitHub OpenMetaMate
MetaMateは、LLM(大規模言語モデル)を活用し、PDFからのデータ抽出を効率化するAIアシストツールです。系統的レビ…
★ 5 NOASSERTION 2026-06-20
動画生成 GitHub claude-video-editor
Claude video editorは、AIアシスタントのClaudeを活用し、コマンドラインで動画編集や動画生成を行うツールです。フ…
★ 5 ⑂ 1 NOASSERTION 2026-06-12
LLM GitHub spark-1822
このリポジトリは、NVIDIA DGX Sparkワークステーション向けの包括的な設定を提供します。Caddyリバースプロキシ、Op…
★ 5 ⑂ 1 MIT 2026-06-08
ASR / 音声認識 GitHub youtube-caption-tool
「Verbatim · YouTube逐字稿工具」は、YouTube動画の文字起こしを支援するローカルで動作するウェブツールです。主な…
★ 5 2026-05-10
マルチモーダル GitHub Auto_Translator
Auto-Translatorは、複数のエージェントを活用したPDFコンテンツの自動翻訳ツールです。原文のフォーマットを完璧に…
★ 5 ⑂ 1 2026-04-16
AIエージェント GitHub Hermes-Memory-OS
Hermes Memory-OSは、長時間稼働するHermesエージェント向けの「ファイルファースト」なメモリおよびガバナンスラン…
★ 5 MIT 2026-06-25
マルチモーダル GitHub multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
動画生成 GitHub wan2.2-i2v-fast
wan2.2-i2v-fastは、14BパラメータのWan-AI/Wan2.2-I2V-A14B-Diffusersモデルを活用した、実験的かつ高度に最適化さ…
★ 5 ⑂ 1 Apache-2.0 2026-06-15
ASR / 音声認識 GitHub Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
動画生成 GitHub veo-api
Veo 3 APIは、Googleの最新AI動画生成モデルであるGoogle Veo 3(Veo3, Veo 3.1, Veo 3 Fast)へ、最も安価で容易に…
★ 5 MIT 2026-05-27
3D / NeRF GitHub 4dgs-human-avatar-comfyui-nodes-dataset
このリポジトリは、ComfyUI向けの究極の4DGS(4D Gaussian Splatting)モジュール「Shramko-Volumetric-Bridge」と、…
★ 5 Apache-2.0 2026-06-19
LLM GitHub autonomous-software-engineer
このツールは、自然言語で書かれた要件からソフトウェアプロジェクトの分析、計画、コード生成、ファイル作成までを…
★ 5 2026-06-20
ComfyUI GitHub ComfyUI-Drawer
ComfyUI-Drawerは、ComfyUIの複雑なワークフローをモバイルフレンドリーなモジュール式UIプラットフォームに変革しま…
★ 5 ⑂ 2 NOASSERTION 2026-05-16
マルチモーダル GitHub JoyCapture-UR5
JoyCapture-UR5は、Xboxコントローラーを使用してUR5ロボットを遠隔操作し、多モーダルなデモンストレーションデータ…
★ 5 MIT 2026-05-24
ASR / 音声認識 GitHub PARSE
PARSEは、記述言語学のフィールドワークと、それに続く比較分析を支援するブラウザベースのワークステーションです。…
★ 5 MIT 2026-06-18
LLM GitHub SocialSim
本リポジトリは、AAAI 2025論文「SocialSim: Towards Socialized Simulation of Emotional Support Conversation」に…
★ 5 ⑂ 1 NOASSERTION 2026-05-20
3D / NeRF GitHub wavelet-splatting
WIPES(Wavelet-based Visual Primitives)は、多次元視覚信号の効率的な表現を目的としたウェーブレットベースの視…
★ 5 MIT 2026-06-04
音声生成 / TTS GitHub voice-snap
「voice-snap」は、低遅延を実現するAI音声コンパニオンライブラリです。高速な音声認識にはfaster_whisperを、自然…
★ 5 NOASSERTION 2026-05-19
ComfyUI GitHub ComfyUI-Flow-Assistor
ComfyUI-Flow-Assistorは、ComfyUIのワークフローを効率化するための必須ユーティリティノード集です。このツールは…
★ 5 ⑂ 2 MIT 2026-05-14
AIエージェント GitHub Deep-Research-104
このプロジェクトは、Web検索と高度な推論モデル(OpenAI o3、DeepSeek-R1、ローカルOllamaモデルなど)を組み合わせ…
★ 5 MIT 2026-06-05
画像生成 GitHub CUIG
CUIGは、テキストから画像を生成する拡散モデルにおける概念忘却の研究コードベースです。本リポジトリは、独立、シ…
★ 5 MIT 2026-06-12
マルチモーダル GitHub SkinAid
SkinAidは、皮膚疾患の分析を支援する高度なクロスモーダルAIフレームワークです。ユーザーは皮膚の画像と年齢、性別…
★ 5 ⑂ 1 MIT 2026-05-30