3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub youtube-caption-tool
「Verbatim · YouTube逐字稿工具」は、YouTube動画の文字起こしを支援するローカルで動作するウェブツールです。主な…
★ 5 2026-05-10
マルチモーダル GitHub Auto_Translator
Auto-Translatorは、複数のエージェントを活用したPDFコンテンツの自動翻訳ツールです。原文のフォーマットを完璧に…
★ 5 ⑂ 1 2026-04-16
AIエージェント GitHub Hermes-Memory-OS
Hermes Memory-OSは、長時間稼働するHermesエージェント向けの「ファイルファースト」なメモリおよびガバナンスラン…
★ 5 MIT 2026-06-25
マルチモーダル GitHub multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
動画生成 GitHub wan2.2-i2v-fast
wan2.2-i2v-fastは、14BパラメータのWan-AI/Wan2.2-I2V-A14B-Diffusersモデルを活用した、実験的かつ高度に最適化さ…
★ 5 ⑂ 1 Apache-2.0 2026-06-15
ASR / 音声認識 GitHub Mynah
Mynahは、Discordのボイス通話を録音し、高精度な話者ラベル付きでローカルに文字起こしするツールです。このツール…
★ 5 NOASSERTION 2026-06-11
LLM GitHub A-LLM-learning-lecture
本講義は大言語モデル(LLM)の体系的な学習ノートで、Transformerの基礎からマルチエージェントシステムまで、15週…
★ 4 NOASSERTION 2026-06-23
マルチモーダル GitHub roboclaws
Roboclawsは、VLMポリシー、OpenClaw、AIコーディングエージェントによって駆動されるAIロボティクスデモのためのリ…
★ 4 ⑂ 2 MIT 2026-06-26
ASR / 音声認識 GitHub crisp-caption
crisp-captionは、ブラウザの音声やライブストリーム、OBSでの配信に対して、リアルタイムで日本語のライブキャプシ…
★ 4 ⑂ 3 Apache-2.0 2026-05-24
AIエージェント GitHub memharness
memharnessは、AIエージェント向けのバイテンポラルで来歴を保持する長期記憶プリミティブです。SQLiteをバックエン…
★ 4 ⑂ 1 Apache-2.0 2026-06-26
動画生成 GitHub agentic-video-maker
このツールは、単一のブリーフから高品質なAI動画を生成するパイプラインです。Geminiによるスクリプト作成、ElevenL…
★ 4 ⑂ 2 MIT 2026-05-12
マルチモーダル GitHub PaintBench
PaintBenchは、生成AIモデルの画像編集能力を決定論的に評価するためのベンチマークツールです。MSペイントのような…
★ 4 MIT 2026-06-02
動画生成 GitHub Morpheus
Morpheusは、動画生成モデルが生成した映像がニュートン物理学の法則にどれだけ従っているかを定量的に評価する、物…
★ 4 MIT 2026-05-28
音声生成 / TTS GitHub phonicorn
子供向けのフォニックス学習用フラッシュカードアプリで、単語の音、発音、解読パターンを練習できます。自己ホスト…
★ 4 MIT 2026-06-06
LLM GitHub mnemara
Mnemaraは、Claude Agent SDKを土台にした対話ランタイムです。毎ターンでロールドキュメントを再読込してシステムプ…
★ 4 MIT 2026-05-13
画像生成 GitHub civitai-post-splitter
このツールは、Civitaiの複数画像投稿を単一画像投稿に分割し、Civitai、Pixiv、X (Twitter)、小紅書といった複数の…
★ 4 MIT 2026-06-25
ComfyUI GitHub aeon-radio-drama
aeon-radio-dramaは、ラジオドラマ、オーディオブック、オーディオフィクションを制作するためのフルパイプラインツ…
★ 4 ⑂ 3 MIT 2026-06-28
LLM GitHub DermaGemma
Dermagemmaは、皮膚の色が濃い患者(スキントーンIV-VI)に対するAI皮膚科診断の精度低下という医療格差を解消するた…
★ 4 2026-05-23
画像生成 GitHub rahulk-ddpm
rahulk-ddpmは、PyTorchでスクラッチから実装されたDenoising Diffusion Probabilistic Models (DDPM)です。UNetと正…
★ 4 MIT 2026-06-23
3D / NeRF GitHub auto_3dgs
auto_3dgsは、360度動画から3D Gaussian Splatting(3DGS)モデルを完全に自動で生成するパイプラインツールです。こ…
★ 4 GPL-3.0 2026-04-02
ComfyUI GitHub vramsuite
VRAM Suiteは、ローカルAI推論ワークフローにおけるGPUメモリ診断のためのPythonフレームワークです。OOMエラーによ…
★ 4 ⑂ 1 NOASSERTION 2026-05-31
マルチモーダル GitHub vidground
VidGroundは、動画理解ベンチマークや機械学習の後学習データセットに内在する「動画を見なくても回答できる」テキス…
★ 4 MIT 2026-05-09
LLM GitHub nesift
nesiftは、AIエージェントがウェブコンテンツから情報を効率的に検索・抽出するための高速なローカルセマンティック…
★ 4 GPL-2.0 2026-05-23
LLM GitHub Metis
Metisは、コードの読み書き、ターミナル操作、Webブラウジングが可能なデスクトップAIエージェントです。ユーザーが…
★ 4 NOASSERTION 2026-06-22