3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2208 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ComfyUI GitHub Zonos2_TTS-ComfyUI
このツールは、Zyphra/ZONOS2モデルをComfyUIで利用するためのカスタムノード集です。テキスト読み上げ、音声のみで…
★ 12 ⑂ 2 MIT 2026-06-14
マルチモーダル GitHub Lumen
Lumenは、チャット、ビジョンQA、テキストから画像生成、画像から画像生成、長文会話圧縮、画像共有、Telegramボット…
★ 12 NOASSERTION 2026-06-28
ComfyUI GitHub ai0-video-creator
ai0-video-creatorは、スクリプト作成から高品質なビデオアセット生成までを効率化する、高機能なデスクトップ向けオ…
★ 12 ⑂ 1 2026-07-01
3D / NeRF GitHub SceneAligner
SceneAlignerは、様々な実環境画像とラスタライズされたフロアプランを入力として、画像から重力に沿った3D点群を再…
★ 12 2026-05-22
動画生成 GitHub seedance-2.0-api
Seedance 2.0 APIは、ByteDanceが提供する最先端の動画生成モデル「Seedance 2.0」の公式APIです。テキスト、画像、…
★ 12 2026-04-09
ASR / 音声認識 GitHub SubForge
SubForgeは、メディアファイルの字幕作成、翻訳、動画への埋め込みを一元的に行うオールインワンツールです。音声や…
★ 12 ⑂ 2 2026-05-22
マルチモーダル GitHub mlx-serve
mlx-serveは、Apple Silicon搭載Mac (M1+以降) 向けのローカル推論サーバーです。このツールは、AppleのネイティブML…
★ 12 ⑂ 2 MIT 2026-06-23
動画生成 GitHub aeon-movie-maker
aeon-movie-makerは、Lightricks LTX 2.3 22Bモデル(220億パラメータ)をベースにした、高速な映画品質ビデオ生成ツ…
★ 12 ⑂ 4 MIT 2026-06-28
LLM GitHub llm-eval-layer
llm-eval-layerは、LLMの出力品質を評価し、ハルシネーションを検出するための軽量なPython製決定エンジンです。アト…
★ 12 ⑂ 1 MIT 2026-05-18
画像生成 GitHub Text-to-Motion
Text-to-Motionは、テキストプロンプトからG1 Unitreeヒューマノイドロボット用の参照モーションを生成するプロジェ…
★ 12 2026-06-15
音声生成 / TTS GitHub sirene
Sireneは、自己ホスト型で複数のバックエンドをサポートするテキスト読み上げ(TTS)プラットフォームです。現代的な…
★ 12 ⑂ 1 MIT 2026-05-15
3D / NeRF GitHub SplAttN
SplAttNは、3D点群補完のための公式PyTorch実装です。従来の2D投影で生じる「クロスモーダルエントロピー崩壊」問題…
★ 12 ⑂ 1 MIT 2026-07-02
3D / NeRF GitHub ODE-GS
ODE-GSは、ICLR 2026で発表された「Latent ODEs for Dynamic Scene Extrapolation with 3D Gaussian Splatting」の公…
★ 12 ⑂ 3 MIT 2026-04-25
ASR / 音声認識 GitHub course-navigator
Course Navigatorは、動画学習に特化した高機能な作業台です。動画リンクやローカル動画から字幕を抽出し、逐語起こ…
★ 12 ⑂ 2 MIT 2026-06-26
3D / NeRF GitHub splatreg
splatregは、3D Gaussian Splatting(3DGS)スキャン間の位置合わせ(アライメント)と結合を目的としたPythonライブ…
★ 12 BSD-3-Clause 2026-07-02
ASR / 音声認識 GitHub Whisper-Skill
whisper-skillは、OpenAI API不要でローカル完結する無料の音声文字変換ツールです。99言語に対応し、Mac/Linux/Wind…
★ 12 ⑂ 8 2026-05-11
ASR / 音声認識 GitHub scriba
scribaは、AIエージェントやセカンドブレイン向けの、無料、ローカルで動作する高精度な会議議事録ツールです。話者…
★ 12 MIT 2026-06-20
動画生成 GitHub NanoI2V
NanoI2Vは、最先端の画像-動画変換(I2V)モデルをゼロから構築するためのステップバイステップのガイドです。拡散ベ…
★ 12 MIT 2026-06-19
AIエージェント GitHub Des-java-auto-skill
「Des-java-auto-skill」は、Claude Code Agent Teamsを基盤としたJava Webアプリケーション向けの全自動セキュリテ…
★ 12 2026-05-29
マルチモーダル GitHub xhs-notes-skill
xhs-notes-skillは、中国のソーシャルメディア「小紅書(XHS/RedNote)」向けの画像とテキストコンテンツ作成を支援…
★ 12 MIT 2026-07-04
AIエージェント GitHub goalkeeper
goalkeeperは、Claude Codeのための契約駆動型で耐久性のある目標実行ツールです。明確な達成基準(Definition of Do…
★ 12 ⑂ 2 MIT 2026-06-22
ComfyUI GitHub image-fingerprint-remover
このツールは、画像に埋め込まれたEXIF、GPS、C2PA/コンテンツクレデンシャル、AIウォーターマーク、Stable Diffusio…
★ 11 ⑂ 7 MIT 2026-05-21
ASR / 音声認識 GitHub qwen3-asr-mt
このツールは、Qwen3-ASR向けのマルチテナントストリーミングASR(自動音声認識)サーバーです。オリジナルのFlaskデ…
★ 11 ⑂ 1 Apache-2.0 2026-06-08
LLM GitHub TokenPack
TokenPack-RAGは、長文のドキュメント、コードベース、PDF、フォルダなどのコンテンツを、証拠密度の高いコンパクト…
★ 11 NOASSERTION 2026-05-14