3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル

GitHub

VisualClaw

VisualClawは、物理世界向けのリアルタイムでパーソナライズされたエージェントを構築するための自己進化型マルチモ…

#API Gateway #CLI #LLM Agent

★ 42 ⑂ 3 MIT 2026-06-16

音楽生成

GitHub

studiomi300

studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…

#AMD Instinct MI300X #CLI #GPU必須

★ 42 ⑂ 8 MIT 2026-05-22

画像生成

GitHub

Coarse-guided-Gen

「Coarse-guided-Gen」は、粗いサンプルをガイドとして、条件付きのビジュアルコンテンツ生成を可能にするツールです…

#CLI #GPU必須 #Python

★ 42 ⑂ 4 2026-05-08

LLM

GitHub

hermes-katana

Hermes Katanaは、AIエージェント向けの多層防御セキュリティレイヤーです。テキストの出所を文字レベルで追跡し、プ…

#AIセキュリティ #CLI #Hugging Face連携

★ 42 ⑂ 2 MIT 2026-06-22

音声生成 / TTS

GitHub

call-translator

「Realtime Call Translator」は、ビデオ/音声通話中にリアルタイムで音声を翻訳するツールです。あなたが話す言語は…

#macOS #Python #Web UI

★ 42 ⑂ 11 MIT 2026-04-04

音声生成 / TTS

GitHub

Audio-Oscar

Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…

#CLI #FFmpeg #GPU必須

★ 42 ⑂ 4 Apache-2.0 2026-06-08

LLM

GitHub

ThinkJEPA

ThinkJEPAは、ビジョン-言語モデル(VLM)とJEPA(Joint Embedding Predictive Architecture)を統合したデュアルパス具…

#CLI #GPU必須 #Hugging Face

★ 42 ⑂ 5 NOASSERTION 2026-04-30

マルチモーダル

music-flamingo-think-2601-hf

Music Flamingo Thinkは、音楽や楽曲音声を入力として詳細な説明や質疑応答を行えるNVIDIAの音声言語モデルです。ジ…

#CLI #GPU必須 #Python

❤ 41 ↓ 533 other 2026-04-07

LLM

GitHub

mAIcro

mAIcroは、MicroClub-USTHBによって開発された、コミュニティや組織向けのオープンソースAI知識サービスです。このツ…

#AI/LLM #Discord連携 #Docker

★ 41 ⑂ 4 MIT 2026-03-30

LLM

GitHub

bit-brain

BitBrainは、最小限のGPUリソース（RTX 3090以上）で独自の小型LLM（miniLLM）を学習できるプロジェクトです。Qwen3-…

#CLI #GPU必須 #LLM

★ 41 ⑂ 2 Apache-2.0 2026-05-04

ComfyUI

GitHub

ComfyUI-Grounding

ComfyUI-Groundingは、ComfyUI上でテキスト指定による物体検出・領域マスク生成・SAM2セグメンテーションをまとめて…

#ComfyUI対応 #GPU推奨 #Python

★ 41 ⑂ 3 MIT 2026-06-22

3D / NeRF

GitHub

OVGGT

OVGGTは、トレーニング不要で、任意に長いビデオストリームからリアルタイムで3D再構成を可能にする革新的なフレーム…

#3D再構成 #CLI #GPU必須

★ 41 ⑂ 1 NOASSERTION 2026-06-15

LLM

GitHub

grok-dreamcore

このツールは、感情状態、記憶の固定点、象徴的な原型に基づいて超現実的な夢のシーケンスを生成するエンジンです。…

#CLI #Python #ライブラリ

★ 41 ⑂ 6 NOASSERTION 2026-05-26

音声生成 / TTS

GitHub

Irodori-TTS-Server

「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Spe…

#Docker #GPU必須 #OpenAI API Compatible

★ 41 ⑂ 10 MIT 2026-06-22

ASR / 音声認識

GitHub

echoic

Echoicは、AIを活用した発話練習ツールです。任意の音声ファイルをインポートし、文章ごとに発話練習を行い、音素レ…

#AI #Docker #LLM連携

★ 41 ⑂ 5 MIT 2026-05-19

ComfyUI

GitHub

ComfyUI-FBCNN

「ComfyUI-FBCNN」は、人気の画像生成UI「ComfyUI」に、JPEG画像の圧縮ノイズ（アーティファクト）除去に特化したFBC…

#ComfyUI対応 #GPU必須 #Python

★ 41 ⑂ 7 GPL-3.0 2025-02-24

ComfyUI

GitHub

ComfyUI_SeeCoder

ComfyUI向けの実験的なカスタムノード集で、SeeCodersを使って画像から埋め込みを生成し、既存のテキスト埋め込みな…

#ComfyUI対応 #Python #Web UI

★ 40 ⑂ 8 GPL-3.0 2024-05-22

ASR / 音声認識

GitHub

voiceInput

「VoiceInput」は、Windows OS向けのAI音声入力ツールです。指定されたショートカットキーを押すだけで、話した内容…

#AI #LLM #Python

★ 40 ⑂ 7 MIT 2026-06-25

音楽生成

GitHub

latentscore

LatentScoreは、テキスト記述からアンビエントミュージックを生成するPythonライブラリです。GPU不要でローカル環境…

#CLI #Colab対応 #Docker対応

★ 40 ⑂ 4 Apache-2.0 2026-05-29

ComfyUI

GitHub

GF_nodes

このツールは、ComfyUI用のカスタムノード「RMBG-2.0 Background Removal Node」です。briaai/RMBG-2.0モデルとBEN2:…

#ComfyUI対応 #GPU推奨 #Python

★ 40 ⑂ 1 MIT 2025-04-19

ComfyUI

GitHub

ComfyUI-sudo-latent-upscale

ComfyUI向けの潜在空間アップスケール用カスタム実装・モデル集です。画像をRGBで拡大してから再エンコードするので…

#ComfyUI対応 #GPU必須 #Python

★ 40 ⑂ 7 BSD-3-Clause 2024-05-22

動画生成

GitHub

PhyMotion

PhyMotionは、人間のビデオ生成におけるリアルなモーション生成の課題を解決するために提案された、構造化された詳細…

#Hugging Face #MuJoCo #Python

★ 39 ⑂ 5 MIT 2026-05-15

ComfyUI

GitHub

ComfyUI-Img2Img-Turbo

このツールは、人気の画像生成UIであるComfyUIのImg2Img機能を高速化するための拡張機能です。GaParmar氏のImg2Img-T…

#AI/機械学習 #ComfyUI対応 #GPU必須

★ 39 ⑂ 7 MIT 2024-05-22

音声生成 / TTS

GitHub

voice-zero

Voice-Zeroは、ゼロショットテキスト音声合成エンジン（Chatterbox、Pocket TTSなど）で利用可能な、高品質なオープ…

#CLIツール連携 #Python #データセット

★ 39 ⑂ 7 NOASSERTION 2026-05-14