3,627 repos GH 3,512 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2212 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

voiceintake

「VoiceIntake」は、AIを活用して患者の音声問診を自動化するシステムです。患者が話すだけでAIが問診内容を瞬時に文…

#AI活用 #GDPR準拠 #Python

★ 1 2026-06-16

ASR / 音声認識

GitHub

Auto-Vod-Trimmer

Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…

#AI #CLI #Python

★ 1 GPL-3.0 2026-06-26

3D / NeRF

GitHub

Panoptic-MapAnything

このプロジェクトは、既存の3Dパノプティックシーンセグメンテーション手法が持つ高コストな最適化や入力制約といっ…

#3D再構築 #Python #コンピュータビジョン

★ 1 Apache-2.0 2026-04-13

画像生成

GitHub

Deep-Learning-Models

本リポジトリは、ディープラーニングの主要な19種類のアーキテクチャをPyTorch、TensorFlow/Keras、純粋なPython/Num…

#CLI #Jupyter Notebook #Python

★ 1 MIT 2026-06-11

ComfyUI

GitHub

comfyui_sun_nodes

comfyui_sun_nodesは、SunX AIが開発するComfyUI向けのカスタムノード集で、現時点では画像バッチを1枚ずつ順番に処…

#ComfyUI対応 #Python #Web UI

★ 1 ⑂ 2 MIT 2026-01-07

マルチモーダル

GitHub

uitars-mcp

UI-TARS MCPは、AIエージェントがデスクトップとウェブブラウザを操作するための「目と手」を提供するサーバーツール…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-06-07

ComfyUI

GitHub

ConfyUI_Post_Processing_PRO

「Post_Processing_PRO for ComfyUI」は、ComfyUI向けにキュレーションされたプロフェッショナルかつ高忠実度の後処…

#ComfyUI対応 #Python #カメラシミュレーション

★ 1 ⑂ 1 GPL-3.0 2026-04-14

音声生成 / TTS

GitHub

NeuralSoundForge

NeuralSoundForgeは、StyleGAN2とセマンティック因数分解を駆使した高度な深層学習プラットフォームです。このツール…

#Docker #GPU必須 #Python

★ 1 2026-02-06

ComfyUI

GitHub

master-canvas-hermes-plugin

Master Canvas Hermes Pluginは、AI動画プロジェクトのプリプロダクションキャンバスであるMaster CanvasのHermes Ag…

#AI #CLI #ComfyUI対応

★ 1 MIT 2026-05-20

ComfyUI

GitHub

comfyui-runpod-agentic-nodes

ComfyUI Agentic workflow nodes (CRAG nodes)は、ComfyUI内でRunpod上のエージェントシステムを視覚的に設計、計画…

#ComfyUI対応 #Python #Runpod

★ 1 MIT 2026-05-29

ASR / 音声認識

GitHub

tiktok-extractor

このツールは、TikTokのURLから動画のメタデータ、完全な文字起こし、シーンのキーフレーム、画面上のOCRテキストを…

#AIアシスタント対応 #CLI #OCR

★ 1 MIT 2026-05-24

音声生成 / TTS

GitHub

ai-google-voice-agent

「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…

#AI #Groq AI #Python

★ 1 2026-05-26

画像生成

GitHub

my-lm

My-LMは、オープンウェイトのLLM実行、SDXL画像生成、RAG、QLoRAファインチューニングといった高度なAIタスクを、単…

#Electron #GPU必須 #LLM対応

★ 1 MIT 2026-05-09

画像生成

GitHub

DESIGNOSFORGE

DESIGNOSFORGEは、AIデザインにおける視覚的な問題を解決し、統制されたデザインワークフローを実現するオープンソー…

#CLI #Codex #GitHub

★ 1 MIT 2026-06-19

画像生成

GitHub

ComfyUI-Mutantwork

ComfyUI-Mutantworkは、ComfyUI向けのカスタムノードスイートで、プロンプトの最適化、ローカルでのAI画像鑑識、およ…

#ComfyUI対応 #GPU推奨 #Python

★ 1 ⑂ 1 2026-06-12

ASR / 音声認識

GitHub

voice-prompt-tool

「Voice Prompt Tool」は、Windows環境で動作する音声入力ツールです。ホットキーを押すだけで、任意のテキスト入力…

#AIテキスト整理 #GUIアプリ #Python

★ 1 2026-06-23

動画生成

GitHub

LTX-2-Audio-to-Video-Local-XPU

このプロジェクトは、LTX-2 19B AIモデルを利用して、画像と音声トラックからビデオをローカルで生成するツールです…

#AIモデル #CLI #GPU必須

★ 1 2026-03-20

音声生成 / TTS

GitHub

tts-blendr

VoiceBlend-TUIは、Textualフレームワークで構築されたターミナルUI（TUI）アプリケーションです。テキストファイル…

#AI Voice #CLI #Python

★ 1 2026-04-29

3D / NeRF

GitHub

Lid-Lab-NeRF

Lid-Lab-NeRFは、LiDAR点群の新しいスキャンを生成するためのPyTorchベースのNeRFフレームワークです。このツールは…

#CLI #GPU必須 #LiDAR

★ 1 Apache-2.0 2025-11-28

LLM

GitHub

TOKEN_BANK-manage-your-token-usage

TOKENBANKは、AIコーディングアシスタントのトークン使用量と費用を詳細に統計・管理するためのデスクトップアプリケ…

#Python #Web UI #Windows

★ 1 2026-06-01

LLM

GitHub

contextcontrol

ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル（LLM）の利用、およびパッチワークフ…

#CLI #LLM #Ollama

★ 1 ⑂ 2 NOASSERTION 2026-05-31

音声生成 / TTS

GitHub

Open-Vox

OpenVoxは、選択したテキストをグローバルショートカットで読み上げる、オープンソースかつマルチOS対応のデスクトッ…

#GPU対応 #Python #Tkinter

★ 1 NOASSERTION 2026-06-02

ASR / 音声認識

GitHub

BaltiVoice-ASR

BaltiVoice ASRは、バルティ語（チベット語族の低リソース言語）の音声をテキストに変換する初のAI音声認識（ASR）シ…

#AI/ML #ASR #Hugging Face

★ 1 MIT 2026-06-12

LLM

GitHub

teaching_llm_applications

本リポジトリは、ヨーク大学コンピュータサイエンス学部が提供する12週間の修士課程コース「大規模言語モデル — 内部…

#LLM学習 #Python #ハンズオン

★ 1 GPL-3.0 2026-06-25