3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

LLM

GitHub

rag-document-engine

「Buffden/rag-document-engine」は、Pythonでゼロから構築されたプログレッシブなRAG（検索拡張生成）システムです…

#Chroma #CLI #OpenAI

★ 1 2026-06-27

ASR / 音声認識

GitHub

Jarvis

Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…

#AI / 機械学習 #CLI #OpenCV

★ 1 2026-06-17

3D / NeRF

GitHub

Ghost-Eye

Ghost Eyeは、単一のRGB画像から屋内の家具を3Dで再構築するシステムです。低VRAMのコンシューマー向けGPU（ピーク時…

#3D再構築 #GPU必須 #Python

★ 1 Apache-2.0 2026-05-10

LLM

GitHub

jax-7b-tpu-sharding

本リポジトリは、JAX/Flax/Optaxを用いてTPU v4-8上で7BパラメータのTransformerモデルをトレーニングする際に遭遇す…

#CLI #JAX #Python

★ 1 2026-05-13

動画生成

GitHub

TechDemoForge

TechDemoForgeは、技術的なREADME、仕様書、コードなどの情報源から、正確で構造化されたデモビデオを自動生成するロ…

#CLI #LLM連携 #Python

★ 1 MIT 2026-04-12

音声生成 / TTS

GitHub

claude-speech-skill

「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…

#Claude Code対応 #Python #TTS

★ 1 MIT 2026-06-21

画像生成

GitHub

comfyui-amd-plug-and-play

miradorventus/comfyui-amd-plug-and-play は、AMD GPU（Ubuntu/Mint）上でComfyUIのセットアップと実行を大幅に簡素…

#AMD ROCm #CLI #ComfyUI対応

★ 1 2026-05-31

LLM

GitHub

whiskershelf

AI WhiskerShelfは、ローカルで動作するLLM（大規模言語モデル）駆動の論文ライブラリマネージャーです。PDFファイル…

#API連携 #CLI #LLM

★ 1 MIT 2026-06-07

ASR / 音声認識

GitHub

livekit-starter

LiveKit Voice AI Starterは、ブラウザ上でAIエージェントとリアルタイムで音声対話を行うためのフルスタックなスタ…

#Docker #FastAPI #Python

★ 1 MIT 2026-06-18

画像生成

GitHub

Stream_Mirror

StreamMirrorは、Webカメラの映像をリアルタイムでアニメ、水墨画、ファンタジー風といった様々なスタイルに変換する…

#GPU必須 #Python #StreamDiffusion

★ 1 MIT 2026-05-13

ASR / 音声認識

GitHub

ai-subtitle-generator

本ツールは、YouTube Shorts、TikTok、Reelsなどの短尺動画コンテンツ向けに、AIを活用しワードレベルで高精度なSRT…

#AI #CLI #Docker

★ 1 2026-05-16

マルチモーダル

GitHub

corpus-mill

「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画（人物…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-06

LLM

GitHub

visually-guided-subtitle-translation

このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-20

音声生成 / TTS

GitHub

narrateflow

NarrateFlowは、PPTやドキュメントを音声クローン、タイムライン調整、リタイムド動画合成機能を備えたナレーション…

#CLI #FFmpeg #Gemini API

★ 1 ⑂ 1 Apache-2.0 2026-06-14

ComfyUI

GitHub

ai-without-fear

「AIWF Research Atlas」は、AI Without Fearプロジェクト向けに設計された、GitHub対応の研究および検索コーパスで…

#AI/RAGシステム向け #CLI #ComfyUI対応

★ 1 NOASSERTION 2026-06-27

画像生成

GitHub

DiffClean

DiffCleanは、拡散モデルとテキストガイドを用いて顔のメイクアップを効果的に除去し、正確な年齢推定を可能にするツ…

#AI/機械学習 #CLI #GPU必須

★ 1 2026-05-30

マルチモーダル

GitHub

mllm-persona-evaluation

本ツールは、「都市センチメント認識のためのLLMエージェントにおけるペルソナの妥当性」に関する研究の公式実装です…

#CLI #Jupyter Notebooks #LangGraph

★ 1 CC-BY-4.0 2026-05-26

マルチモーダル

GitHub

qwen-visual-training-lab

「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…

#AMD GPU #CLI #DirectML

★ 1 2026-05-15

画像生成

GitHub

anime-sd-mcp

anime-sd-mcpは、MCP（Model Context Protocol）サーバーとして機能し、AIクライアント（Claude Desktop、Claude Cod…

#AIクライアント対応 #CLI #GPU必須

★ 1 MIT 2026-05-30

音楽生成

GitHub

Melodic-Intelligence-Layer

MIL（Melodic Intelligence Layer）は、ニューラルネットワークを使わずに数学理論に基づいたアルゴリズムによるピア…

#API #CLI #MIDI出力

★ 1 Apache-2.0 2026-04-05

動画生成

GitHub

drama-cc

「drama-cc」は、Claude Codeのスラッシュコマンドとして機能するAIツールです。40秒の短編AIソープオペラ動画を生成…

#AI #Claude Code #CLI

★ 1 MIT 2026-05-13

ASR / 音声認識

GitHub

Multimodal-Emotion-Recognition-System

このツールは、顔の表情と音声分析をリアルタイムで組み合わせ、感情を検出する多モーダル感情認識システムです。主…

#CLI #Machine Learning #Python

★ 1 2026-06-08

ASR / 音声認識

GitHub

voiceintake

「VoiceIntake」は、AIを活用して患者の音声問診を自動化するシステムです。患者が話すだけでAIが問診内容を瞬時に文…

#AI活用 #GDPR準拠 #Python

★ 1 2026-06-16

マルチモーダル

GitHub

easycomputewithgemma

このツールは、Apple Silicon搭載MacでGemma 4を完全にローカルで実行し、スマートフォン（iOS/Android）から自然言…

#Android #CLI #GPU必須

★ 1 2026-05-24