3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル

GitHub

Qwen-Image-Edit-Object-Manipulator

Qwen-Image-Edit-Object-Manipulatorは、画像内のオブジェクトを簡単かつ高精度に操作できるツールです。ロゴ、アク…

#CLI #Linux #macOS

★ 1 ⑂ 1 Apache-2.0 2026-06-25

ASR / 音声認識

GitHub

AKIRA-AI-Voice-Assistant

AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…

#AIアシスタント #CLI #Python

★ 1 2026-06-08

マルチモーダル

GitHub

invoice-extractor

この「Invoice Extraction System」は、VLM（Vision Language Models）を活用して、請求書や領収書から構造化された…

#PostgreSQL #Python #REST API

★ 1 2026-06-07

動画生成

GitHub

happy-horse-api

Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…

#AI動画生成 #API #Node.js

★ 1 MIT 2026-05-25

マルチモーダル

GitHub

mm-docqa

Jmiao11/mm-docqaは、図とテキストが混在するPDF（特に論文の図表を含む）の内容に対して質問し、引用元付きの回答を…

#CLI #GPU推奨 #Python

★ 1 MIT 2026-06-23

画像生成

GitHub

GenAI-From-Scratch

このリポジトリは、様々な生成AIアーキテクチャ（VAE、GAN、DDPMなど）をPythonでゼロから実装したコンパクトなコレ…

#CLI #Python

★ 1 MIT 2026-06-14

AIエージェント

GitHub

coder-crew

coder-crewは、テスト駆動型のエージェントAIコーディングツールです。マネージャーモデルがコーディングタスクをサ…

#CLI #Ollama #Python

★ 1 MIT 2026-06-18

ASR / 音声認識

GitHub

dreamjournal-bot

「Dream Journal Bot」は、Telegramプラットフォームで動作する革新的な夢日記ボットです。本ボットの最大の特徴は、…

#AI活用 #Python #Telegram対応

★ 1 2026-06-18

ASR / 音声認識

GitHub

VoxCore

VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR（自動音声認識）、LLM（…

#Docker #FastAPI #OpenAI互換

★ 1 ⑂ 1 Apache-2.0 2026-05-28

画像生成

GitHub

Stream_Mirror

StreamMirrorは、Webカメラの映像をリアルタイムでアニメ、水墨画、ファンタジー風といった様々なスタイルに変換する…

#GPU必須 #Python #StreamDiffusion

★ 1 MIT 2026-05-13

LLM

GitHub

builder-jobs-scraper

このツールは、企業採用ページからエンジニアリングの求人情報を収集し、Claudeを使って各役割を分類・要約し、レン…

#Claude API #CLI #GitHub Actions

★ 1 ⑂ 1 2026-06-28

ASR / 音声認識

GitHub

voxi

Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…

#AIアシスタント連携 (MCP) #CLI #Python

★ 1 MIT 2026-05-25

LLM

GitHub

Agentic-IRC-Bot

本ツールはPythonで開発されたエージェント型IRCボットです。LLMを中核に据え、ツール呼び出し、結果統合、長期記憶…

#CLI #IRC #LLM

★ 1 MIT 2026-05-24

音声生成 / TTS

GitHub

voiceclone-guard

「VoiceClone Guard」は、AI音声ディープフェイクを無料で検出するオープンソースのツールです。Webブラウザから音声…

#APIキー不要 #Python #Web UI

★ 1 MIT 2026-05-23

LLM

GitHub

yuri-os

Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー（DAG）を設計し、…

#Generative AI #Python #Web UI

★ 1 2026-06-04

音声生成 / TTS

GitHub

claude-speech-skill

「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…

#Claude Code対応 #Python #TTS

★ 1 MIT 2026-06-21

音声生成 / TTS

GitHub

Voice-Command

Voice-Commandは、AI（Claude Desktop、Cowork、Claude Code、Codex CLI、Gemini CLI、LM Studioなど）を音声で完全…

#AIアシスタント #CLI #Python

★ 1 ⑂ 1 Apache-2.0 2026-06-23

ComfyUI

GitHub

ComfyUI-Flux2KontextConditioner

ComfyUI-Flux2KontextConditionerは、ComfyUIのFlux2 Kontext - Klein画像編集ワークフローを強化する高度なコンディ…

#ComfyUI対応 #GPU必須 #Python

★ 1 ⑂ 1 MIT 2026-06-01

動画生成

GitHub

explainer-video

本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…

#Claude Code #CLI #GPU推奨

★ 1 MIT 2026-06-10

ASR / 音声認識

GitHub

voiceintake

「VoiceIntake」は、AIを活用して患者の音声問診を自動化するシステムです。患者が話すだけでAIが問診内容を瞬時に文…

#AI活用 #GDPR準拠 #Python

★ 1 2026-06-16

ASR / 音声認識

GitHub

Auto-Vod-Trimmer

Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…

#AI #CLI #Python

★ 1 GPL-3.0 2026-06-26

3D / NeRF

GitHub

Panoptic-MapAnything

このプロジェクトは、既存の3Dパノプティックシーンセグメンテーション手法が持つ高コストな最適化や入力制約といっ…

#3D再構築 #Python #コンピュータビジョン

★ 1 Apache-2.0 2026-04-13

画像生成

GitHub

Deep-Learning-Models

本リポジトリは、ディープラーニングの主要な19種類のアーキテクチャをPyTorch、TensorFlow/Keras、純粋なPython/Num…

#CLI #Jupyter Notebook #Python

★ 1 MIT 2026-06-11

マルチモーダル

GitHub

ControlFoley_test

ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…

#CLI #GPU必須 #Hugging Face

★ 1 Apache-2.0 2026-04-17