3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
Qwen-Image-Edit-Object-Manipulator
Qwen-Image-Edit-Object-Manipulatorは、画像内のオブジェクトを簡単かつ高精度に操作できるツールです。ロゴ、アク…
★ 1 ⑂ 1 Apache-2.0 2026-06-25
ASR / 音声認識
GitHub
AKIRA-AI-Voice-Assistant
AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…
★ 1 2026-06-08
マルチモーダル
GitHub
invoice-extractor
この「Invoice Extraction System」は、VLM(Vision Language Models)を活用して、請求書や領収書から構造化された…
★ 1 2026-06-07
動画生成
GitHub
happy-horse-api
Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23
画像生成
GitHub
GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
AIエージェント
GitHub
coder-crew
coder-crewは、テスト駆動型のエージェントAIコーディングツールです。マネージャーモデルがコーディングタスクをサ…
★ 1 MIT 2026-06-18
ASR / 音声認識
GitHub
dreamjournal-bot
「Dream Journal Bot」は、Telegramプラットフォームで動作する革新的な夢日記ボットです。本ボットの最大の特徴は、…
★ 1 2026-06-18
ASR / 音声認識
GitHub
VoxCore
VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR(自動音声認識)、LLM(…
★ 1 ⑂ 1 Apache-2.0 2026-05-28
画像生成
GitHub
Stream_Mirror
StreamMirrorは、Webカメラの映像をリアルタイムでアニメ、水墨画、ファンタジー風といった様々なスタイルに変換する…
★ 1 MIT 2026-05-13
LLM
GitHub
builder-jobs-scraper
このツールは、企業採用ページからエンジニアリングの求人情報を収集し、Claudeを使って各役割を分類・要約し、レン…
★ 1 ⑂ 1 2026-06-28
ASR / 音声認識
GitHub
voxi
Voxiは、Instagram、YouTube、TikTok、X、Facebookといったソーシャルメディアの動画をローカル環境で文字起こしする…
★ 1 MIT 2026-05-25
LLM
GitHub
Agentic-IRC-Bot
本ツールはPythonで開発されたエージェント型IRCボットです。LLMを中核に据え、ツール呼び出し、結果統合、長期記憶…
★ 1 MIT 2026-05-24
音声生成 / TTS
GitHub
voiceclone-guard
「VoiceClone Guard」は、AI音声ディープフェイクを無料で検出するオープンソースのツールです。Webブラウザから音声…
★ 1 MIT 2026-05-23
LLM
GitHub
yuri-os
Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー(DAG)を設計し、…
★ 1 2026-06-04
音声生成 / TTS
GitHub
claude-speech-skill
「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…
★ 1 MIT 2026-06-21
音声生成 / TTS
GitHub
Voice-Command
Voice-Commandは、AI(Claude Desktop、Cowork、Claude Code、Codex CLI、Gemini CLI、LM Studioなど)を音声で完全…
★ 1 ⑂ 1 Apache-2.0 2026-06-23
ComfyUI
GitHub
ComfyUI-Flux2KontextConditioner
ComfyUI-Flux2KontextConditionerは、ComfyUIのFlux2 Kontext - Klein画像編集ワークフローを強化する高度なコンディ…
★ 1 ⑂ 1 MIT 2026-06-01
動画生成
GitHub
explainer-video
本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…
★ 1 MIT 2026-06-10
ASR / 音声認識
GitHub
voiceintake
「VoiceIntake」は、AIを活用して患者の音声問診を自動化するシステムです。患者が話すだけでAIが問診内容を瞬時に文…
★ 1 2026-06-16
ASR / 音声認識
GitHub
Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
3D / NeRF
GitHub
Panoptic-MapAnything
このプロジェクトは、既存の3Dパノプティックシーンセグメンテーション手法が持つ高コストな最適化や入力制約といっ…
★ 1 Apache-2.0 2026-04-13
画像生成
GitHub
Deep-Learning-Models
本リポジトリは、ディープラーニングの主要な19種類のアーキテクチャをPyTorch、TensorFlow/Keras、純粋なPython/Num…
★ 1 MIT 2026-06-11
マルチモーダル
GitHub
ControlFoley_test
ControlFoleyは、動画から音声への生成を統合的かつ制御可能に行うフレームワークです。動画、テキスト、参照音声を…
★ 1 Apache-2.0 2026-04-17