3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

The-Earful-Tower

「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…

#GPU必須 #Python #Windowsのみ

★ 1 MIT 2026-06-13

ASR / 音声認識

GitHub

Welcome-to-the-Narthex-Transcripts

このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト（文字…

#CLI #GPU必須 #LLM活用

★ 1 NOASSERTION 2026-05-27

LLM

GitHub

ankylosing-spondylitis-skill

本ツールは「強直性脊柱炎（AS）専門問診インテリジェントエージェント」であり、既存の汎用大規模言語モデル（LLM）…

#CLI #GPU不要 #LLM連携

★ 1 NOASSERTION 2026-05-28

動画生成

GitHub

PackForcing

PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…

#CLI #GPU必須 #Python

★ 1 2026-06-24

音楽生成

GitHub

reelsmith

AIを活用し、写真や動画のフォルダーから高解像度のハイライトリールを自動生成するコマンドラインツール「reelsmith…

#AI #CLI #FFmpeg

★ 1 Apache-2.0 2026-06-16

ASR / 音声認識

GitHub

language-violence-intervention-system

本プロジェクトは、プライバシーを重視したエッジAIによる言語暴力検出および能動的介入システムです。Raspberry Pi …

#Python #Raspberry Pi対応 #Web UI

★ 1 ⑂ 1 Apache-2.0 2026-06-25

マルチモーダル

GitHub

gaze

このツールは、AIにPC画面の「目」を与えるPython製アプリケーションです。ローカルで動作し、スクリーンショット、…

#AIプラットフォーム非依存 #CLI #OCR

★ 1 MIT 2026-06-20

マルチモーダル

GitHub

tokensieve

tokensieveは、VLM（Vision-Language Model）を用いたVQA（Visual Question Answering）タスクにおいて、推論時の「p…

#CLI #Python #VLM

★ 1 2026-06-10

音声生成 / TTS

GitHub

sharky-ai-terminal

SHARKY AIは、アニメーション化されたネオンボイスオーブとハンズフリー音声チャット機能を備えた、ターミナル専用の…

#AIアシスタント #CLI #Python

★ 1 2026-06-14

動画生成

GitHub

nano-xDiT

Nano-xDiTは、シングルGPU向けに最適化された軽量なWanビデオDiT推論エンジンです。TeaCacheやFirst-Block-Cacheとい…

#CLI #Python #TeaCache

★ 1 Apache-2.0 2026-06-14

マルチモーダル

GitHub

radscore

radscoreは、AI生成の放射線レポートを評価するための軽量なPythonツールキットです。BLEU、ROUGE、BERTScoreといっ…

#AI / 機械学習 #CLI #Python

★ 1 NOASSERTION 2026-06-16

ASR / 音声認識

GitHub

VoiceOfIU

VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…

#APIキー不要 #Apple Silicon対応 #macOS

★ 1 Apache-2.0 2026-06-18

画像生成

GitHub

fooocus-zh-local-patch

このプロジェクトは、Fooocusの非公式な中国語ローカルUIパッチです。既存のFooocus環境にコピーして使用することで…

#Fooocus対応 #GPU必須 #Python

★ 0 NOASSERTION 2026-04-29

LLM

GitHub

fish-ecology-assistant

Panta Rhei · Everything Flows（Fish Ecology Assistant）は、コーディングエージェントを動的な世界観とDeepSeekレ…

#AI/ML #CLI/API #Python

★ 0 MIT 2026-06-25

3D / NeRF

GitHub

GHOST

GHOST（Geometric Human Out-of-sync Spatio Temporal reconstruction）は、カジュアルな非同期マルチビュー動画から…

#3D再構築 #CLI #GPU必須

★ 0 MIT 2026-06-23

ASR / 音声認識

GitHub

meeting-auto-summary

Meeting Auto Summaryは、会議の音声や動画を構造化された成果物（話者分離された文字起こし、字幕、要約、レポート…

#Apple Silicon最適化 #CLI #Python

★ 0 2026-06-04

動画生成

GitHub

c5-video-agents

「Zian-anson/c5-video-agents」は、ユーザーの一言の要求から、画像、ナレーション、字幕、BGMを含む完全なMP4動画…

#AI #CLI #ComfyUI対応

★ 0 ⑂ 1 MIT 2026-05-11

画像生成

GitHub

ComfyUI-Orakul-3K-Resolution

ComfyUI-Orakul-3K-Resolutionは、ComfyUIユーザー向けに、数学的な計算によるグリッチやアーティファクトを排除した…

#ComfyUI対応 #GPU必須 #Python

★ 0 MIT 2026-05-20

LLM

GitHub

insurvoice-ai

InsurVoice AIは、保険顧客サービス向けのAI音声エージェント「Tina」です。Deepgramによるライブ音声認識、Claudeに…

#AIアシスタント #API連携 #GDPR準拠

★ 0 2026-06-19

LLM

GitHub

danwa

Danwa（だんわ）は、AIエージェントが議論を分析、評価、最適化するための監査可能なマルチエージェント討論プラット…

#AI #OCR #Python

★ 0 2026-06-29

ASR / 音声認識

GitHub

ai-meeting-live-transcriber

MeetScribe AIは、Python、Whisper、WebSocket、Next.jsを組み合わせたAI搭載のリアルタイム会議アシスタントです。…

#AI #Python #Web UI

★ 0 2026-05-21