3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
ASR / 音声認識 GitHub Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
LLM GitHub ankylosing-spondylitis-skill
本ツールは「強直性脊柱炎(AS)専門問診インテリジェントエージェント」であり、既存の汎用大規模言語モデル(LLM)…
★ 1 NOASSERTION 2026-05-28
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
音楽生成 GitHub reelsmith
AIを活用し、写真や動画のフォルダーから高解像度のハイライトリールを自動生成するコマンドラインツール「reelsmith…
★ 1 Apache-2.0 2026-06-16
ASR / 音声認識 GitHub language-violence-intervention-system
本プロジェクトは、プライバシーを重視したエッジAIによる言語暴力検出および能動的介入システムです。Raspberry Pi …
★ 1 ⑂ 1 Apache-2.0 2026-06-25
マルチモーダル GitHub gaze
このツールは、AIにPC画面の「目」を与えるPython製アプリケーションです。ローカルで動作し、スクリーンショット、…
★ 1 MIT 2026-06-20
マルチモーダル GitHub tokensieve
tokensieveは、VLM(Vision-Language Model)を用いたVQA(Visual Question Answering)タスクにおいて、推論時の「p…
★ 1 2026-06-10
音声生成 / TTS GitHub sharky-ai-terminal
SHARKY AIは、アニメーション化されたネオンボイスオーブとハンズフリー音声チャット機能を備えた、ターミナル専用の…
★ 1 2026-06-14
動画生成 GitHub nano-xDiT
Nano-xDiTは、シングルGPU向けに最適化された軽量なWanビデオDiT推論エンジンです。TeaCacheやFirst-Block-Cacheとい…
★ 1 Apache-2.0 2026-06-14
マルチモーダル GitHub radscore
radscoreは、AI生成の放射線レポートを評価するための軽量なPythonツールキットです。BLEU、ROUGE、BERTScoreといっ…
★ 1 NOASSERTION 2026-06-16
ASR / 音声認識 GitHub VoiceOfIU
VoiceOfIUは、macOS上で動作するプライベートなローカル音声アシスタントです。ウェイクワード検出、Whisper STTによ…
★ 1 Apache-2.0 2026-06-18
画像生成 GitHub fooocus-zh-local-patch
このプロジェクトは、Fooocusの非公式な中国語ローカルUIパッチです。既存のFooocus環境にコピーして使用することで…
★ 0 NOASSERTION 2026-04-29
LLM GitHub fish-ecology-assistant
Panta Rhei · Everything Flows(Fish Ecology Assistant)は、コーディングエージェントを動的な世界観とDeepSeekレ…
★ 0 MIT 2026-06-25
3D / NeRF GitHub GHOST
GHOST(Geometric Human Out-of-sync Spatio Temporal reconstruction)は、カジュアルな非同期マルチビュー動画から…
★ 0 MIT 2026-06-23
ASR / 音声認識 GitHub meeting-auto-summary
Meeting Auto Summaryは、会議の音声や動画を構造化された成果物(話者分離された文字起こし、字幕、要約、レポート…
★ 0 2026-06-04
動画生成 GitHub c5-video-agents
「Zian-anson/c5-video-agents」は、ユーザーの一言の要求から、画像、ナレーション、字幕、BGMを含む完全なMP4動画…
★ 0 ⑂ 1 MIT 2026-05-11
画像生成 GitHub ComfyUI-Orakul-3K-Resolution
ComfyUI-Orakul-3K-Resolutionは、ComfyUIユーザー向けに、数学的な計算によるグリッチやアーティファクトを排除した…
★ 0 MIT 2026-05-20
LLM GitHub insurvoice-ai
InsurVoice AIは、保険顧客サービス向けのAI音声エージェント「Tina」です。Deepgramによるライブ音声認識、Claudeに…
★ 0 2026-06-19
LLM GitHub danwa
Danwa(だんわ)は、AIエージェントが議論を分析、評価、最適化するための監査可能なマルチエージェント討論プラット…
★ 0 2026-06-29
ASR / 音声認識 GitHub ai-meeting-live-transcriber
MeetScribe AIは、Python、Whisper、WebSocket、Next.jsを組み合わせたAI搭載のリアルタイム会議アシスタントです。…
★ 0 2026-05-21