3,639 repos GH 3,524 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2217 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub florilegium
このツールは「Florilegium(フロリレギウム)・他山之石」と名付けられ、YouTubeやBilibiliなどの動画リンク、また…
★ 8 ⑂ 1 MIT 2026-06-06
画像生成 GitHub DisPOSE
この「DisPOSE」は、自己教師ありマルチビュー3D人体ポーズ推定のための実装です。離散的なクロスビュー人物割り当て…
★ 8 MIT 2026-06-15
AIエージェント GitHub AutoPilot-DevAgent
AutoPilot Devは、GitHubのプルリクエストURLを入力として受け取り、AIがコードレビュー、バグ修正の提案、テスト検…
★ 8 2026-06-09
ASR / 音声認識 GitHub voice-input
本ツールは、Linux/X11を主な対象としたプッシュツートーク方式のグローバル音声入力アプリケーションです。ショート…
★ 7 MIT 2026-06-15
ASR / 音声認識 GitHub meet-transcription
このツールは、Google Meetの録画を自動的に文字起こしするためのパイプラインです。Google Driveの指定フォルダを監…
★ 7 MIT 2026-06-22
ComfyUI GitHub comfyui-clippy-reloaded
Clippy Reloaded for ComfyUIは、クリップボードから画像を直接ComfyUIのワークフローに読み込むためのツールです。…
★ 7 ⑂ 3 2026-06-07
LLM GitHub a-agent
a-agentは、ターミナルベースのワークフロー向けに最適化された、単一ファイルのAIコーディングエージェントです。特…
★ 7 MIT 2026-05-19
ASR / 音声認識 GitHub tastebench
Tastebenchは、ウェブサイト、音楽、ビデオなどのコンテンツの「好み」を定量的に分析し、改善点を提示する自己評価…
★ 7 ⑂ 1 MIT 2026-05-19
画像生成 GitHub comfyui-lance-aio
ComfyUI Lance AIOは、ByteDance Lance-3BモデルをComfyUIで実行するためのカスタムノードを提供するリポジトリです…
★ 7 ⑂ 2 MIT 2026-06-08
ASR / 音声認識 GitHub Fast-Sub
Fast Subは、動画および音声ファイル用のローカルファーストの字幕ツールです。字幕の生成と翻訳を、ユーザーのデバ…
★ 7 MIT 2026-06-23
音声生成 / TTS GitHub Local-TTS-studio
Open TTSは、サーバーやAPIキーなしでデバイス上で完結する、ローカルファーストのテキスト読み上げ(TTS)スタジオ…
★ 7 Apache-2.0 2026-06-23
3D / NeRF GitHub interactive-website-navigator
このツールは、ウェブサイト訪問者をリアルタイムの音声と画面認識でガイドし、アクションを実行できるインタラクテ…
★ 7 MIT 2026-05-17
画像生成 GitHub ltx2-vidgen-skill
この「ltx2-vidgen-skill」は、AIビデオ生成パイプラインを自社で所有・運用できるClaude Codeスキルです。写真一枚…
★ 7 ⑂ 1 NOASSERTION 2026-06-11
LLM GitHub RAG-Roadmap-with-Notes-and-Projects
このリポジトリは、Retrieval-Augmented Generation(RAG)の学習に特化した、基礎から本番環境でのエージェントRAG…
★ 7 MIT 2026-06-21
ASR / 音声認識 GitHub MavKa
MavKaは、Telegramと連携するAIボットであり、ローカルで動作するコーディングエージェントです。ChatGPT Plusの代替…
★ 7 ⑂ 1 MIT 2026-05-10
AIエージェント GitHub Operon
Operonは、高度な自律型AIターミナルコックピットです。OpenClawとHermes Agentの機能を統合し、ファイル管理、ウェ…
★ 7 ⑂ 1 MIT 2026-06-01
音声生成 / TTS GitHub okay-hermes-voice
「Okay Hermes Voice」は、既存の「Hermes Agent」に「Okay Hermes」というウェイクフレーズを追加し、常に音声で操…
★ 7 NOASSERTION 2026-06-29
動画生成 GitHub Awesome-Gemini-Omni-API-Prompts
このリポジトリは、Googleのマルチモーダル動画モデル「Gemini Omni」向けの高品質なプロンプトとパターンを厳選して…
★ 7 ⑂ 1 CC0-1.0 2026-07-01
画像生成 GitHub sd-faceswap
このツールは、Stable Diffusion WebUI用の高速な顔交換拡張機能「sd-faceswap」です。InsightFaceによる効率的な顔…
★ 7 MIT 2026-05-19
LLM GitHub Claude-Agentic-Skills2.0-version
vignesh2027/Claude-Agentic-Skills2.0-versionは、Anthropic社のClaude AI向けの「AgentOS 2.0」として、135以上の…
★ 7 MIT 2026-05-20
3D / NeRF GitHub stechdrive-3dgs-utils
このツールは、360度カメラで撮影した動画を、3D Gaussian Splatting(3DGS)のトレーニングに利用できる画像、マス…
★ 7 MIT 2026-05-31
マルチモーダル GitHub CaptionEvalKit-for-VLMs
CaptionEvalKit-for-VLMsは、VLM(Visual Language Model)向け画像キャプション評価を再現性高く、オールインワンで…
★ 7 BSD-3-Clause-Clear 2026-06-22
音声生成 / TTS GitHub book-v2-audio
このツールは、FB2形式の電子書籍をAIによる文学的な解説付きのオーディオブックに変換するデスクトップアプリケーシ…
★ 7 ⑂ 4 MIT 2026-05-24
音声生成 / TTS GitHub lora-cosyvoice123-chanting
このリポジトリは、中国語の古詩詞吟誦に特化したCosyVoice 1/2/3 LoRA微調整実験フレームワークです。CosyVoiceの三…
★ 7 2026-06-18