3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub language-violence-intervention-system
本プロジェクトは、プライバシーを重視したエッジAIによる言語暴力検出および能動的介入システムです。Raspberry Pi …
★ 1 ⑂ 1 Apache-2.0 2026-06-25
マルチモーダル GitHub Qwen-Image-Edit-Object-Manipulator
Qwen-Image-Edit-Object-Manipulatorは、画像内のオブジェクトを簡単かつ高精度に操作できるツールです。ロゴ、アク…
★ 1 ⑂ 1 Apache-2.0 2026-06-25
ASR / 音声認識 GitHub AKIRA-AI-Voice-Assistant
AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…
★ 1 2026-06-08
マルチモーダル GitHub invoice-extractor
この「Invoice Extraction System」は、VLM(Vision Language Models)を活用して、請求書や領収書から構造化された…
★ 1 2026-06-07
動画生成 GitHub happy-horse-api
Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…
★ 1 MIT 2026-05-25
マルチモーダル GitHub mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23
画像生成 GitHub GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
AIエージェント GitHub coder-crew
coder-crewは、テスト駆動型のエージェントAIコーディングツールです。マネージャーモデルがコーディングタスクをサ…
★ 1 MIT 2026-06-18
ASR / 音声認識 GitHub dreamjournal-bot
「Dream Journal Bot」は、Telegramプラットフォームで動作する革新的な夢日記ボットです。本ボットの最大の特徴は、…
★ 1 2026-06-18
ComfyUI GitHub ComfyUI-Metadata-Tools
ComfyUI向けのカスタムノード集で、画像メタデータの読み取り・付与・保存をワークフロー内で完結できます。画像読み…
★ 1 ⑂ 1 MIT 2026-01-15
マルチモーダル GitHub vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-14
LLM GitHub Multi-Agent-Data-Analytics
本プロジェクトは、マルチエージェントアーキテクチャとRAG(検索拡張生成)システム、GoogleのGeminiモデルを組み合…
★ 1 Apache-2.0 2026-05-15
ASR / 音声認識 GitHub The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
ASR / 音声認識 GitHub kokkai-webtv-captions
「kokkai-webtv-captions」は、国立国会図書館の国会会議録が公式に公開されるまでの未収録期間を埋めるための個人用…
★ 1 MIT 2026-05-25
LLM GitHub yuri-os
Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー(DAG)を設計し、…
★ 1 2026-06-04
音声生成 / TTS GitHub claude-speech-skill
「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…
★ 1 MIT 2026-06-21
音声生成 / TTS GitHub Voice-Command
Voice-Commandは、AI(Claude Desktop、Cowork、Claude Code、Codex CLI、Gemini CLI、LM Studioなど)を音声で完全…
★ 1 ⑂ 1 Apache-2.0 2026-06-23
ComfyUI GitHub ComfyUI-Flux2KontextConditioner
ComfyUI-Flux2KontextConditionerは、ComfyUIのFlux2 Kontext - Klein画像編集ワークフローを強化する高度なコンディ…
★ 1 ⑂ 1 MIT 2026-06-01
動画生成 GitHub explainer-video
本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…
★ 1 MIT 2026-06-10
ASR / 音声認識 GitHub voiceintake
「VoiceIntake」は、AIを活用して患者の音声問診を自動化するシステムです。患者が話すだけでAIが問診内容を瞬時に文…
★ 1 2026-06-16
ASR / 音声認識 GitHub Auto-Vod-Trimmer
Auto-Vod-Trimmerは、長いビデオ録画から興味深い瞬間を自動で検出し、短いハイライトクリップを作成するツールです…
★ 1 GPL-3.0 2026-06-26
3D / NeRF GitHub Panoptic-MapAnything
このプロジェクトは、既存の3Dパノプティックシーンセグメンテーション手法が持つ高コストな最適化や入力制約といっ…
★ 1 Apache-2.0 2026-04-13
画像生成 GitHub Deep-Learning-Models
本リポジトリは、ディープラーニングの主要な19種類のアーキテクチャをPyTorch、TensorFlow/Keras、純粋なPython/Num…
★ 1 MIT 2026-06-11
3D / NeRF GitHub perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09