3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音楽生成
GitHub
synt-audio
Auratuneは、Lofi Girlのような没入型体験にインスパイアされた、Lo-fiスタイルのデジタルコンテンツ作成システムで…
★ 1 2026-04-21
LLM
GitHub
megatrain-guide-cn
MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…
★ 1 MIT 2026-04-17
画像生成
GitHub
EdgeDiffusion
EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…
★ 1 2026-06-07
3D / NeRF
GitHub
project_slam_gs3lam
GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM(…
★ 1 2026-04-04
ASR / 音声認識
GitHub
language-violence-intervention-system
本プロジェクトは、プライバシーを重視したエッジAIによる言語暴力検出および能動的介入システムです。Raspberry Pi …
★ 1 ⑂ 1 Apache-2.0 2026-06-25
マルチモーダル
GitHub
Qwen-Image-Edit-Object-Manipulator
Qwen-Image-Edit-Object-Manipulatorは、画像内のオブジェクトを簡単かつ高精度に操作できるツールです。ロゴ、アク…
★ 1 ⑂ 1 Apache-2.0 2026-06-25
ASR / 音声認識
GitHub
AKIRA-AI-Voice-Assistant
AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…
★ 1 2026-06-08
マルチモーダル
GitHub
invoice-extractor
この「Invoice Extraction System」は、VLM(Vision Language Models)を活用して、請求書や領収書から構造化された…
★ 1 2026-06-07
動画生成
GitHub
happy-horse-api
Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
mm-docqa
Jmiao11/mm-docqaは、図とテキストが混在するPDF(特に論文の図表を含む)の内容に対して質問し、引用元付きの回答を…
★ 1 MIT 2026-06-23
画像生成
GitHub
GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
AIエージェント
GitHub
coder-crew
coder-crewは、テスト駆動型のエージェントAIコーディングツールです。マネージャーモデルがコーディングタスクをサ…
★ 1 MIT 2026-06-18
ASR / 音声認識
GitHub
dreamjournal-bot
「Dream Journal Bot」は、Telegramプラットフォームで動作する革新的な夢日記ボットです。本ボットの最大の特徴は、…
★ 1 2026-06-18
ComfyUI
GitHub
GeoNodes
GeoNodes は、ComfyUI 上で YOLO ベースの物体検出モデルを学習・推論できるノード群です。学習設定を作る「YOLO Tra…
★ 1 ⑂ 1 2025-10-08
マルチモーダル
GitHub
vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-14
LLM
GitHub
Multi-Agent-Data-Analytics
本プロジェクトは、マルチエージェントアーキテクチャとRAG(検索拡張生成)システム、GoogleのGeminiモデルを組み合…
★ 1 Apache-2.0 2026-05-15
ASR / 音声認識
GitHub
The-Earful-Tower
「The Earful Tower」は、ローカル環境で動作する高性能な音声文字起こし・話者分離ツールです。Whisper large-v3モ…
★ 1 MIT 2026-06-13
ASR / 音声認識
GitHub
kokkai-webtv-captions
「kokkai-webtv-captions」は、国立国会図書館の国会会議録が公式に公開されるまでの未収録期間を埋めるための個人用…
★ 1 MIT 2026-05-25
LLM
GitHub
yuri-os
Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー(DAG)を設計し、…
★ 1 2026-06-04
音声生成 / TTS
GitHub
claude-speech-skill
「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…
★ 1 MIT 2026-06-21
音声生成 / TTS
GitHub
Voice-Command
Voice-Commandは、AI(Claude Desktop、Cowork、Claude Code、Codex CLI、Gemini CLI、LM Studioなど)を音声で完全…
★ 1 ⑂ 1 Apache-2.0 2026-06-23
ComfyUI
GitHub
ComfyUI-Flux2KontextConditioner
ComfyUI-Flux2KontextConditionerは、ComfyUIのFlux2 Kontext - Klein画像編集ワークフローを強化する高度なコンディ…
★ 1 ⑂ 1 MIT 2026-06-01
動画生成
GitHub
explainer-video
本ツールは、Claude Codeのスキルおよびプラグインとして機能し、製品のスクリーンショットや画面録画から、ナレーシ…
★ 1 MIT 2026-06-10
ASR / 音声認識
GitHub
voiceintake
「VoiceIntake」は、AIを活用して患者の音声問診を自動化するシステムです。患者が話すだけでAIが問診内容を瞬時に文…
★ 1 2026-06-16