3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識

GitHub

whisper-dictate

Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…

#CLI #Gemini API #Groq API

★ 1 NOASSERTION 2026-06-10

LLM

GitHub

contextcontrol

ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル（LLM）の利用、およびパッチワークフ…

#CLI #LLM #Ollama

★ 1 ⑂ 2 NOASSERTION 2026-05-31

マルチモーダル

GitHub

PrismRAG

PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…

#CLI #GPU必須 #Multimodal

★ 1 MIT 2026-06-20

音楽生成

GitHub

Conditional-Music-Generation

このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…

#Audio Analysis #CLI #MIDI

★ 1 MIT 2026-05-12

AIエージェント

GitHub

orchestrate-skill

「orchestrate」は、Claude Code向けの脳と身体のオーケストレーションスキルです。Claudeを主要な推論者（脳）とし…

#AI / LLM #Claude Code #CLI

★ 1 MIT 2026-06-13

音声生成 / TTS

GitHub

meloie

Meloieは、リアルタイムで動作するRVC（Retrieval-based Voice Conversion）ボイスチェンジャーのバージョン2です。…

#CLI #GPU必須 #GUI

★ 1 MIT 2026-06-15

マルチモーダル

GitHub

vlm-from-scratch

このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…

#GPU必須 #Hugging Face #Python

★ 1 MIT 2026-05-14

3D / NeRF

GitHub

DNP-3DDMR-IR

本リポジトリは、2D臨床サーモグラフィ画像から乳房の3D形状再構築と熱マッピングを行うための多段階研究パイプライ…

#GPU必須 #Jupyter Notebook #Python

★ 1 2026-06-23

ComfyUI

GitHub

Comfy_Storyboard

「ComfyUI Storyboard Workspace」は、ComfyUI向けのPureRef風ストーリーボード・リファレンスボード拡張機能です。…

#ComfyUI対応 #Python #Web UI

★ 1 MIT 2026-04-13

音楽生成

GitHub

rl-beat-generation

このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-10

ASR / 音声認識

GitHub

VoiceAgentAI

このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識（STT）と音声合成（TTS）をシー…

#CLI #OpenAI API連携 #Python

★ 1 MIT 2026-05-25

マルチモーダル

GitHub

vision-bridge

Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…

#CLI #GPU/CPU対応 #LLM連携

★ 1 NOASSERTION 2026-06-12

LLM

GitHub

seas

SEASとArgoは、AIの最前線で働くための補完的なシステムです。SEASはフロンティアのシグナルから「何が真実か」を探…

#AI Research Engine #CLI #Decision Engine

★ 1 NOASSERTION 2026-06-26

ASR / 音声認識

GitHub

funasr-whisper-api

このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…

#CLI #GPU必須 #OpenAI Whisper API互換

★ 1 MIT 2026-06-14

マルチモーダル

GitHub

pdf2md_skill

「PDF2MD」は、Claude Codeスキルとして提供されるPDFからMarkdownへの変換ツールです。特にカスタムフォント、埋め…

#Claude Code Skill #CLI #LaTeX対応

★ 1 MIT 2026-06-07

ComfyUI

GitHub

comfyui-weaver

comfyui-weaverは、Claude CodeがComfyUI（ローカルおよびComfy Cloud）を操作できるようにする自己完結型MCPサーバ…

#ComfyUI対応 #MCP #Python

★ 1 MIT 2026-06-11

3D / NeRF

GitHub

sam-3d-spark

sam-3d-sparkは、MetaのSAM 3D（BodyおよびObjects）モデルをNVIDIA DGX Spark環境（aarch64/CUDA 13）でローカル実…

#ComfyUI対応 #Docker #FastAPI

★ 1 NOASSERTION 2026-05-03

3D / NeRF

GitHub

classic_multiview_3d_recon

このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…

#3D再構成 #CLI #CUDA

★ 1 MIT 2026-05-10

動画生成

GitHub

seedance-2.0-api

Seedance 2.0 APIは、fal.aiを通じて提供されるByteDanceの最先端AI動画生成モデルです。テキスト、画像、または参照…

#AI #API #fal.ai

★ 1 ⑂ 1 MIT 2026-04-16

LLM

GitHub

visually-guided-subtitle-translation

このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-20

音楽生成

GitHub

anvil-audio

Anvil Audioは、AIオーディオ生成のためのプラグ可能なスタジオツールであり、Stability AIの`stable-audio-tools`を…

#CLI #GPU対応 #macOS対応

★ 1 MIT 2026-05-13

マルチモーダル

GitHub

invoice-extractor

この「Invoice Extraction System」は、VLM（Vision Language Models）を活用して、請求書や領収書から構造化された…

#PostgreSQL #Python #REST API

★ 1 2026-06-07

LLM

GitHub

OracleBase

Oracleは、Agnoを基盤とした自律型AIコーディングエージェントです。CLIまたはWeb UIを通じて、コードの読み書き、編…

#CLI #Python #Web UI

★ 1 MIT 2026-06-15

ASR / 音声認識

GitHub

VoxCore

VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR（自動音声認識）、LLM（…

#Docker #FastAPI #OpenAI互換

★ 1 ⑂ 1 Apache-2.0 2026-05-28