3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音楽生成

GitHub

Conditional-Music-Generation

このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…

#Audio Analysis #CLI #MIDI

★ 1 MIT 2026-05-12

AIエージェント

GitHub

orchestrate-skill

「orchestrate」は、Claude Code向けの脳と身体のオーケストレーションスキルです。Claudeを主要な推論者（脳）とし…

#AI / LLM #Claude Code #CLI

★ 1 MIT 2026-06-13

音声生成 / TTS

GitHub

meloie

Meloieは、リアルタイムで動作するRVC（Retrieval-based Voice Conversion）ボイスチェンジャーのバージョン2です。…

#CLI #GPU必須 #GUI

★ 1 MIT 2026-06-15

AIエージェント

GitHub

deepscene

DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…

#CLI #Gemini Flash対応 #Linux対応

★ 1 MIT 2026-05-14

音楽生成

GitHub

rl-beat-generation

このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-10

ASR / 音声認識

GitHub

VoiceAgentAI

このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識（STT）と音声合成（TTS）をシー…

#CLI #OpenAI API連携 #Python

★ 1 MIT 2026-05-25

マルチモーダル

GitHub

vision-bridge

Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…

#CLI #GPU/CPU対応 #LLM連携

★ 1 NOASSERTION 2026-06-12

LLM

GitHub

seas

SEASとArgoは、AIの最前線で働くための補完的なシステムです。SEASはフロンティアのシグナルから「何が真実か」を探…

#AI Research Engine #CLI #Decision Engine

★ 1 NOASSERTION 2026-06-26

ASR / 音声認識

GitHub

funasr-whisper-api

このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…

#CLI #GPU必須 #OpenAI Whisper API互換

★ 1 MIT 2026-06-14

マルチモーダル

GitHub

pdf2md_skill

「PDF2MD」は、Claude Codeスキルとして提供されるPDFからMarkdownへの変換ツールです。特にカスタムフォント、埋め…

#Claude Code Skill #CLI #LaTeX対応

★ 1 MIT 2026-06-07

ComfyUI

GitHub

comfyui-weaver

comfyui-weaverは、Claude CodeがComfyUI（ローカルおよびComfy Cloud）を操作できるようにする自己完結型MCPサーバ…

#ComfyUI対応 #MCP #Python

★ 1 MIT 2026-06-11

画像生成

GitHub

KinetiDiff

KinetiDiffは、進行性骨化性線維異形成症（FOP）の原因となるACVR1受容体を標的とするキナーゼ阻害剤を設計するため…

#CLI #GPU必須 #Linux/macOS

★ 1 MIT 2026-06-25

画像生成

GitHub

DSCA-ReID-Framework

本リポジトリは、人再識別における「拡散ベースのセマンティックカモフラージュ攻撃（DSCA）」に特化した軽量なPyTor…

#CLI #GPU必須 #Python

★ 1 MIT 2026-05-28

LLM

GitHub

knowshelf

「Knowshelf」は、Go言語で書かれた個人用Markdown書籍知識ベース管理ツールです。Markdown形式の書籍をローカルのSQ…

#CLI #Go #Markdown

★ 1 Apache-2.0 2026-05-18

動画生成

GitHub

seedance-2.0-api

Seedance 2.0 APIは、fal.aiを通じて提供されるByteDanceの最先端AI動画生成モデルです。テキスト、画像、または参照…

#AI #API #fal.ai

★ 1 ⑂ 1 MIT 2026-04-16

LLM

GitHub

visually-guided-subtitle-translation

このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…

#CLI #GPU必須 #Python

★ 1 Apache-2.0 2026-05-20

音楽生成

GitHub

anvil-audio

Anvil Audioは、AIオーディオ生成のためのプラグ可能なスタジオツールであり、Stability AIの`stable-audio-tools`を…

#CLI #GPU対応 #macOS対応

★ 1 MIT 2026-05-13

マルチモーダル

GitHub

invoice-extractor

この「Invoice Extraction System」は、VLM（Vision Language Models）を活用して、請求書や領収書から構造化された…

#PostgreSQL #Python #REST API

★ 1 2026-06-07

LLM

GitHub

OracleBase

Oracleは、Agnoを基盤とした自律型AIコーディングエージェントです。CLIまたはWeb UIを通じて、コードの読み書き、編…

#CLI #Python #Web UI

★ 1 MIT 2026-06-15

音声生成 / TTS

GitHub

Narracast

Narracastは、macOSユーザー向けのオフライン音声コンテンツ生成ツールです。任意のテキストを貼り付けるだけで、ク…

#F5-TTS #macOS #PySide6

★ 1 MIT 2026-06-09

3D / NeRF

GitHub

Marble-x-Nuke

「Marble x Nuke」は、Nuke 17+にWorld Labs Marble APIを統合したツールです。コンポジターやVFXアーティストは、テ…

#3D #AI生成 #API連携

★ 1 MIT 2026-05-11

マルチモーダル

GitHub

miru

Miru（見る）は、マルチモーダルAIモデルの「ブラックボックス」問題を解決するための説明可能性エンジンです。画像…

#CLI #FastAPI #Python

★ 1 2026-06-22

画像生成

GitHub

ComfyUI_SparkVSR_SM

ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…

#AI/機械学習 #ComfyUI対応 #GPU必須

★ 1 Apache-2.0 2026-06-22

ASR / 音声認識

GitHub

zox-ai

Zox AIは、OllamaとLlama 3.1 8Bモデルを基盤とした、完全にオフラインで動作するWindows向けのAIデスクトップアシス…

#GUI #LLM #Python

★ 1 NOASSERTION 2026-06-10