3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音楽生成 GitHub Conditional-Music-Generation
このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…
★ 1 MIT 2026-05-12
AIエージェント GitHub orchestrate-skill
「orchestrate」は、Claude Code向けの脳と身体のオーケストレーションスキルです。Claudeを主要な推論者(脳)とし…
★ 1 MIT 2026-06-13
音声生成 / TTS GitHub meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
AIエージェント GitHub deepscene
DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…
★ 1 MIT 2026-05-14
音楽生成 GitHub rl-beat-generation
このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…
★ 1 MIT 2026-05-10
ASR / 音声認識 GitHub VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
マルチモーダル GitHub vision-bridge
Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…
★ 1 NOASSERTION 2026-06-12
LLM GitHub seas
SEASとArgoは、AIの最前線で働くための補完的なシステムです。SEASはフロンティアのシグナルから「何が真実か」を探…
★ 1 NOASSERTION 2026-06-26
ASR / 音声認識 GitHub funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14
マルチモーダル GitHub pdf2md_skill
「PDF2MD」は、Claude Codeスキルとして提供されるPDFからMarkdownへの変換ツールです。特にカスタムフォント、埋め…
★ 1 MIT 2026-06-07
ComfyUI GitHub comfyui-weaver
comfyui-weaverは、Claude CodeがComfyUI(ローカルおよびComfy Cloud)を操作できるようにする自己完結型MCPサーバ…
★ 1 MIT 2026-06-11
画像生成 GitHub KinetiDiff
KinetiDiffは、進行性骨化性線維異形成症(FOP)の原因となるACVR1受容体を標的とするキナーゼ阻害剤を設計するため…
★ 1 MIT 2026-06-25
画像生成 GitHub DSCA-ReID-Framework
本リポジトリは、人再識別における「拡散ベースのセマンティックカモフラージュ攻撃(DSCA)」に特化した軽量なPyTor…
★ 1 MIT 2026-05-28
LLM GitHub knowshelf
「Knowshelf」は、Go言語で書かれた個人用Markdown書籍知識ベース管理ツールです。Markdown形式の書籍をローカルのSQ…
★ 1 Apache-2.0 2026-05-18
動画生成 GitHub seedance-2.0-api
Seedance 2.0 APIは、fal.aiを通じて提供されるByteDanceの最先端AI動画生成モデルです。テキスト、画像、または参照…
★ 1 ⑂ 1 MIT 2026-04-16
LLM GitHub visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20
音楽生成 GitHub anvil-audio
Anvil Audioは、AIオーディオ生成のためのプラグ可能なスタジオツールであり、Stability AIの`stable-audio-tools`を…
★ 1 MIT 2026-05-13
マルチモーダル GitHub invoice-extractor
この「Invoice Extraction System」は、VLM(Vision Language Models)を活用して、請求書や領収書から構造化された…
★ 1 2026-06-07
LLM GitHub OracleBase
Oracleは、Agnoを基盤とした自律型AIコーディングエージェントです。CLIまたはWeb UIを通じて、コードの読み書き、編…
★ 1 MIT 2026-06-15
音声生成 / TTS GitHub Narracast
Narracastは、macOSユーザー向けのオフライン音声コンテンツ生成ツールです。任意のテキストを貼り付けるだけで、ク…
★ 1 MIT 2026-06-09
3D / NeRF GitHub Marble-x-Nuke
「Marble x Nuke」は、Nuke 17+にWorld Labs Marble APIを統合したツールです。コンポジターやVFXアーティストは、テ…
★ 1 MIT 2026-05-11
マルチモーダル GitHub miru
Miru(見る)は、マルチモーダルAIモデルの「ブラックボックス」問題を解決するための説明可能性エンジンです。画像…
★ 1 2026-06-22
画像生成 GitHub ComfyUI_SparkVSR_SM
ComfyUI_SparkVSR_SMは、ComfyUI内で動画の超解像処理を行うWindows向けツールです。キーフレームとフレーム伝播の技…
★ 1 Apache-2.0 2026-06-22
ASR / 音声認識 GitHub zox-ai
Zox AIは、OllamaとLlama 3.1 8Bモデルを基盤とした、完全にオフラインで動作するWindows向けのAIデスクトップアシス…
★ 1 NOASSERTION 2026-06-10