3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2216 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
panakoes
Panakoesは、音声のキャプチャ、文字起こし、AIによるインサイト抽出を提供するオープンソースのクラウドプラットフ…
★ 1 MIT 2026-06-29
3D / NeRF
GitHub
GaussianSplatsGradientFlow
このプロジェクトは、「3D Gaussian Splatting for Real-Time Radiance Field Rendering」に記述されているGaussian …
★ 1 2026-05-16
ASR / 音声認識
GitHub
AI-VERSE
「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…
★ 1 2026-05-21
ASR / 音声認識
GitHub
smart-class-attendance
「Sureshjangid99/smart-class-attendance」は、顔認識技術を活用した自動クラス出席管理システムです。教師が出席を…
★ 1 2026-04-27
ASR / 音声認識
GitHub
whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
LLM
GitHub
contextcontrol
ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル(LLM)の利用、およびパッチワークフ…
★ 1 ⑂ 2 NOASSERTION 2026-05-31
マルチモーダル
GitHub
PrismRAG
PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…
★ 1 MIT 2026-06-20
音楽生成
GitHub
Conditional-Music-Generation
このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…
★ 1 MIT 2026-05-12
AIエージェント
GitHub
orchestrate-skill
「orchestrate」は、Claude Code向けの脳と身体のオーケストレーションスキルです。Claudeを主要な推論者(脳)とし…
★ 1 MIT 2026-06-13
音声生成 / TTS
GitHub
meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
画像生成
GitHub
AI-FASHION-SHOPPING-ASSISTANT-CHATBOT
このツールは、Stable Diffusion v1.5 を活用したAIファッションショッピングアシスタントチャットボットです。ユー…
★ 1 2026-05-17
音楽生成
GitHub
rl-beat-generation
このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…
★ 1 MIT 2026-05-10
ASR / 音声認識
GitHub
VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
vision-bridge
Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…
★ 1 NOASSERTION 2026-06-12
LLM
GitHub
seas
SEASとArgoは、AIの最前線で働くための補完的なシステムです。SEASはフロンティアのシグナルから「何が真実か」を探…
★ 1 NOASSERTION 2026-06-26
ASR / 音声認識
GitHub
funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14
マルチモーダル
GitHub
pdf2md_skill
「PDF2MD」は、Claude Codeスキルとして提供されるPDFからMarkdownへの変換ツールです。特にカスタムフォント、埋め…
★ 1 MIT 2026-06-07
ComfyUI
GitHub
comfyui-weaver
comfyui-weaverは、Claude CodeがComfyUI(ローカルおよびComfy Cloud)を操作できるようにする自己完結型MCPサーバ…
★ 1 MIT 2026-06-11
3D / NeRF
GitHub
gaussian-splatter
「Gaussian Splatter / Particle Generator」は、ブラウザベースのThree.jsとGPGPUを活用したパーティクルビューアお…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
マルチモーダル
GitHub
ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
音楽生成
GitHub
anvil-audio
Anvil Audioは、AIオーディオ生成のためのプラグ可能なスタジオツールであり、Stability AIの`stable-audio-tools`を…
★ 1 MIT 2026-05-13
マルチモーダル
GitHub
invoice-extractor
この「Invoice Extraction System」は、VLM(Vision Language Models)を活用して、請求書や領収書から構造化された…
★ 1 2026-06-07
LLM
GitHub
OracleBase
Oracleは、Agnoを基盤とした自律型AIコーディングエージェントです。CLIまたはWeb UIを通じて、コードの読み書き、編…
★ 1 MIT 2026-06-15