3,627 repos GH 3,512 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2212 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

ComfyUI
GitHub
ComfyUI-Metadata-Tools
ComfyUI向けのカスタムノード集で、画像メタデータの読み取り・付与・保存をワークフロー内で完結できます。画像読み…
★ 1 ⑂ 1 MIT 2026-01-15
3D / NeRF
GitHub
perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
LLM
GitHub
awesome-opd
「Awesome On-Policy Distillation」は、強化学習におけるOn-Policy Distillation (OPD) に関する厳選されたリソース…
★ 1 2026-05-15
ASR / 音声認識
GitHub
panakoes
Panakoesは、音声のキャプチャ、文字起こし、AIによるインサイト抽出を提供するオープンソースのクラウドプラットフ…
★ 1 MIT 2026-06-29
LLM
GitHub
AI-Arena-History
「Arena AI Model Elo History」は、主要AIラボ(OpenAI、Anthropic、Googleなど)のフラッグシップAIモデルの公開El…
★ 1 MIT 2026-06-27
ASR / 音声認識
GitHub
whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
AIエージェント
GitHub
traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
動画生成
GitHub
PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
LLM
GitHub
citeguard
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。本ツールは、…
★ 1 MIT 2026-05-28
ASR / 音声認識
GitHub
spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
画像生成
GitHub
image_generations
「Partial Image」は、OpenAI GPT-image-2のストリーミング部分画像APIのデバッグとデモンストレーションを目的とし…
★ 1 MIT 2026-06-05
動画生成
GitHub
NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
音楽生成
GitHub
musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
音声生成 / TTS
GitHub
speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
音声生成 / TTS
GitHub
SoviaMate
SoviaMateは、エンドツーエンドの音声対話システム(SDS)構築に向けたオープンな研究プロジェクトです。特に、大規…
★ 1 Apache-2.0 2026-05-18
マルチモーダル
GitHub
zero-shot-video-classifier
このツールは、ビジョン言語基盤モデル(CLIP、SigLIP 2、X-CLIP)を用いたゼロショット動画分類器です。タスク固有…
★ 1 2026-06-09
AIエージェント
GitHub
agentic-experiments
agentic-experimentsは、AIエージェント(特にClaude Code)を用いてML実験を行う研究者向けに設計されたツールです…
★ 1 ⑂ 1 MIT 2026-06-26
LLM
GitHub
multi-agent-recovery-pipeline
この「Multi-Agent Failure Recovery Pipeline」は、大規模言語モデル(LLM)が自身の誤答を自動で検知し、修正する…
★ 1 2026-05-23
ComfyUI
GitHub
ComfyUI-lethris-dia2
このツールは、ComfyUI内で高品質なテキスト読み上げ(TTS)とキャプション生成を可能にするカスタムノードセットで…
★ 1 ⑂ 2 MIT 2025-12-12
ASR / 音声認識
GitHub
TEL-Voice-Controlled-Smart-Home-Assistant
このツールは、モジュール式のスマートホームアシスタントシステムです。React製のモダンなウェブインターフェースと…
★ 1 2026-06-05
音楽生成
GitHub
Melodic-Intelligence-Layer
MIL(Melodic Intelligence Layer)は、ニューラルネットワークを使わずに数学理論に基づいたアルゴリズムによるピア…
★ 1 Apache-2.0 2026-04-05
LLM
GitHub
whiskershelf
AI WhiskerShelfは、ローカルで動作するLLM(大規模言語モデル)駆動の論文ライブラリマネージャーです。PDFファイル…
★ 1 MIT 2026-06-07
音声生成 / TTS
GitHub
sharky-ai-terminal
SHARKY AIは、アニメーション化されたネオンボイスオーブとハンズフリー音声チャット機能を備えた、ターミナル専用の…
★ 1 2026-06-14
LLM
GitHub
Repo-Sage
RepoSageは、開発者やエンジニアリングチーム向けの100%オフラインのAgentic GraphRAGシステムです。GitHubリポジト…
★ 1 2026-06-15