3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
AIエージェント GitHub traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
LLM GitHub citeguard
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。本ツールは、…
★ 1 MIT 2026-05-28
ASR / 音声認識 GitHub spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
画像生成 GitHub image_generations
「Partial Image」は、OpenAI GPT-image-2のストリーミング部分画像APIのデバッグとデモンストレーションを目的とし…
★ 1 MIT 2026-06-05
動画生成 GitHub NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
音楽生成 GitHub musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
音声生成 / TTS GitHub speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
音声生成 / TTS GitHub voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-17
マルチモーダル GitHub ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
ComfyUI GitHub ComfyUI-Image-Compress
ComfyUI用のカスタムノードで、JPEGまたはPNG形式での画像圧縮を可能にします。エンコード品質と出力スケールを独立…
★ 1 ⑂ 1 MIT 2026-04-07
LLM GitHub Enterprise-RAG-Intelligence
Enterprise RAG Intelligenceは、ゼロトラスト検索、RBAC強制、および根拠に基づいた生成を提供するセキュアなエンタ…
★ 1 MIT 2026-05-31
音声生成 / TTS GitHub Podcast-this-tech-stuff
このツール「podcast-this-tech-stuff」は、あらゆる技術文書(PDF、スライド、プレーンテキスト、Googleドキュメン…
★ 1 MIT 2026-05-19
音声生成 / TTS GitHub narrateflow
NarrateFlowは、PPTやドキュメントを音声クローン、タイムライン調整、リタイムド動画合成機能を備えたナレーション…
★ 1 ⑂ 1 Apache-2.0 2026-06-14
LLM GitHub tesm
TESM(Token-Entangled State Machine)は、状態空間モデルと局所的なエンタングルメントメカニズムを組み合わせた革…
★ 1 MIT 2026-06-08
3D / NeRF GitHub NeRF-Augmented-ViT
本プロジェクトは、NeRF (Neural Radiance Fields) を用いて合成RGB-Dデータを生成し、Vision Transformer (ViT) モ…
★ 1 MIT 2025-11-16
ComfyUI GitHub ComfyUI-lethris-dia2
このツールは、ComfyUI内で高品質なテキスト読み上げ(TTS)とキャプション生成を可能にするカスタムノードセットで…
★ 1 ⑂ 2 MIT 2025-12-12
ASR / 音声認識 GitHub TEL-Voice-Controlled-Smart-Home-Assistant
このツールは、モジュール式のスマートホームアシスタントシステムです。React製のモダンなウェブインターフェースと…
★ 1 2026-06-05
音楽生成 GitHub Melodic-Intelligence-Layer
MIL(Melodic Intelligence Layer)は、ニューラルネットワークを使わずに数学理論に基づいたアルゴリズムによるピア…
★ 1 Apache-2.0 2026-04-05
LLM GitHub whiskershelf
AI WhiskerShelfは、ローカルで動作するLLM(大規模言語モデル)駆動の論文ライブラリマネージャーです。PDFファイル…
★ 1 MIT 2026-06-07
音声生成 / TTS GitHub sharky-ai-terminal
SHARKY AIは、アニメーション化されたネオンボイスオーブとハンズフリー音声チャット機能を備えた、ターミナル専用の…
★ 1 2026-06-14
LLM GitHub Repo-Sage
RepoSageは、開発者やエンジニアリングチーム向けの100%オフラインのAgentic GraphRAGシステムです。GitHubリポジト…
★ 1 2026-06-15
ComfyUI GitHub Unified-Vision-Prompt-Generator
ComfyUI向けのプロンプト生成ツールで、画像内容をもとに各種マルチモーダルLLMからキャプションや生成用プロンプト…
★ 1 ⑂ 1 2025-11-20