3,631 repos GH 3,516 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2215 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

LLM
GitHub
Artificial_Intelligence_Driven_Electronic_Design_Automation
AIDEA(Artificial Intelligence Driven Electronic Design Automation)は、AIを活用して半導体設計プロセスを統合…
★ 1 ⑂ 1 2026-06-25
ComfyUI
GitHub
vram8gb_comfyui_wan2.2
vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2(14…
★ 1 2026-06-25
音声生成 / TTS
GitHub
lixaudio
LixAudioは、音声処理、音声認識(STT)、テキスト読み上げ(TTS)、セマンティック音声理解のためのモジュラーなPyt…
★ 1 ⑂ 1 GPL-3.0 2026-02-04
マルチモーダル
GitHub
local-asset-gen-mcp
このプロジェクトは、テキストから画像、音楽/音声、音声、さらに画像やテキストから3Dモデルを生成できるローカルAI…
★ 1 GPL-3.0 2026-03-28
音声生成 / TTS
GitHub
mlx-indextts-webui
このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…
★ 1 NOASSERTION 2026-05-20
AIエージェント
GitHub
pi-context-pruner
pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…
★ 1 2026-06-24
マルチモーダル
GitHub
control-sci
ControlMindは、MinerUを活用した科学文書インテリジェンスシステムです。生PDFから直接情報を抽出し、科学論文の理…
★ 1 NOASSERTION 2026-05-30
音楽生成
GitHub
rl-beat-generation
このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…
★ 1 MIT 2026-05-10
ASR / 音声認識
GitHub
whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
AIエージェント
GitHub
traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
動画生成
GitHub
PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
LLM
GitHub
citeguard
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。本ツールは、…
★ 1 MIT 2026-05-28
ASR / 音声認識
GitHub
spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
画像生成
GitHub
image_generations
「Partial Image」は、OpenAI GPT-image-2のストリーミング部分画像APIのデバッグとデモンストレーションを目的とし…
★ 1 MIT 2026-06-05
動画生成
GitHub
NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
音楽生成
GitHub
musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
音声生成 / TTS
GitHub
speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
LLM
GitHub
CareerScan
CareerScanは、AIを活用した履歴書分析ツールです。PDF形式の履歴書と職務記述書をアップロードすると、LLaMA 3.3-70…
★ 1 2026-05-13
3D / NeRF
GitHub
classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
マルチモーダル
GitHub
corpus-mill
「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画(人物…
★ 1 Apache-2.0 2026-05-06
動画生成
GitHub
TechDemoForge
TechDemoForgeは、技術的なREADME、仕様書、コードなどの情報源から、正確で構造化されたデモビデオを自動生成するロ…
★ 1 MIT 2026-04-12
LLM
GitHub
Scalable-RAG-Application
このツールは、スケーラブルで低遅延、高信頼性のAI駆動型情報検索を実現する、プロダクショングレードのマルチエー…
★ 1 2026-06-01
画像生成
GitHub
TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
3D / NeRF
GitHub
NeRF-Augmented-ViT
本プロジェクトは、NeRF (Neural Radiance Fields) を用いて合成RGB-Dデータを生成し、Vision Transformer (ViT) モ…
★ 1 MIT 2025-11-16