3,631 repos GH 3,516 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2215 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
LLM GitHub Artificial_Intelligence_Driven_Electronic_Design_Automation
AIDEA(Artificial Intelligence Driven Electronic Design Automation)は、AIを活用して半導体設計プロセスを統合…
★ 1 ⑂ 1 2026-06-25
ComfyUI GitHub vram8gb_comfyui_wan2.2
vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2(14…
★ 1 2026-06-25
音声生成 / TTS GitHub lixaudio
LixAudioは、音声処理、音声認識(STT)、テキスト読み上げ(TTS)、セマンティック音声理解のためのモジュラーなPyt…
★ 1 ⑂ 1 GPL-3.0 2026-02-04
マルチモーダル GitHub local-asset-gen-mcp
このプロジェクトは、テキストから画像、音楽/音声、音声、さらに画像やテキストから3Dモデルを生成できるローカルAI…
★ 1 GPL-3.0 2026-03-28
音声生成 / TTS GitHub mlx-indextts-webui
このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…
★ 1 NOASSERTION 2026-05-20
AIエージェント GitHub pi-context-pruner
pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…
★ 1 2026-06-24
マルチモーダル GitHub control-sci
ControlMindは、MinerUを活用した科学文書インテリジェンスシステムです。生PDFから直接情報を抽出し、科学論文の理…
★ 1 NOASSERTION 2026-05-30
音楽生成 GitHub rl-beat-generation
このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…
★ 1 MIT 2026-05-10
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
AIエージェント GitHub traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
LLM GitHub citeguard
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。本ツールは、…
★ 1 MIT 2026-05-28
ASR / 音声認識 GitHub spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
画像生成 GitHub image_generations
「Partial Image」は、OpenAI GPT-image-2のストリーミング部分画像APIのデバッグとデモンストレーションを目的とし…
★ 1 MIT 2026-06-05
動画生成 GitHub NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
音楽生成 GitHub musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
音声生成 / TTS GitHub speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
LLM GitHub CareerScan
CareerScanは、AIを活用した履歴書分析ツールです。PDF形式の履歴書と職務記述書をアップロードすると、LLaMA 3.3-70…
★ 1 2026-05-13
3D / NeRF GitHub classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
マルチモーダル GitHub corpus-mill
「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画(人物…
★ 1 Apache-2.0 2026-05-06
動画生成 GitHub TechDemoForge
TechDemoForgeは、技術的なREADME、仕様書、コードなどの情報源から、正確で構造化されたデモビデオを自動生成するロ…
★ 1 MIT 2026-04-12
LLM GitHub Scalable-RAG-Application
このツールは、スケーラブルで低遅延、高信頼性のAI駆動型情報検索を実現する、プロダクショングレードのマルチエー…
★ 1 2026-06-01
画像生成 GitHub TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
3D / NeRF GitHub NeRF-Augmented-ViT
本プロジェクトは、NeRF (Neural Radiance Fields) を用いて合成RGB-Dデータを生成し、Vision Transformer (ViT) モ…
★ 1 MIT 2025-11-16