3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
画像生成 GitHub LoRA-Dataset-Coach
「LoRA-Dataset-Coach」は、SDXLやFlux、Wanなどの写真・動画モデル向けLoRAトレーニングデータセットの準備、検証、…
★ 1 NOASSERTION 2026-06-05
ComfyUI GitHub niren-drama
泥人剧场 (Niren Drama) は、縦型ショートドラマ制作に特化したフルスタックAIプラットフォームです。このツールは、…
★ 1 MIT 2026-06-02
音楽生成 GitHub Intuitive_Music
「Intuitives DAW」は、従来の音楽制作の障壁を取り除き、誰もが気軽に音楽制作を楽しめるよう設計された、実験的な…
★ 1 MIT 2026-05-14
LLM GitHub Artificial_Intelligence_Driven_Electronic_Design_Automation
AIDEA(Artificial Intelligence Driven Electronic Design Automation)は、AIを活用して半導体設計プロセスを統合…
★ 1 ⑂ 1 2026-06-25
ComfyUI GitHub vram8gb_comfyui_wan2.2
vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2(14…
★ 1 2026-06-25
音声生成 / TTS GitHub lixaudio
LixAudioは、音声処理、音声認識(STT)、テキスト読み上げ(TTS)、セマンティック音声理解のためのモジュラーなPyt…
★ 1 ⑂ 1 GPL-3.0 2026-02-04
動画生成 GitHub seedance-2.0-api
Seedance 2.0 APIは、fal.aiを通じて提供されるByteDanceの最先端AI動画生成モデルです。テキスト、画像、または参照…
★ 1 ⑂ 1 MIT 2026-04-16
マルチモーダル GitHub control-sci
ControlMindは、MinerUを活用した科学文書インテリジェンスシステムです。生PDFから直接情報を抽出し、科学論文の理…
★ 1 NOASSERTION 2026-05-30
音楽生成 GitHub rl-beat-generation
このプロジェクトは、強化学習を用いてドラムビートを自動生成するPPOエージェントを開発しています。エージェントは…
★ 1 MIT 2026-05-10
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
AIエージェント GitHub traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
動画生成 GitHub PackForcing
PackForcingは、短尺動画での学習、長尺動画のサンプリング、長尺コンテキスト推論を容易にする動画モデルプロジェク…
★ 1 2026-06-24
LLM GitHub citeguard
CiteGuardは、ICML 2026で発表された、忠実な検索拡張生成(RAG)のための適合偽発見率制御ツールです。本ツールは、…
★ 1 MIT 2026-05-28
ASR / 音声認識 GitHub spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
画像生成 GitHub image_generations
「Partial Image」は、OpenAI GPT-image-2のストリーミング部分画像APIのデバッグとデモンストレーションを目的とし…
★ 1 MIT 2026-06-05
動画生成 GitHub NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
音楽生成 GitHub musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
音声生成 / TTS GitHub speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
ASR / 音声認識 GitHub VoxCore
VoxCoreは、サブ秒の低遅延で動作するオープンソースのリアルタイム音声AIエンジンです。ASR(自動音声認識)、LLM(…
★ 1 ⑂ 1 Apache-2.0 2026-05-28
画像生成 GitHub Stream_Mirror
StreamMirrorは、Webカメラの映像をリアルタイムでアニメ、水墨画、ファンタジー風といった様々なスタイルに変換する…
★ 1 MIT 2026-05-13
LLM GitHub builder-jobs-scraper
このツールは、企業採用ページからエンジニアリングの求人情報を収集し、Claudeを使って各役割を分類・要約し、レン…
★ 1 ⑂ 1 2026-06-28
画像生成 GitHub TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
3D / NeRF GitHub NeRF-Augmented-ViT
本プロジェクトは、NeRF (Neural Radiance Fields) を用いて合成RGB-Dデータを生成し、Vision Transformer (ViT) モ…
★ 1 MIT 2025-11-16
ComfyUI GitHub ComfyUI-lethris-dia2
このツールは、ComfyUI内で高品質なテキスト読み上げ(TTS)とキャプション生成を可能にするカスタムノードセットで…
★ 1 ⑂ 2 MIT 2025-12-12