3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub minimax-hub
このツールは、MiniMaxのAI生成機能をCodex CLIに統合するためのスキルです。画像生成、動画生成、音声合成(多言語…
★ 1 MIT 2026-05-29
ASR / 音声認識 GitHub spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
音声生成 / TTS GitHub md-tts
md-ttsは、技術的なMarkdownファイルを音声で読み上げ、コードブロック、テーブル、フラッシュカードで再生をインタ…
★ 1 MIT 2026-06-04
3D / NeRF GitHub splat-slim
splat-slimは、3D Gaussian Splatting(3DGS)モデルを再トレーニングせずに軽量化するためのツールです。既存の.ply…
★ 1 MIT 2026-06-14
画像生成 GitHub generative-modeling-scientific
このリポジトリは、科学計算タスクに適用されるスコアベースの生成モデルの研究用ベンチマークフレームワークです。…
★ 1 2026-06-13
画像生成 GitHub AI-FASHION-SHOPPING-ASSISTANT-CHATBOT
このツールは、Stable Diffusion v1.5 を活用したAIファッションショッピングアシスタントチャットボットです。ユー…
★ 1 2026-05-17
音声生成 / TTS GitHub tts-blendr
VoiceBlend-TUIは、Textualフレームワークで構築されたターミナルUI(TUI)アプリケーションです。テキストファイル…
★ 1 2026-04-29
ComfyUI GitHub comfyui-prompt-editor
「comfyui-prompt-editor」は、ComfyUIの複数行プロンプトウィジェットをフルスクリーンでタッチ操作可能にするエデ…
★ 1 ⑂ 1 MIT 2026-06-13
ComfyUI GitHub vram8gb_comfyui_wan2.2
vram8gb_comfyui_wan2.2は、8GBのVRAMを持つミドルレンジGPU環境に最適化されたComfyUIワークフローです。Wan2.2(14…
★ 1 2026-06-25
画像生成 GitHub Brain-MRI-Generation-and-Segmentation
このリポジトリは、膠芽腫セグメンテーションのための合成T1c脳MRIスキャン生成に関する修士論文に付随するものです…
★ 1 2026-06-09
マルチモーダル GitHub mlx-mtp
mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…
★ 1 Apache-2.0 2026-06-16
音声生成 / TTS GitHub speech-mcp
Speech-MCPは、身体化エージェントやヒューマノイド向けに設計された多機能な音声ゲートウェイです。Alibaba FunASR…
★ 1 ⑂ 1 2026-06-17
3D / NeRF GitHub gaussian-splatter
「Gaussian Splatter / Particle Generator」は、ブラウザベースのThree.jsとGPGPUを活用したパーティクルビューアお…
★ 1 MIT 2026-06-15
ASR / 音声認識 GitHub carefulWhisper
carefulWhisperは、FastAPIとfaster-whisperを基盤とした、ローカルで動作する高速な音声認識(Speech-to-Text)バッ…
★ 1 2026-05-24
マルチモーダル GitHub ENOSES
「SEOSIRI ENOSES CORE ARCHITECT」は、物理的な音響波と光学データをリアルタイムのロボットコマンドに変換するマル…
★ 1 MIT 2026-05-17
画像生成 GitHub sonauto-ai-music-gen-saas
Sonautoは、言葉で表現したサウンドから、AIが作詞、オリジナルメロディの作曲、ユニークなカバーアート生成までを一…
★ 1 Apache-2.0 2026-05-14
LLM GitHub Drishti
Drishtiは、コードとドキュメントの理解を深めるためのマルチモーダルなRAG(検索拡張生成)システムです。Tree-sitt…
★ 1 MIT 2026-06-01
画像生成 GitHub Pic2Pic
EGFanTuan/Pic2Picは、Stable DiffusionとControlNetを基盤とした対話型の「草図から画像」生成ツールです。手書きの…
★ 1 2026-06-11
画像生成 GitHub neural-flow-surrogates
「neural-flow-surrogates」は、多孔質媒体におけるCO₂/ブラインの二相流シミュレーションを高速化するためのニュー…
★ 1 MIT 2026-05-26
動画生成 GitHub NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
ASR / 音声認識 GitHub AKIRA-AI-Voice-Assistant
AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…
★ 1 2026-06-08
動画生成 GitHub automate_me
「automate_me」は、YouTube動画制作を完全に自動化するフルスタックのウェブアプリケーションです。単一のダッシュ…
★ 1 MIT 2026-06-12
音声生成 / TTS GitHub voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-17
音楽生成 GitHub CodeBeats
「CodeBeats」は、ソースコードを音楽へと変換する革新的なツールです。独自の解析エンジンが関数のメロディ、ループ…
★ 1 MIT 2026-04-16