3,639 repos GH 3,524 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2217 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
画像生成 GitHub gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 3 MIT 2026-05-08
ASR / 音声認識 GitHub smart-meeting-assistant
「拼好会-智能会議辅助系统」は、AIを活用したリアルタイム会議支援ソフトウェアです。PCの音声とマイク入力を同時に…
★ 3 2026-05-25
マルチモーダル GitHub kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
音声生成 / TTS GitHub supertonic_embeddings_trainer
Supertonic Embeddings Trainerは、SupertonicTTS向けのローカルボイスクローニングパイプラインです。WAVファイルを…
★ 3 MIT 2026-05-26
ASR / 音声認識 GitHub OmniVid
OmniVidは、YouTube、Bilibili、抖音、TikTokを含む1800以上の動画プラットフォームに対応した万能動画ダウンロード…
★ 3 2026-06-16
音声生成 / TTS GitHub ComfyUI_RH_VoxCPM
ComfyUI_RH_VoxCPMは、ComfyUIのノードベースワークフロー内でVoxCPMの機能を統合するプラグインです。これにより、…
★ 3 Apache-2.0 2026-06-28
動画生成 GitHub slope-studio
Slope Studioは、アイデアからYouTubeショート動画の公開までを自動化するAI駆動のショート動画スタジオです。1本あ…
★ 3 MIT 2026-06-15
マルチモーダル GitHub Crucible
Crucibleは、ロボットのデモンストレーションデータを評価・キュレーションするための多軸VLM(Vision-Language Mode…
★ 3 MIT 2026-05-10
マルチモーダル GitHub browserground
browsergroundは、ハイブリッドAIエージェント向けのローカルUIグラウンディングツールです。スクリーンショットとテ…
★ 3 2026-05-21
ComfyUI GitHub comfyui-library-finder
「comfyui-library-finder」は、ComfyUIのカスタムノードが特定のライブラリをインポートしているかを検出するための…
★ 3 ⑂ 2 GPL-3.0 2026-05-25
LLM GitHub PFD-toolkit
PFD Toolkitは、Future Death (PFD) レポートの収集、スクリーニング、テーマ発見といった手作業をAIで自動化し、構…
★ 3 ⑂ 1 AGPL-3.0 2026-06-22
3D / NeRF GitHub gaussian_lic_ros2
このツールは、LiDAR-Inertial-Camera Gaussian Splatting SLAMのROS2ネイティブポートであり、Gaussian-LIC/Gaussia…
★ 3 GPL-3.0 2026-06-21
マルチモーダル GitHub qw-register-helper
「qw-register-helper」は、Qwenアカウントのバッチ登録とアクティベーションを自動化するためのシンプルなツールで…
★ 3 ⑂ 2 MIT 2026-06-24
画像生成 GitHub CTGMWorkshop
このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…
★ 3 Unlicense 2026-06-23
音声生成 / TTS GitHub Audicle
Audicleは、保存した記事をパーソナルポッドキャストフィードに変換する自己ホスト型サービスです。記事のURLを貼り…
★ 3 NOASSERTION 2026-06-26
ASR / 音声認識 GitHub jp2zh-video-subs
このプロジェクトは、ローカルの日本語動画ファイルから簡体字中国語のSRT字幕を生成するCLIツールです。Qwen3-ASRと…
★ 3 2026-06-14
音声生成 / TTS GitHub epubvoice
EpubVoiceは、自己ホスト型の個人用EPUBリーダーで、テキスト読み上げ(TTS)機能を備えています。購読や制限がなく…
★ 3 ⑂ 1 2026-06-21
LLM GitHub grounded-forge
grounded-forgeは、複雑で反復的な作業を行うための、ソースに基づいたアシスタントを構築・配布するためのリトリー…
★ 3 MIT 2026-05-20
LLM GitHub Llaboratory
Llaboratoryは、LLMが架空のツールを使用する際の挙動を研究するための、自己ホスト可能なオープンソースの実験プラ…
★ 3 ⑂ 1 MIT 2026-06-26
音声生成 / TTS GitHub Stable-Audio-Insight
Stable Audio Insightは、Stability AIの「Stable Audio Open 1.0」を基盤としたWindows向けのローカルオーディオ生…
★ 3 NOASSERTION 2026-04-30
音声生成 / TTS GitHub AIBLI
AIBLIは、スクリプトから字幕付きショートビデオまでを一貫して自動生成する、AI仮想キャラクターの音声・動画合成パ…
★ 3 ⑂ 1 2026-05-17
ASR / 音声認識 GitHub athena-whisper
Athena Whisperは、ローカル環境で動作するデスクトップ向け音声入力ウィジェットです。faster-whisperを利用した高…
★ 3 ⑂ 2 2026-06-06
ComfyUI GitHub VisualBrowserNodes-by-LX
LXによるCivitaiビジュアルブラウザノードは、ComfyUIユーザーがローカルのLoRA、チェックポイント、拡散モデルを効…
★ 3 ⑂ 1 2026-05-11
3D / NeRF GitHub msplat
msplatは、Apple Silicon搭載Mac向けに最適化された高速な3Dガウススプラッティングツールです。ユーザーはコーディ…
★ 3 Apache-2.0 2026-06-22