3,631 repos GH 3,516 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2215 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub cosyvoice3-lora-finetuning
このリポジトリは、FunAudioLLM/CosyVoice v3 (Fun-CosyVoice3-0.5B) 向けのLoRAファインチューニングツールを提供し…
★ 10 NOASSERTION 2026-03-29
LLM GitHub vlm4ocr
vlm4ocrは、Vision Language Models (VLMs) を活用して高精度なOCR(光学文字認識)を可能にするPythonパッケージお…
★ 10 ⑂ 1 MIT 2026-05-05
LLM GitHub Auto-Read-Paper
Auto-Read-Paperは、arXivから最新論文を毎日自動で取得し、AIが読解・評価を行うパーソナル論文読解アシスタントで…
★ 10 ⑂ 9 AGPL-3.0 2026-06-03
画像生成 GitHub windinet
WinDiNetは、LTX-Videoビデオ拡散トランスフォーマーを都市の風の流れにおける計算流体力学(CFD)シミュレーション…
★ 10 ⑂ 3 Apache-2.0 2026-04-15
3D / NeRF GitHub Video-to-dataset
このツールは、ブレや重複、露出不足、動く物体によって3Dパイプラインが失敗する問題を解決するため、生の動画から…
★ 10 MIT 2026-03-29
ComfyUI GitHub Codex-Integration-with-Creative-Industry-Software
StarBridgeは、Windows環境で動作するローカルファーストのMCP stdioサーバーであり、AIエージェントをComfyUI、Blen…
★ 10 ⑂ 2 MIT 2026-06-24
画像生成 GitHub PromptReinjection
「Prompt Reinjection」は、マルチモーダル拡散トランスフォーマーにおいて発生する「プロンプト忘れ」問題に対処す…
★ 10 MIT 2026-05-20
LLM GitHub SWE-Model-Arena
SWE-Model-Arenaは、ソフトウェアエンジニアリングタスク向けのツール呼び出しモデルをペアで比較評価するためのオー…
★ 10 ⑂ 1 2026-04-04
画像生成 GitHub tmpd-public
Topological Motion Planning Diffusion(TMPD)は、障害物が多い環境で係留型ロボットが絡まない経路を生成するため…
★ 10 MIT 2026-04-09
LLM GitHub CasualGraph
CausalGraph AIは、ESGレポートなどの長文企業報告書を分析し、検索可能なエビデンス、グラフコンテキスト、引用付き…
★ 10 ⑂ 2 2026-05-29
音声生成 / TTS GitHub mimo-tts
MiMo TTSは、小米MiMo APIを活用したAIオーディオブック制作ツールです。小説のテキストファイルをアップロードする…
★ 10 ⑂ 1 MIT 2026-05-24
3D / NeRF GitHub 3D-RGBX
「3D-RGBX」は、CVPR 2026で注目された研究プロジェクトであり、キャリブレーションや深度情報なしで3Dの一貫性を保…
★ 10 ⑂ 2 MIT 2026-06-06
動画生成 GitHub ltx-video-mlx
ltx-video-mlxは、Apple Silicon(M1以降のMac)上でMLXを活用し、PyTorchなしでLTX-2.3モデル(22B)による高性能な…
★ 10 ⑂ 3 2026-04-11
ComfyUI GitHub ComfyUI-KittenTTS
ComfyUI-KittenTTSは、超軽量なKittenTTSテキスト読み上げモデルをComfyUIワークフローに統合するためのカスタムノー…
★ 10 ⑂ 3 Apache-2.0 2026-03-04
画像生成 GitHub Cross-Modality-Conditional-Diffusion-Model
このプロジェクトは、T1加重MRI画像とT2加重MRIスキャン間の医療画像モダリティ変換を行う、条件付き拡散モデルの実…
★ 10 MIT 2026-05-13
ComfyUI GitHub ComfyUI-LavaSR
ComfyUI-LavaSRは、高速な音声強調およびオーディオ超解像モデルであるLavaSRのためのComfyUIカスタムノードです。こ…
★ 10 ⑂ 1 MIT 2026-02-27
画像生成 GitHub pytorch-memory-fix
このツールは、PyTorch/Python環境で大規模な機械学習モデル(LLM、Diffusionモデルなど)を繰り返しロード・アンロ…
★ 10 ⑂ 2 MIT 2026-03-24
ASR / 音声認識 GitHub SubForge
SubForgeは、メディアファイルの字幕作成、翻訳、動画への埋め込みを一元的に行うオールインワンツールです。音声や…
★ 10 ⑂ 2 2026-05-22
動画生成 GitHub Model-To-NPU
このリポジトリは、Qualcomm Snapdragonデバイス上で大規模な拡散モデルを実行するためのパイプラインを提供します。…
★ 10 ⑂ 3 NOASSERTION 2026-05-12
LLM GitHub guia-de-programacion-con-ai
このガイドは、AIを活用したプログラミングとソフトウェア開発を学ぶためのスペイン語で書かれた最も包括的なリソー…
★ 10 MIT 2026-06-15
音楽生成 GitHub birdsnest
Bird's Nestは、Macユーザー向けに開発された、完全にローカルで動作する非Transformer型AIハブです。RWKV、Mamba、x…
★ 10 ⑂ 3 MIT 2026-03-06
AIエージェント GitHub web-design-enhancer
「Web Design Enhancer」は、AIエージェントが生成するウェブデザインの品質を劇的に向上させるスキルです。一般的な…
★ 10 ⑂ 2 2026-06-24
ComfyUI GitHub ComfyUI-GoRi-Wireless-Engine
GoRi-Wireless Engineは、ComfyUIの複雑なワークフローにおけるノード間の配線を無線化し、整理するツールです。ワン…
★ 10 ⑂ 1 2026-05-29
AIエージェント GitHub web-speed-oss
Web Speedは、AIエージェント向けのWebページ解析ツールです。複雑なWebコンテンツ(HTML、レイアウト、JavaScript)…
★ 9 ⑂ 1 GPL-3.0 2026-05-10