3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
Uni-ViGU
Uni-ViGUは、拡散モデルを基盤としたビデオジェネレータを通じて、ビデオの生成と理解を統一する革新的なフレームワ…
★ 32 ⑂ 1 Apache-2.0 2026-04-15
音声生成 / TTS
GitHub
wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
LLM
GitHub
MindBase
Bilibiliのお気に入り動画やクラウド文書をチャット可能な個人知識ベースへと変換するツールです。動画の音声認識(A…
★ 31 ⑂ 1 MIT 2026-06-23
LLM
GitHub
synaptic-memory
Synaptic Memoryは、LLMエージェント向けの脳にインスパイアされた知識グラフとMCP(Multi-hop Chain of Thought)ツ…
★ 31 ⑂ 1 NOASSERTION 2026-06-18
ComfyUI
GitHub
Dots-TTS-ComfyUI
このツールは、ComfyUI向けのカスタムノードコレクションであり、Dots TTSによる高品質なテキスト音声合成、音声クロ…
★ 31 ⑂ 3 Apache-2.0 2026-06-11
動画生成
GitHub
Awesome-Agent-Based-Low-Level-Vision
本リポジトリは、自律エージェントや(M)LLMエージェントを用いた低レベル画像処理(画像修復、画像編集、超解像など…
★ 30 ⑂ 4 MIT 2026-06-15
ASR / 音声認識
GitHub
jarvis-mac
Jarvis-Macは、macOS上で動作する高度な日本語音声アシスタントです。ユーザーが「ジャービス」と呼びかけることで起…
★ 30 ⑂ 2 MIT 2026-06-19
LLM
GitHub
pinrule
pinruleは、AIが長時間のタスク中に当初の目的から逸脱しないように、5〜10個の重要なルールを設定できる普遍的なAI…
★ 30 ⑂ 1 MIT 2026-05-19
LLM
GitHub
LongParser
LongParserは、プライバシーを重視したドキュメントインテリジェンスエンジンです。PDF、DOCX、PPTX、XLSX、CSVとい…
★ 29 ⑂ 2 NOASSERTION 2026-05-05
3D / NeRF
GitHub
iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
LLM
GitHub
awaek
X(旧Twitter)で保存したブックマークをパーソナルAIとして活用できるツールです。散逸しがちな保存投稿を「チャッ…
★ 29 ⑂ 1 2026-05-24
ComfyUI
GitHub
ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
音声生成 / TTS
GitHub
supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
マルチモーダル
GitHub
SSM
このリポジリは、顔の動作単位(AU)と顔の表情(FE)の双方向学習を可能にするStructured Semantic Mapping(SSM)…
★ 28 2026-04-17
LLM
GitHub
n8n-claude-skills
n8n-claude-skillsは、AnthropicのClaude Skillsを活用し、n8nワークフローの構築、デバッグ、デプロイをプロダクシ…
★ 28 ⑂ 7 MIT 2026-04-26
ASR / 音声認識
GitHub
live-translator
Live Translatorは、macOS上でシステムオーディオをリアルタイムで翻訳するアプリケーションです。YouTube動画、ポッ…
★ 28 ⑂ 1 MIT 2026-05-20
画像生成
GitHub
comfyui-ReferenceLatentPlus
このツールはComfyUIの標準`ReferenceLatent`ノードを強化したドロップイン代替品です。画像ごとに参照強度、タイム…
★ 28 ⑂ 4 2026-06-07
ASR / 音声認識
GitHub
pod2wiki
pod2wikiは、YouTubeやRSSからの高品質なポッドキャストや長文コンテンツを自動的に中国語の要約と英語の原文に変換…
★ 28 ⑂ 5 MIT 2026-04-29
ASR / 音声認識
GitHub
TypelessMLX
このTypelessMLXは、macOS向けの音声文字変換(ディクテーション)アプリケーションです。Apple Silicon向けに最適化…
★ 27 ⑂ 3 2026-04-26
LLM
GitHub
lilbee
lilbeeは、ローカルでAIモデルを実行・管理し、ユーザーが所有するあらゆるデジタル情報をAIの力で検索することを可…
★ 27 ⑂ 3 NOASSERTION 2026-06-24
マルチモーダル
GitHub
Qwen-Lens-Studio
Qwen Lens Studioは、単一のQwenビジョン言語モデルを中心に構築されたマルチモーダルAIスタジオです。UIスクリーン…
★ 27 ⑂ 6 2026-04-23
動画生成
GitHub
super-video-maker-skill
「Super Video Maker Skill」は、AIエージェント向けの包括的な動画制作スキルです。HeyGenアバター、AI Bロール、Op…
★ 26 ⑂ 1 2026-06-17
マルチモーダル
GitHub
EfficientVideoAgent
EVA(Efficient Video Agent)は、動画エージェントのための効率的な強化学習フレームワークです。このモデルは「pla…
★ 26 2026-05-06
ComfyUI
GitHub
midjourney-comfyui
「Midjourney ComfyUI Nodes」は、ComfyUI内でMidjourney V7、V8、Nijiモデルを用いて高品質な画像を生成するための…
★ 26 ⑂ 7 MIT 2026-06-02