3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub Uni-ViGU
Uni-ViGUは、拡散モデルを基盤としたビデオジェネレータを通じて、ビデオの生成と理解を統一する革新的なフレームワ…
★ 32 ⑂ 1 Apache-2.0 2026-04-15
音声生成 / TTS GitHub wavlm-vocoder-french
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。JEP 2026に採択された論文…
★ 31 MIT 2026-05-13
LLM GitHub MindBase
Bilibiliのお気に入り動画やクラウド文書をチャット可能な個人知識ベースへと変換するツールです。動画の音声認識(A…
★ 31 ⑂ 1 MIT 2026-06-23
LLM GitHub synaptic-memory
Synaptic Memoryは、LLMエージェント向けの脳にインスパイアされた知識グラフとMCP(Multi-hop Chain of Thought)ツ…
★ 31 ⑂ 1 NOASSERTION 2026-06-18
ComfyUI GitHub Dots-TTS-ComfyUI
このツールは、ComfyUI向けのカスタムノードコレクションであり、Dots TTSによる高品質なテキスト音声合成、音声クロ…
★ 31 ⑂ 3 Apache-2.0 2026-06-11
動画生成 GitHub Awesome-Agent-Based-Low-Level-Vision
本リポジトリは、自律エージェントや(M)LLMエージェントを用いた低レベル画像処理(画像修復、画像編集、超解像など…
★ 30 ⑂ 4 MIT 2026-06-15
ASR / 音声認識 GitHub jarvis-mac
Jarvis-Macは、macOS上で動作する高度な日本語音声アシスタントです。ユーザーが「ジャービス」と呼びかけることで起…
★ 30 ⑂ 2 MIT 2026-06-19
LLM GitHub pinrule
pinruleは、AIが長時間のタスク中に当初の目的から逸脱しないように、5〜10個の重要なルールを設定できる普遍的なAI…
★ 30 ⑂ 1 MIT 2026-05-19
LLM GitHub LongParser
LongParserは、プライバシーを重視したドキュメントインテリジェンスエンジンです。PDF、DOCX、PPTX、XLSX、CSVとい…
★ 29 ⑂ 2 NOASSERTION 2026-05-05
3D / NeRF GitHub iMaC
このツールは、iMaC(Embodied World Models向けにアクションをモーションとコンタクトイメージに変換するモデル)と…
★ 29 2026-06-21
LLM GitHub awaek
X(旧Twitter)で保存したブックマークをパーソナルAIとして活用できるツールです。散逸しがちな保存投稿を「チャッ…
★ 29 ⑂ 1 2026-05-24
ComfyUI GitHub ComfyUI-TranslateGemma
このツールは、Googleのオープンソース翻訳モデル「TranslateGemma」をComfyUIに統合するノードです。Gemma 3をベー…
★ 29 ⑂ 3 MIT 2026-06-13
音声生成 / TTS GitHub supertonic3-voice-clone
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。低GPU使用量(…
★ 29 ⑂ 8 MIT 2026-05-25
マルチモーダル GitHub SSM
このリポジリは、顔の動作単位(AU)と顔の表情(FE)の双方向学習を可能にするStructured Semantic Mapping(SSM)…
★ 28 2026-04-17
LLM GitHub n8n-claude-skills
n8n-claude-skillsは、AnthropicのClaude Skillsを活用し、n8nワークフローの構築、デバッグ、デプロイをプロダクシ…
★ 28 ⑂ 7 MIT 2026-04-26
ASR / 音声認識 GitHub live-translator
Live Translatorは、macOS上でシステムオーディオをリアルタイムで翻訳するアプリケーションです。YouTube動画、ポッ…
★ 28 ⑂ 1 MIT 2026-05-20
画像生成 GitHub comfyui-ReferenceLatentPlus
このツールはComfyUIの標準`ReferenceLatent`ノードを強化したドロップイン代替品です。画像ごとに参照強度、タイム…
★ 28 ⑂ 4 2026-06-07
ASR / 音声認識 GitHub pod2wiki
pod2wikiは、YouTubeやRSSからの高品質なポッドキャストや長文コンテンツを自動的に中国語の要約と英語の原文に変換…
★ 28 ⑂ 5 MIT 2026-04-29
ASR / 音声認識 GitHub TypelessMLX
このTypelessMLXは、macOS向けの音声文字変換(ディクテーション)アプリケーションです。Apple Silicon向けに最適化…
★ 27 ⑂ 3 2026-04-26
LLM GitHub lilbee
lilbeeは、ローカルでAIモデルを実行・管理し、ユーザーが所有するあらゆるデジタル情報をAIの力で検索することを可…
★ 27 ⑂ 3 NOASSERTION 2026-06-24
マルチモーダル GitHub Qwen-Lens-Studio
Qwen Lens Studioは、単一のQwenビジョン言語モデルを中心に構築されたマルチモーダルAIスタジオです。UIスクリーン…
★ 27 ⑂ 6 2026-04-23
動画生成 GitHub super-video-maker-skill
「Super Video Maker Skill」は、AIエージェント向けの包括的な動画制作スキルです。HeyGenアバター、AI Bロール、Op…
★ 26 ⑂ 1 2026-06-17
マルチモーダル GitHub EfficientVideoAgent
EVA(Efficient Video Agent)は、動画エージェントのための効率的な強化学習フレームワークです。このモデルは「pla…
★ 26 2026-05-06
ComfyUI GitHub midjourney-comfyui
「Midjourney ComfyUI Nodes」は、ComfyUI内でMidjourney V7、V8、Nijiモデルを用いて高品質な画像を生成するための…
★ 26 ⑂ 7 MIT 2026-06-02