3,631 repos GH 3,516 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2215 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
AI-E-Commerce-Media-Studio
このAI Eコマースメディアスタジオは、AIを活用してEコマース向けの商用利用可能な商品画像やシネマティックビデオを…
★ 2 ⑂ 1 2026-06-15
ComfyUI
GitHub
awesome-ai-video
このリポジトリは、最新のAIテキスト・画像-to-ビデオモデル、ツール、リソースを厳選したリストです。2026年半ばに…
★ 2 ⑂ 1 CC0-1.0 2026-06-03
動画生成
GitHub
makeslide
makeslideは、PDFやテキストファイル、YouTube動画から音声付きプレゼンテーションを生成・再生するシステムです。AI…
★ 2 2026-06-25
画像生成
GitHub
diffusion
本リポジトリは、Stable Diffusion 3に着想を得た、DiTベースの条件付きフローモデルを実装しています。主な機能は、…
★ 2 2026-06-10
動画生成
GitHub
grokcli
grokcliは、xAI Grokの全機能をCLIで利用できる、ゼロ依存のスタンドアロンツールです。SuperGrokまたはX Premium+の…
★ 2 MIT 2026-06-02
音声生成 / TTS
GitHub
HiggsAudio-Studio-pinokio
本ツールは、Higgs Audio StudioのワンクリックPinokioランチャーです。100以上の言語に対応する表現力豊かな音声合…
★ 2 ⑂ 1 MIT 2026-06-14
LLM
GitHub
drm_transformer
DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…
★ 2 NOASSERTION 2026-06-17
3D / NeRF
GitHub
diff-nexel-rasterization
このリポジトリは、リアルタイムでの新規視点合成を可能にするニューラルテクスチャ付きサーフェル「Nexels」のため…
★ 2 NOASSERTION 2025-12-18
LLM
GitHub
Continue-NIM-Proxy
このツールは、Continue/VSCodiumでNVIDIA NIMの「Step 3.7 Flash」モデルを使用する際に発生する、応答がサイレント…
★ 2 MIT 2026-06-14
ASR / 音声認識
GitHub
slidoc
slidocは、講義ビデオを各スライドとそのクリーンアップされたナレーションが対になったマークダウン形式に変換する…
★ 2 ⑂ 1 MIT 2026-05-15
音声生成 / TTS
GitHub
voice-meeting
「Voice Meeting」は、多人数の会議をリアルタイムで文字起こしし、発言者を識別するオンプレミスソリューションです…
★ 2 MIT 2026-06-07
音楽生成
GitHub
ima-skills
本リポジトリは、AI漫画作成、ソーシャルメディア運営、AI画像生成、音楽生成など多岐にわたる25種類のAIスキルをIMA…
★ 2 ⑂ 1 MIT 2026-06-05
LLM
GitHub
schoolwork-rag
schoolwork-ragは、PDFや講義ノートなどのローカルな学習資料を、検索可能な知識ベースに変えるプライバシー重視のRA…
★ 2 MIT 2026-05-25
音声生成 / TTS
GitHub
saaki-audios
このツールは、Unitree G1ロボットと互換性のある音声ファイルを生成するためのPythonスクリプトです。システムのTex…
★ 2 MIT 2026-06-11
LLM
GitHub
SeekDeep-DiscordBot
SeekDeep Discord Botは、ローカルAIを活用した多機能なDiscordボットです。チャット、画像認識、画像生成、ウェブ検…
★ 2 GPL-2.0 2026-06-24
LLM
GitHub
Awesome-Self-Distillation
「Awesome Large Model Self-Distillation」は、大規模言語モデル(LLMs)、マルチモーダルLLMs(MLLMs)、推論モデ…
★ 2 Apache-2.0 2026-05-26
ASR / 音声認識
GitHub
speech-emotion-recognition-transfer-learning
このプロジェクトは、音声感情認識(SER)におけるテキストのみ(RoBERTa)、音声のみ(wav2vec2/WavLM/HuBERT)、お…
★ 2 MIT 2026-06-26
画像生成
GitHub
AI-Canva-Style-Editor
AI-Canva-Style-Editorは、StreamlitとOpenAIを基盤としたAI画像生成・編集プラットフォームです。テキストプロンプ…
★ 2 MIT 2026-06-21
ComfyUI
GitHub
Prompt808
Prompt808は、ComfyUI用のビジョンLLMプロンプト生成ノードです。画像からコンテンツやスタイルを学習し、ユーザーの…
★ 2 ⑂ 1 MIT 2026-04-25
音声生成 / TTS
GitHub
nvatar-demo
NVatarは、3D仮想空間で対話可能なAIアバターです。音声クローニング、9次元の感情追跡、会話に応じた性格進化といっ…
★ 2 MIT 2026-06-02
LLM
GitHub
lodestar
Lodestarは、2026年に開発されたHBCU学生向けのAIキャリアアシスタントです。これは、HP FOWA 2024で優勝したIgniteA…
★ 2 NOASSERTION 2026-06-18
画像生成
GitHub
SesquiLSR
SesquiLSRは、SDXL、Flux、Flux2、Wan 2.1/Anima/Qwen Imageといった多様なモデル/VAEに対応し、1.0倍から2.0倍の範…
★ 2 ⑂ 1 MIT 2026-06-16
画像生成
GitHub
ReCo-Diff
ReCo-Diffは、スパースビューCT(低線量CT)における画像再構成のための、残差条件付き決定論的サンプリングに基づく…
★ 2 MIT 2026-06-15
音声生成 / TTS
GitHub
NeuralVoice-Studio-AI-Text-to-Speech-with-85-Dialects-Offline-Lightweight
NeuralVoice Studioは、85の言語と方言に対応した次世代オープンソースAI音声ジェネレーターです。このツールは高度…
★ 2 2026-06-17