3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2216 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

動画生成
GitHub
multimodal-ai-content-pipeline
このツールは、単一のテキストプロンプトから、ポスター画像、ビデオクリップ、ナレーションを含むプロモーションコ…
★ 1 MIT 2026-06-10
LLM
GitHub
KnowledgeBase
KnowledgeBaseは、ばらばらのメモを構造化された個人用Wikiに変換し、知識管理を支援するツールです。LLMを活用して…
★ 1 Apache-2.0 2026-06-26
ASR / 音声認識
GitHub
dreamjournal-bot
「Dream Journal Bot」は、Telegramプラットフォームで動作する革新的な夢日記ボットです。本ボットの最大の特徴は、…
★ 1 2026-06-18
ComfyUI
GitHub
ComfyUI-Selective-Sigma-Detailer
ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…
★ 1 ⑂ 3 MIT 2026-05-10
LLM
GitHub
pdf-analyzer
このツールは、PDF文書の内容に基づいた質問応答を可能にするRAG(検索拡張生成)システムです。PDFをアップロードす…
★ 1 2026-05-14
LLM
GitHub
Project-adam-v2
Synthesizer V2(Project Adam V2)は、MBTIプロファイルに基づいた4つのAIアクター間で複雑な会話をシミュレートし…
★ 1 MIT 2026-05-22
マルチモーダル
GitHub
control-sci
ControlMindは、MinerUを活用した科学文書インテリジェンスシステムです。生PDFから直接情報を抽出し、科学論文の理…
★ 1 NOASSERTION 2026-05-30
ASR / 音声認識
GitHub
resilient-stt
Resilient STTは、OpenAI互換のASR(自動音声認識)エンドポイントと連携し、音声ファイルを高精度にテキスト変換す…
★ 1 ⑂ 1 GPL-3.0 2026-05-25
音声生成 / TTS
GitHub
MOSSlanding
MOSSlandingは、5秒程度の音声サンプルからあらゆる声をクローンできる世界最高峰の音声クローニングTTSツールです。…
★ 1 2026-06-05
3D / NeRF
GitHub
token-enhancer
Token Enhancerは、AIエージェントがWebページを読み込む際に、大量の無駄なトークンを消費する問題を解決するローカ…
★ 1 MIT 2026-06-25
3D / NeRF
GitHub
Cosmo3DFlow
Cosmo3DFlowは、初期宇宙の初期条件を現在の観測データから再構築するためのツールです。3Dウェーブレットフローマッ…
★ 1 MIT 2026-06-12
画像生成
GitHub
DESIGNOSFORGE
DESIGNOSFORGEは、AIデザインにおける視覚的な問題を解決し、統制されたデザインワークフローを実現するオープンソー…
★ 1 MIT 2026-06-19
3D / NeRF
GitHub
MultiBEST—Multiscale-Multiphase-Bridging-Experiment-and-Simulation-Toolkit
MultiBESTは、実験で得られた2D顕微鏡写真、2D/3D EBSDデータ、またはユーザーのスケッチから、原子レベルおよび連続…
★ 1 GPL-3.0 2026-06-09
マルチモーダル
GitHub
loop-antigravity
loop-antigravityは、Google Antigravity (agy CLI) とGeminiの1Mトークンコンテキストおよびマルチモーダル推論能力…
★ 1 Apache-2.0 2026-06-14
音声生成 / TTS
GitHub
nemoflix-studio
Nemoflix Studioは、AIによる画像、動画、音声生成のためのオープンソースのクリエイティブエンジンです。ComfyUIワ…
★ 1 Apache-2.0 2026-06-16
AIエージェント
GitHub
YutoTerashima
このGitHubリポジトリは、AI研究者である寺島悠斗氏の専門的なプロフィールと研究活動を紹介するものです。大規模言…
★ 1 MIT 2026-06-19
LLM
GitHub
Agentic-IRC-Bot
本ツールはPythonで開発されたエージェント型IRCボットです。LLMを中核に据え、ツール呼び出し、結果統合、長期記憶…
★ 1 MIT 2026-05-24
AIエージェント
GitHub
claude-code-companion
Claude Code Companionは、Apple Silicon Mac上で動作する、コーディング時の孤独を和らげる音声コンパニオンツール…
★ 1 2026-05-28
動画生成
GitHub
comfy-prompt-skill
comfy-promptは、Comfy Cloud向けのプレミアム優先AI生成ワークフローです。50種類以上の画像および動画モデル(Gemi…
★ 1 ⑂ 1 NOASSERTION 2026-05-27
3D / NeRF
GitHub
project_slam_gs3lam
GS3LAMは、AIFLOW LABS LIMITEDが開発するANIMA Intelligence Compiler Suiteの一部であるGaussian Semantic SLAM(…
★ 1 2026-04-04
ASR / 音声認識
GitHub
BaltiVoice-ASR
BaltiVoice ASRは、バルティ語(チベット語族の低リソース言語)の音声をテキストに変換する初のAI音声認識(ASR)シ…
★ 1 MIT 2026-06-12
ASR / 音声認識
GitHub
VoiceBlogger
VoiceBloggerは、音声録音を洗練されたブログ記事やInstagramのキャプションに変換するツールです。全てオフラインで…
★ 1 Apache-2.0 2026-06-24
音声生成 / TTS
GitHub
code-driven-video-template
「Code-Driven Video Template」は、スクリプトからナレーション付きのデータスタイルの動画をコードベースで生成す…
★ 1 MIT 2026-06-14
LLM
GitHub
leaderboard
Swallow LLM Leaderboardは、大規模言語モデルSwallowの性能を評価し、その結果を可視化して公開するツールです。`py…
★ 1 ⑂ 2 MIT 2026-06-24