3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2218 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
tts-video-generator
この「TTS Video Generator」は、Python、ElevenLabsの音声合成、FFmpegを組み合わせて、AI音声と同期字幕付きの短い…
★ 1 ⑂ 1 MIT 2026-06-23
マルチモーダル
GitHub
FootPrint
FootPrint Analyticsは、サッカーの試合映像をAIで分析するパイプラインシステムです。YOLOv8とByteTrackを用いて選…
★ 1 MIT 2026-05-18
ComfyUI
GitHub
L2MAS
L2MASは、Live2Dアニメーション制作を多エージェントAIで自動化するためのプロトタイプです。MCPおよびA2Aプロトコル…
★ 1 Apache-2.0 2026-06-20
ComfyUI
GitHub
comfyui-touch-numeric
「comfyui-touch-numeric」は、人気の画像生成AIツールComfyUIの数値入力ウィジェット(seedやINT/FLOAT値など)を、…
★ 1 ⑂ 1 MIT 2026-06-24
音声生成 / TTS
GitHub
rvc-free-colab
rvc-free-colabは、古いGoogle Colab向けRVC学習ノートブックを、Python 3.12、numpy 2.x、torch 2.xといった最新のG…
★ 1 MIT 2026-06-02
画像生成
GitHub
hermes-lemonade-llm-image-support
このプラグインは、Hermesエージェント向けにLemonade Serverを介した高速なローカル画像生成とLLM利用を可能にしま…
★ 1 MIT 2026-06-03
LLM
GitHub
Shared_Memory
このプロジェクトは、ローカル環境のAIエージェント間で知識を共有するための三層セマンティックメモリフレームワー…
★ 1 NOASSERTION 2026-06-25
画像生成
GitHub
amanuensis
amanuensisは、AIペルソナがMastodonやBlueskyで投稿を作成し、人間の承認を得てから公開するためのローカルファース…
★ 1 MIT 2026-06-25
3D / NeRF
GitHub
faster-trellis
「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…
★ 1 NOASSERTION 2026-06-11
LLM
GitHub
hivelink
HiveLinkは、Mac、Windows、Linux、NVIDIA、AMD、Apple Siliconといった多様なデバイスを統合し、大規模な言語モデル…
★ 1 MIT 2026-06-23
音声生成 / TTS
GitHub
global-translation
このツールは、Googleの翻訳エンジンとMicrosoft Edge TTSを活用した、AI駆動型のリアルタイム言語翻訳アプリケーシ…
★ 1 2026-06-20
LLM
GitHub
CareerScan
CareerScanは、AIを活用した履歴書分析ツールです。PDF形式の履歴書と職務記述書をアップロードすると、LLaMA 3.3-70…
★ 1 2026-05-13
3D / NeRF
GitHub
classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
マルチモーダル
GitHub
corpus-mill
「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画(人物…
★ 1 Apache-2.0 2026-05-06
動画生成
GitHub
TechDemoForge
TechDemoForgeは、技術的なREADME、仕様書、コードなどの情報源から、正確で構造化されたデモビデオを自動生成するロ…
★ 1 MIT 2026-04-12
LLM
GitHub
Scalable-RAG-Application
このツールは、スケーラブルで低遅延、高信頼性のAI駆動型情報検索を実現する、プロダクショングレードのマルチエー…
★ 1 2026-06-01
LLM
GitHub
langgraph
Roco Kingdomは、多エージェント協力に基づく『洛克王国』ゲームの精霊百科システムです。自然言語で精霊情報、属性…
★ 1 2026-05-22
ComfyUI
GitHub
comfyui-cyberdelia-metadata
このツールは、ComfyUIの標準画像保存機能を拡張し、Civitaiと互換性のある詳細な画像メタデータ(シード、モデル、L…
★ 1 ⑂ 1 GPL-3.0 2026-05-26
ASR / 音声認識
GitHub
realtime-voice-ai-platform
リアルタイム音声AI顧客サポートプラットフォームは、音声認識(STT)、音声合成(TTS)、マルチエージェントオーケ…
★ 1 MIT 2026-06-10
音声生成 / TTS
GitHub
md-tts
md-ttsは、技術的なMarkdownファイルを音声で読み上げ、コードブロック、テーブル、フラッシュカードで再生をインタ…
★ 1 MIT 2026-06-04
LLM
GitHub
rag-radar
RAG Radarは、新しいRAG(Retrieval-Augmented Generation)の実装、ツール、およびパターンをリアルタイムで追跡す…
★ 1 2026-06-26
画像生成
GitHub
openvino-gpu-llm-server
このプロジェクトは、Intel統合GPU(特にUHD 620以降)に最適化された、OpenAI互換のLLM推論APIサーバーです。OpenVI…
★ 1 2026-06-17
画像生成
GitHub
diffusion-models-from-scratch
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNIS…
★ 1 MIT 2026-05-08
音楽生成
GitHub
AI-Music-systems
このプロジェクトは、Hindustani古典音楽のラーガ(Bageshree, Khamaj, Bhoop)に特化したAI音楽生成システムです。M…
★ 1 2026-05-17