3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ComfyUI GitHub awesome-ai-video-editing
このリポジトリは、AIを活用した動画編集および制作ツールの厳選リストです。特に、Claude Codeスキル、MCPサーバー…
★ 1 CC0-1.0 2026-06-12
ComfyUI GitHub saya-comfy-couple-plus
「Saya Comfy Couple+」は、ComfyUIの既存のComfy Coupleノードを改良したものです。主に、2人以上のキャラクターが…
★ 1 2026-06-11
LLM GitHub Multilingual-Health-QA-in-Low-Resource-African-Languages
このプロジェクトは、アフリカの低リソース言語に対応した多言語医療質問応答(QA)アシスタントの構築を目指す機械…
★ 1 2026-06-24
画像生成 GitHub Stream_Mirror
StreamMirrorは、Webカメラの映像をリアルタイムでアニメ、水墨画、ファンタジー風といった様々なスタイルに変換する…
★ 1 MIT 2026-05-13
ASR / 音声認識 GitHub ai-subtitle-generator
本ツールは、YouTube Shorts、TikTok、Reelsなどの短尺動画コンテンツ向けに、AIを活用しワードレベルで高精度なSRT…
★ 1 2026-05-16
マルチモーダル GitHub corpus-mill
「corpus-mill」は、ローカルGPUのみで動作するマルチモーダル動画アノテーションパイプラインです。長尺動画(人物…
★ 1 Apache-2.0 2026-05-06
LLM GitHub megatrain-guide-cn
MegaTrainは、1枚のGPUと十分なRAMを活用し、100B以上の大規模言語モデルを効率的に訓練するための革新的なフレーム…
★ 1 MIT 2026-04-17
ComfyUI GitHub ComfyUI-Smart-Metadata-Reader
ComfyUI-Smart-Metadata-Readerは、ComfyUIで生成された画像のメタデータをインテリジェントに読み取るPython製のカ…
★ 1 2026-05-28
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
動画生成 GitHub manim-coding-skill
このツールは、AIエージェントがManimGLを使用して高品質なSTEM教育アニメーション動画を自動生成、レンダリング、結…
★ 1 ⑂ 1 MIT 2026-06-12
動画生成 GitHub littleorange-video-mcp
LittleOrange Video MCPは、Model Context Protocol(MCP)に基づく動画生成サーバーサイドツールです。Sora2、Veo3.…
★ 1 2026-06-04
AIエージェント GitHub yamtam-engine
YAMTAM ENGINEは、AIコーディングエージェントがリポジトリに損害を与えるのを防ぐための個人用エージェントOSです。…
★ 1 Apache-2.0 2026-06-25
動画生成 GitHub happy-horse-api
Happy Horse APIは、AlibabaのAI動画モデル「Happy Horse」をAPIDot経由で利用するためのAPIと、その実装例を提供す…
★ 1 MIT 2026-05-25
LLM GitHub model-monitor
「模型 API 监控工具」は、OpenAI、DeepSeek、MiMoなど、複数のモデルAPIの利用状況をリアルタイムで監視・管理する…
★ 1 MIT 2026-06-25
ComfyUI GitHub ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
3D / NeRF GitHub perceptpick
PerceptPickは、ICRA 2026で発表された、ロボットの物体把持の成功に6Dポーズ推定と3D再構成のエラーがどのように影…
★ 1 MIT 2026-05-09
音声生成 / TTS GitHub Podcast-this-tech-stuff
このツール「podcast-this-tech-stuff」は、あらゆる技術文書(PDF、スライド、プレーンテキスト、Googleドキュメン…
★ 1 MIT 2026-05-19
マルチモーダル GitHub multimodal-clinical-ai
このマルチモーダル臨床AIプロジェクトは、胸部X線画像と臨床ノートを統合し、ViT、BioBERT、時系列エンコーダ、クロ…
★ 1 NOASSERTION 2026-05-20
3D / NeRF GitHub GaussianSplatsGradientFlow
このプロジェクトは、「3D Gaussian Splatting for Real-Time Radiance Field Rendering」に記述されているGaussian …
★ 1 2026-05-16
ASR / 音声認識 GitHub AI-VERSE
「AI-VERSE」は、PythonとNLP、HuggingFace Transformers、PyTorchなどの主要なAIライブラリを活用して開発された、…
★ 1 2026-05-21
ASR / 音声認識 GitHub smart-class-attendance
「Sureshjangid99/smart-class-attendance」は、顔認識技術を活用した自動クラス出席管理システムです。教師が出席を…
★ 1 2026-04-27
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
LLM GitHub contextcontrol
ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル(LLM)の利用、およびパッチワークフ…
★ 1 ⑂ 2 NOASSERTION 2026-05-31
マルチモーダル GitHub PrismRAG
PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…
★ 1 MIT 2026-06-20