3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2214 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub ScriptSmith-Engine
ScriptSmith-Engineは、プレーンテキストのスクリプトを、ナレーション付きの完全に編集されたYouTube動画に自動的に…
★ 6 ⑂ 1 MIT 2026-06-23
画像生成 GitHub CAM
このツールは、ICML 2026で発表された論文「Unsupervised Diffusion Solver for Combinatorial Optimization via Com…
★ 6 2026-06-01
音声生成 / TTS GitHub ghost-narrator
Ghost Narratorは、ブログや静的サイト向けに自己ホスト型のAI音声ナレーションを提供するツールです。ElevenLabsの…
★ 6 ⑂ 1 MIT 2026-06-15
AIエージェント GitHub Local-Model
このツールは、Kali Linux上でQwen 2.5-7Bモデル(LM Studio経由)を活用する、完全にローカルで自律的なサイバーセ…
★ 6 ⑂ 2 MIT 2026-06-17
AIエージェント GitHub Hive
Hiveは、自律的に協調し、コードを記述し、ツールを使用する永続的なAIエージェントを生成するためのローカルファー…
★ 6 MIT 2026-06-11
音声生成 / TTS GitHub the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 6 ⑂ 1 MIT 2026-05-27
マルチモーダル GitHub wgram-lm
W-GRAM-LMは、世界誘導型再帰的アトラクタ言語モデルの研究用コードベースです。潜在世界予測、多軌道推論、解答アト…
★ 6 AGPL-3.0 2026-06-21
動画生成 GitHub ai-film-skills
AI Film Studioは、Claude Code向けに設計されたエンドツーエンドのAI映画制作エージェントスキルです。ストーリーボ…
★ 6 ⑂ 1 MIT 2026-05-05
ASR / 音声認識 GitHub Clippos
Clipposは、長い動画からキャプション付きのバイラル向けソーシャルクリップを生成するAIエージェントスキルです。He…
★ 6 ⑂ 1 MIT 2026-04-26
マルチモーダル GitHub Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
3D / NeRF GitHub StoryCore-Engine
StoryCore Engineは、スクリプトから一貫性のある画像、動画、ストーリー、対話、空間オーディオを生成する、ローカ…
★ 6 ⑂ 1 MIT 2026-06-23
LLM GitHub tensor-serve
tensor-serveは、OpenAI互換AI向けのZIMベースの検索拡張プロキシです。KiwixのOPDSカタログからZIMドキュメントをダ…
★ 5 MIT 2026-05-11
画像生成 GitHub CUIG
CUIGは、テキストから画像を生成する拡散モデルにおける概念忘却の研究コードベースです。本リポジトリは、独立、シ…
★ 5 MIT 2026-06-12
マルチモーダル GitHub SkinAid
SkinAidは、皮膚疾患の分析を支援する高度なクロスモーダルAIフレームワークです。ユーザーは皮膚の画像と年齢、性別…
★ 5 ⑂ 1 MIT 2026-05-30
ComfyUI GitHub ComfyUI-FileManaty
ComfyUI-FileManatyは、人気の画像生成AIツールComfyUIのWeb UI内に統合された強力なファイルマネージャーです。ユー…
★ 5 MIT 2026-06-15
AIエージェント GitHub nocturne
Nocturneは、GitHubの課題を自律的に解決するコーディングオーケストレーターです。設定されたリポジトリの課題に「a…
★ 5 MIT 2026-06-22
音声生成 / TTS GitHub openvoice-cloning
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。ターゲットスピーカーの声…
★ 5 MIT 2026-06-13
マルチモーダル GitHub JoyCapture-UR5
JoyCapture-UR5は、Xboxコントローラーを使用してUR5ロボットを遠隔操作し、多モーダルなデモンストレーションデータ…
★ 5 MIT 2026-05-24
ASR / 音声認識 GitHub wisprflow-sdk
WisprFlow SDKは、Wispr Flowデスクトップクライアントの非公式Python SDKです。Wispr Flowの音声APIをリバースエン…
★ 5 ⑂ 1 MIT 2026-06-09
音声生成 / TTS GitHub qwen3-tts-spanish-voices
このツールは、Qwen3-TTSを利用してスペイン語のテキスト読み上げ(TTS)機能を提供します。Apple Silicon搭載のMac…
★ 5 ⑂ 2 MIT 2026-06-21
LLM GitHub SocialSim
本リポジトリは、AAAI 2025論文「SocialSim: Towards Socialized Simulation of Emotional Support Conversation」に…
★ 5 ⑂ 1 NOASSERTION 2026-05-20
マルチモーダル GitHub thesis-iot-monitoring
このツールは、自然言語の指示に基づいてIoTデバイスが自律的に視覚監視を行うシステムです。AIエージェントがユーザ…
★ 5 ⑂ 1 NOASSERTION 2026-06-05
画像生成 GitHub FlowSR
FlowSRは、ICCV 2025で発表された、Consistency Rectified Flowを活用した高速画像超解像ツールです。低解像度画像か…
★ 5 NOASSERTION 2026-06-01
LLM GitHub 3GPP-Everything
「3GPP-Everything」は、Rel-18/19を含む全ての3GPP 5G仕様書(1270篇、約39万段落)を網羅する生産級RAG(検索拡張…
★ 5 AGPL-3.0 2026-06-05