3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音楽生成 GitHub theDAW
「theDAW」はGANTASMOが開発したAI音楽制作のためのオールインワンスタジオです。既存のオーディオ、テキストプロン…
★ 68 ⑂ 14 MIT 2026-06-26
音声生成 / TTS GitHub omnivoice-server
omnivoice-serverは、OmniVoiceテキスト読み上げモデルのOpenAI互換HTTPサーバーです。OpenAIのTTSエンドポイントの…
★ 68 ⑂ 22 MIT 2026-06-26
動画生成 GitHub video-to-video
「Reshoot-Anything」は、単眼ビデオを新しいカメラ軌道で再撮影するための自己教師ありビデオ拡散モデルです。既存…
★ 67 ⑂ 8 Apache-2.0 2026-04-27
3D / NeRF GitHub awesome-dynamic-NeRF
このリポジトリは、動的シーンのためのニューラルラディアンスフィールド(NeRF)に関する優れたリソースのキュレー…
★ 67 ⑂ 2 2026-04-21
音声生成 / TTS GitHub korean-voice-acting-engine
Korean Voice Acting Engine (KVAE) は、韓国語音声に特化したローカルファーストのツールキットです。ユーザーが自…
★ 67 ⑂ 5 NOASSERTION 2026-05-05
AIエージェント GitHub harness-forge
Harness Forgeは、Claude Codeのスキルとして提供されるツールで、固定された大規模言語モデル(LLM)の「ハーネス」…
★ 67 ⑂ 6 MIT 2026-06-14
ASR / 音声認識 GitHub pi-listen
pi-listenは、Pi CLI (コーディングエージェント) 向けのハンズフリー音声入力ツールです。Deepgramによるクラウドス…
★ 66 ⑂ 13 MIT 2026-05-01
LLM GitHub hermes-desktop
Hermes Desktopは、自己改善型AIエージェント「Hermes Agent」をベースにしたオールインワンのクロスプラットフォー…
★ 64 ⑂ 7 2026-06-01
LLM GitHub deepsearch-agents
「深度研搜」は、DeepAgentsフレームワークを用いた対話型多エージェント深度研究システムです。主エージェントがタ…
★ 64 ⑂ 16 2026-05-22
3D / NeRF GitHub DeGauss
DeGaussは、ICCV 2025で発表された、ガウシアンスプラッティングを用いた動的-静的分解による、外乱のない3D再構築の…
★ 64 ⑂ 5 GPL-3.0 2026-06-04
AIエージェント GitHub Myco
Mycoは、AIエージェント向けの自己進化する認知基盤です。フレームワーク、論文、コードベースなどの情報をファイル…
★ 64 ⑂ 7 MIT 2026-06-09
画像生成 GitHub HiDream_O1-ComfyUI
HiDream_O1-ComfyUIは、ComfyUI上でHiDream O1による画像生成を可能にするカスタムノード群です。テキストプロンプト…
★ 64 ⑂ 11 MIT 2026-05-15
動画生成 GitHub EverAnimate
EverAnimateは、長時間の人間アニメーション動画生成において、視覚品質とキャラクターの一貫性を維持する効率的な後…
★ 64 ⑂ 1 MIT 2026-06-04
動画生成 GitHub LiveWorld
LiveWorldは、生成型ビデオワールドモデルにおいて、視界外のダイナミクスをシミュレートする画期的なフレームワーク…
★ 63 ⑂ 3 Apache-2.0 2026-06-23
ASR / 音声認識 GitHub echocut
echocutは、生の映像素材をコマンド一つでブランドに合わせたプラットフォーム最適化済み動画に変換するローカルファ…
★ 63 ⑂ 16 Apache-2.0 2026-06-23
AIエージェント GitHub agentcanvas
agentcanvasは、Pydantic AIエージェントのLogfireトレースを、インタラクティブなHTMLダイアグラムとして視覚化する…
★ 63 ⑂ 7 MIT 2026-06-17
ComfyUI GitHub ComfyUI-Flux-FaceIR
ComfyUI Flux FaceIRは、画像生成UI「ComfyUI」向けの拡張機能で、FLUX FaceIR技術を用いた高度な顔修復機能を提供し…
★ 62 ⑂ 9 Apache-2.0 2026-06-04
LLM GitHub law_rag_system
このプロジェクトは、企業法務向けのRAG(Retrieval-Augmented Generation)Q&Aシステムです。Alibaba Cloudの埋め込…
★ 62 2026-05-25
LLM GitHub Cortex
Cortexは、Claude CodeなどのAIコーディングアシスタントのセッション間で失われる文脈を保持するための、永続的な記…
★ 61 ⑂ 11 NOASSERTION 2026-06-19
ASR / 音声認識 GitHub AmicoScript
AmicoScriptは、OpenAIのWhisperモデルをベースにした、プライバシー重視のローカルオーディオ転写ツールです。ユー…
★ 61 ⑂ 2 MIT 2026-06-21
動画生成 GitHub open-director
OpenDirectorは、一行のアイデアから音声、BGM、絵コンテ付きの完成されたビデオを生成するオープンソースのAIビデオ…
★ 61 ⑂ 12 LGPL-3.0 2026-05-29
マルチモーダル GitHub doubao2api
このプロジェクト「doubao2api」は、Doubao(豆包)クライアントAPIをリバースエンジニアリングしたもので、AIエージ…
★ 61 ⑂ 20 Apache-2.0 2026-05-24
ASR / 音声認識 GitHub SpeakSlow
「聲聲慢 SpeakSlow」は、中国語に特化した最速のローカル音声入力ツールです。無料かつオープンソースで、100%ロー…
★ 61 ⑂ 9 NOASSERTION 2026-06-22
画像生成 GitHub W-Flow
W-Flowは、「Wasserstein Gradient Flowsを介したワンステップ生成モデリング」の公式PyTorchコードベースです。この…
★ 60 ⑂ 4 MIT 2026-06-09