3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2211 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
cppo
CPPO(Contrastive Perception Policy Optimization)は、視覚言語モデル(VLM)エージェントのファインチューニング…
★ 9 2026-05-28
ASR / 音声認識
GitHub
Edu_Omni_MyMind
EduMINDは、ベトナム語と英語が混在する学術環境向けに設計された、多モーダルなバイリンガル講義アシスタントおよび…
★ 8 ⑂ 3 MIT 2026-06-23
LLM
GitHub
DAYA
DAYAは、イラスト豊富なドキュメント(プレゼンテーション資料など)に特化した、ドキュメント認識型ハイブリッドア…
★ 8 Apache-2.0 2026-06-04
LLM
GitHub
LLMs-Tutorials-Projects
このリポジトリは、LLM(大規模言語モデル)に関する実践的なチュートリアルと実装コード集を提供します。ファインチ…
★ 8 ⑂ 3 2026-06-23
ASR / 音声認識
GitHub
florilegium
このツールは「Florilegium(フロリレギウム)・他山之石」と名付けられ、YouTubeやBilibiliなどの動画リンク、また…
★ 8 ⑂ 1 MIT 2026-06-06
動画生成
GitHub
adobe2api
「adobe2api」は、Adobe Fireflyの画像・動画生成能力をOpenAI互換のAPIとして提供するゲートウェイです。Adobe Fire…
★ 8 ⑂ 1 2026-05-16
LLM
GitHub
genobert
GenoBERTは、遺伝子型シーケンスを言語モデリングの問題として捉えるBERTベースの深層学習モデルです。マスクされた…
★ 8 ⑂ 1 MIT 2026-05-02
ASR / 音声認識
GitHub
cream-typer
Cream Typerは、Apple Siliconデバイス上で動作するローカル音声翻訳・テキスト化ツールです。Caps Lockをタップして…
★ 8 ⑂ 1 MIT 2026-05-02
画像生成
GitHub
DisPOSE
この「DisPOSE」は、自己教師ありマルチビュー3D人体ポーズ推定のための実装です。離散的なクロスビュー人物割り当て…
★ 8 MIT 2026-06-15
AIエージェント
GitHub
AutoPilot-DevAgent
AutoPilot Devは、GitHubのプルリクエストURLを入力として受け取り、AIがコードレビュー、バグ修正の提案、テスト検…
★ 8 2026-06-09
3D / NeRF
GitHub
stechdrive-3dgs-utils
このツールは、360度カメラで撮影した動画を、3D Gaussian Splatting(3DGS)のトレーニングに利用できる画像、マス…
★ 8 MIT 2026-06-27
AIエージェント
GitHub
praxia
Praxiaは、個人の暗黙知を組織の共有ノウハウへと自動昇格させることに特化した、ワークフロー指向のマルチエージェ…
★ 8 Apache-2.0 2026-06-25
LLM
GitHub
ai-world-cup
AI World Cupは、FIFAワールドカップ2026の試合予測における無料の大規模言語モデル(LLM)の性能を比較するための、…
★ 8 ⑂ 2 MIT 2026-06-26
ComfyUI
GitHub
ComfyUI-LocateAnything
「ComfyUI-LocateAnything」は、NVIDIAのLocateAnything-3BビジュアルグラウンディングモデルをComfyUIで利用可能に…
★ 8 ⑂ 3 GPL-3.0 2026-06-01
AIエージェント
GitHub
muapi-mcp-server
MuAPI MCPサーバーは、Claude、Cursor、WindsurfなどのModel Context Protocol (MCP) 互換AIアシスタントをmuapi.ai…
★ 8 ⑂ 3 MIT 2026-06-16
3D / NeRF
GitHub
SEAR
SEARは、RGB画像と熱画像を組み合わせてカメラのポーズを推定する3D再構築プロジェクトです。Visual Geometric Trans…
★ 8 NOASSERTION 2026-05-07
AIエージェント
GitHub
career-forges
CareerForgesは、AIエージェントをローカルで実行することで、求職活動を自動化・最適化するためのオープンソースの…
★ 8 ⑂ 1 MIT 2026-06-11
音楽生成
GitHub
ACE-Step-Studio-pinokio
「ACE-Step Studio — Pinokio launcher」は、ローカルでAI音楽生成を可能にする「ACE-Step Studio」のワンクリックク…
★ 8 ⑂ 4 MIT 2026-05-06
マルチモーダル
GitHub
modalformer-lowlight
このプロジェクト「modalformer-lowlight」は、低照度環境で撮影された画像のノイズ、色の歪み、細部喪失を改善する…
★ 8 ⑂ 2 MIT 2026-05-01
音声生成 / TTS
GitHub
DeepInterview
DeepInterviewは、CVと職務経歴書をアップロードするだけで、AIが模擬面接官として音声で面接練習をサポートするオー…
★ 8 Apache-2.0 2026-06-24
ComfyUI
GitHub
OpenShot-ComfyUI
OpenShot-ComfyUIは、人気動画編集ソフトOpenShot向けに開発されたComfyUIノードのセットです。OpenShotとAIモデルの…
★ 8 ⑂ 2 GPL-3.0 2026-04-16
マルチモーダル
GitHub
GDB
GDB (GraphicDesignBench) は、グラフィックデザインタスクにおけるビジョン言語モデルの性能を評価するためのリアル…
★ 8 ⑂ 1 NOASSERTION 2026-05-05
LLM
GitHub
Local-LLM-Discord-Bot
このツールは、ローカルで動作するLLM(OllamaやLM Studio)をDiscordボットとして利用可能にします。これにより、ユ…
★ 8 ⑂ 2 MIT 2026-05-28
音楽生成
GitHub
aeon-music-maker
aeon-music-makerは、AEON Media Productionファミリーの一部であるスタンドアロンの音楽生成ツールです。ACE Step 1…
★ 8 ⑂ 3 MIT 2026-06-28