3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub PROSOPO
「Face AI」は、バイアス軽減に重点を置いた最先端の公平な顔認識システムです。顔検出、アライメント、埋め込み抽出…
★ 1 2026-05-22
音声生成 / TTS GitHub tts-blendr
VoiceBlend-TUIは、Textualフレームワークで構築されたターミナルUI(TUI)アプリケーションです。テキストファイル…
★ 1 2026-04-29
AIエージェント GitHub traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
ASR / 音声認識 GitHub VoiceAgentAI
このツールは、OpenAIのLLMを統合したリアルタイムAI音声アシスタントです。音声認識(STT)と音声合成(TTS)をシー…
★ 1 MIT 2026-05-25
マルチモーダル GitHub vision-bridge
Vision Bridgeは、DeepSeek V4 PROやGPT-4o-textのような純粋なテキストベースのLLMに「視覚能力」を付与するツール…
★ 1 NOASSERTION 2026-06-12
LLM GitHub seas
SEASとArgoは、AIの最前線で働くための補完的なシステムです。SEASはフロンティアのシグナルから「何が真実か」を探…
★ 1 NOASSERTION 2026-06-26
ASR / 音声認識 GitHub funasr-whisper-api
このツールは、FunASRとParaformer-zhを基盤としたローカル音声転写APIを提供します。OpenAI Whisper APIと高い互換…
★ 1 MIT 2026-06-14
マルチモーダル GitHub pdf2md_skill
「PDF2MD」は、Claude Codeスキルとして提供されるPDFからMarkdownへの変換ツールです。特にカスタムフォント、埋め…
★ 1 MIT 2026-06-07
ComfyUI GitHub comfyui-weaver
comfyui-weaverは、Claude CodeがComfyUI(ローカルおよびComfy Cloud)を操作できるようにする自己完結型MCPサーバ…
★ 1 MIT 2026-06-11
画像生成 GitHub ComfyUI-Orakul-3K-Resolution
ComfyUI-Orakul-3K-Resolutionは、ComfyUIユーザー向けに、数学的な計算によるグリッチやアーティファクトを排除した…
★ 0 MIT 2026-05-20
動画生成 GitHub c5-video-agents
「Zian-anson/c5-video-agents」は、ユーザーの一言の要求から、画像、ナレーション、字幕、BGMを含む完全なMP4動画…
★ 0 ⑂ 1 MIT 2026-05-11
LLM GitHub insurvoice-ai
InsurVoice AIは、保険顧客サービス向けのAI音声エージェント「Tina」です。Deepgramによるライブ音声認識、Claudeに…
★ 0 2026-06-19
ASR / 音声認識 GitHub ai-meeting-live-transcriber
MeetScribe AIは、Python、Whisper、WebSocket、Next.jsを組み合わせたAI搭載のリアルタイム会議アシスタントです。…
★ 0 2026-05-21
画像生成 GitHub fooocus-zh-local-patch
このプロジェクトは、Fooocusの非公式な中国語ローカルUIパッチです。既存のFooocus環境にコピーして使用することで…
★ 0 NOASSERTION 2026-04-29
LLM GitHub fish-ecology-assistant
Panta Rhei · Everything Flows(Fish Ecology Assistant)は、コーディングエージェントを動的な世界観とDeepSeekレ…
★ 0 MIT 2026-06-25
3D / NeRF GitHub GHOST
GHOST(Geometric Human Out-of-sync Spatio Temporal reconstruction)は、カジュアルな非同期マルチビュー動画から…
★ 0 MIT 2026-06-23
ASR / 音声認識 GitHub meeting-auto-summary
Meeting Auto Summaryは、会議の音声や動画を構造化された成果物(話者分離された文字起こし、字幕、要約、レポート…
★ 0 2026-06-04
LLM GitHub danwa
Danwa(だんわ)は、AIエージェントが議論を分析、評価、最適化するための監査可能なマルチエージェント討論プラット…
★ 0 2026-06-29