3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
音声生成 / TTS GitHub Narracast
Narracastは、macOSユーザー向けのオフライン音声コンテンツ生成ツールです。任意のテキストを貼り付けるだけで、ク…
★ 1 MIT 2026-06-09
LLM GitHub knowshelf
「Knowshelf」は、Go言語で書かれた個人用Markdown書籍知識ベース管理ツールです。Markdown形式の書籍をローカルのSQ…
★ 1 Apache-2.0 2026-05-18
音声生成 / TTS GitHub narrateflow
NarrateFlowは、PPTやドキュメントを音声クローン、タイムライン調整、リタイムド動画合成機能を備えたナレーション…
★ 1 ⑂ 1 Apache-2.0 2026-06-14
ComfyUI GitHub comfyui-vsco-scraper
このcomfyui-vsco-scraperは、ComfyUI用のカスタムノードパックで、公開されているVSCOプロフィールから画像をスクレ…
★ 1 ⑂ 1 MIT 2026-03-29
LLM GitHub ontorag
ontoragは、RDF/OWLオントロジーを真の情報源として活用する、オントロジー対応RAG(Retrieval-Augmented Generation…
★ 1 ⑂ 1 MIT 2026-06-16
ComfyUI GitHub ComfyUI-Smart-Metadata-Reader
ComfyUI-Smart-Metadata-Readerは、ComfyUIで生成された画像のメタデータをインテリジェントに読み取るPython製のカ…
★ 1 2026-05-28
動画生成 GitHub Agentic-video-pipeline
このプロジェクトは、テキストプロンプトからプラットフォーム対応のビデオを自動生成する自律型マルチエージェントA…
★ 1 2026-06-13
画像生成 GitHub comfyui-character-picker
「ComfyUI Character Picker」は、ComfyUIのカスタムノードとして機能し、9500以上の膨大なアニメ/ゲームキャラクタ…
★ 1 ⑂ 1 MIT 2026-06-04
音声生成 / TTS GitHub agentic-podcast
このツールは、データ駆動型のポッドキャストを人間が介入することなく毎日自動で生成し、ナレーションを付け、Spoti…
★ 1 MIT 2026-06-10
3D / NeRF GitHub SparseNeRF-pytorch
本ツールは、SparseNeRFに触発された、スパースビュー(少数の視点からの画像)からの新しい視点合成を目的とした非…
★ 1 MIT 2026-06-07
LLM GitHub KnowledgeBase
KnowledgeBaseは、ばらばらのメモを構造化された個人用Wikiに変換し、知識管理を支援するツールです。LLMを活用して…
★ 1 Apache-2.0 2026-06-26
マルチモーダル GitHub whatfirst-small
whatfirst · smallは、タスクの優先順位付けを支援する、ローカルで動作する小型のビジョン言語モデル(Qwen2.5-VL-3…
★ 1 Apache-2.0 2026-06-19
音声生成 / TTS GitHub meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
ComfyUI GitHub ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
マルチモーダル GitHub uitars-mcp
UI-TARS MCPは、AIエージェントがデスクトップとウェブブラウザを操作するための「目と手」を提供するサーバーツール…
★ 1 Apache-2.0 2026-06-07
ComfyUI GitHub ConfyUI_Post_Processing_PRO
「Post_Processing_PRO for ComfyUI」は、ComfyUI向けにキュレーションされたプロフェッショナルかつ高忠実度の後処…
★ 1 ⑂ 1 GPL-3.0 2026-04-14
音声生成 / TTS GitHub NeuralSoundForge
NeuralSoundForgeは、StyleGAN2とセマンティック因数分解を駆使した高度な深層学習プラットフォームです。このツール…
★ 1 2026-02-06
ASR / 音声認識 GitHub Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
音楽生成 GitHub Conditional-Music-Generation
このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…
★ 1 MIT 2026-05-12
マルチモーダル GitHub -deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
LLM GitHub RoboGuard-RLAIF
このRoboGuardは、産業用ロボットUR10eのマニュアルに基づいた技術サポートを提供するエンタープライズRAGエージェン…
★ 1 2026-06-24
AIエージェント GitHub pi-context-pruner
pi-context-prunerは、AIエージェントPiのセッションコンテキストを最適化するためのツールです。冗長なセッションか…
★ 1 2026-05-30
動画生成 GitHub WaveSpeedAI-Skills
WaveSpeedAI Skillsは、700以上のメディアモデルと290以上のOpenAI互換LLMを統合したWaveSpeedAI推論プラットフォー…
★ 1 MIT 2026-05-21