3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2211 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
ComfyUI GitHub comfyui-cyberdelia-metadata
このツールは、ComfyUIの標準画像保存機能を拡張し、Civitaiと互換性のある詳細な画像メタデータ(シード、モデル、L…
★ 1 ⑂ 1 GPL-3.0 2026-05-26
LLM GitHub ontorag
ontoragは、RDF/OWLオントロジーを真の情報源として活用する、オントロジー対応RAG(Retrieval-Augmented Generation…
★ 1 ⑂ 1 MIT 2026-06-16
ComfyUI GitHub ComfyUI-Smart-Metadata-Reader
ComfyUI-Smart-Metadata-Readerは、ComfyUIで生成された画像のメタデータをインテリジェントに読み取るPython製のカ…
★ 1 2026-05-28
動画生成 GitHub Agentic-video-pipeline
このプロジェクトは、テキストプロンプトからプラットフォーム対応のビデオを自動生成する自律型マルチエージェントA…
★ 1 2026-06-13
画像生成 GitHub comfyui-character-picker
「ComfyUI Character Picker」は、ComfyUIのカスタムノードとして機能し、9500以上の膨大なアニメ/ゲームキャラクタ…
★ 1 ⑂ 1 MIT 2026-06-04
音声生成 / TTS GitHub agentic-podcast
このツールは、データ駆動型のポッドキャストを人間が介入することなく毎日自動で生成し、ナレーションを付け、Spoti…
★ 1 MIT 2026-06-10
3D / NeRF GitHub SparseNeRF-pytorch
本ツールは、SparseNeRFに触発された、スパースビュー(少数の視点からの画像)からの新しい視点合成を目的とした非…
★ 1 MIT 2026-06-07
LLM GitHub KnowledgeBase
KnowledgeBaseは、ばらばらのメモを構造化された個人用Wikiに変換し、知識管理を支援するツールです。LLMを活用して…
★ 1 Apache-2.0 2026-06-26
マルチモーダル GitHub whatfirst-small
whatfirst · smallは、タスクの優先順位付けを支援する、ローカルで動作する小型のビジョン言語モデル(Qwen2.5-VL-3…
★ 1 Apache-2.0 2026-06-19
音声生成 / TTS GitHub meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
ComfyUI GitHub ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
ComfyUI GitHub ComfyUI-KittenTTS
ComfyUI向けのカスタムノード「KittenTTS」を追加し、入力したテキストを選択した音声モデルで読み上げ音声へ変換で…
★ 1 ⑂ 1 Apache-2.0 2025-08-09
ASR / 音声認識 GitHub voxtral-journal
このプロジェクトは、個人のオーディオジャーナルをローカル環境で書き起こし、要約するためのプログラムです。Windo…
★ 1 NOASSERTION 2026-05-14
LLM GitHub local-ai-research-assistant
このツールは、OllamaなどのローカルLLM、ウェブ検索、コンテンツ抽出、および構造化レポート生成を活用した自律的な…
★ 1 MIT 2026-05-14
3D / NeRF GitHub mobile-gs-scan
Pebbleは、高価な3Dスキャンサービスに代わる、NVIDIA製GPUユーザー向けのセルフホスト型3Dスキャンスタジオです。We…
★ 1 2026-05-15
ASR / 音声認識 GitHub AdversialQA
本ツールは、AIを活用した模擬試験シミュレーターであり、論文のPDFや履歴書をアップロードすることで、AIが厳しい質…
★ 1 2026-05-19
ASR / 音声認識 GitHub kokkai-webtv-captions
「kokkai-webtv-captions」は、国立国会図書館の国会会議録が公式に公開されるまでの未収録期間を埋めるための個人用…
★ 1 MIT 2026-05-25
3D / NeRF GitHub comfyui-3D-viewport
ComfyUIワークフロー向けに設計された、ネイティブOpenGL 3Dビューポートです。物理カメラに忠実な表現が可能で、深…
★ 1 2026-05-15
ASR / 音声認識 GitHub Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
音楽生成 GitHub Conditional-Music-Generation
このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…
★ 1 MIT 2026-05-12
マルチモーダル GitHub -deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
LLM GitHub RoboGuard-RLAIF
このRoboGuardは、産業用ロボットUR10eのマニュアルに基づいた技術サポートを提供するエンタープライズRAGエージェン…
★ 1 2026-06-24
ComfyUI GitHub Comfyui-Nanobanana-API
ComfyUI向けのカスタムノードで、OpenRouter API経由でGemini系の画像生成モデルを呼び出せるツールです。テキストプ…
★ 0 ⑂ 1 2025-12-17