3,627 repos GH 3,512 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2212 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub whatfirst-small
whatfirst · smallは、タスクの優先順位付けを支援する、ローカルで動作する小型のビジョン言語モデル(Qwen2.5-VL-3…
★ 1 Apache-2.0 2026-06-19
音声生成 / TTS GitHub meloie
Meloieは、リアルタイムで動作するRVC(Retrieval-based Voice Conversion)ボイスチェンジャーのバージョン2です。…
★ 1 MIT 2026-06-15
ComfyUI GitHub ComfyUI-Voice
ComfyUI-Voiceは、ComfyUIに統合された、拡張可能なオーディオおよび音声処理ノードスイートです。テキスト音声合成…
★ 1 Apache-2.0 2026-06-18
3D / NeRF GitHub gaussian-splatter
「Gaussian Splatter / Particle Generator」は、ブラウザベースのThree.jsとGPGPUを活用したパーティクルビューアお…
★ 1 MIT 2026-06-15
音声生成 / TTS GitHub KuRL
KuRL AIは、インド系言語に特化した超高速Text-to-Speechエンジンで、ゼロショット音声クローン機能を搭載しています…
★ 1 MIT 2026-02-13
3D / NeRF GitHub GaussianSplatsGradientFlow
このプロジェクトは、「3D Gaussian Splatting for Real-Time Radiance Field Rendering」に記述されているGaussian …
★ 1 2026-05-16
音声生成 / TTS GitHub openclaw-fish-audio
Conan-Scott/openclaw-fish-audioは、OpenClaw向けのFish Audio TTS音声プロバイダプラグインです。高品質な音声クロ…
★ 1 ⑂ 1 MIT 2026-05-15
ASR / 音声認識 GitHub smart-class-attendance
「Sureshjangid99/smart-class-attendance」は、顔認識技術を活用した自動クラス出席管理システムです。教師が出席を…
★ 1 2026-04-27
ASR / 音声認識 GitHub Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
ASR / 音声認識 GitHub Lumina-AI
Lumina AIは、Next.jsとFastAPIを組み合わせ、Whisper ASR、OmniVoice TTS、Qwen LLM、SDXL画像生成を統合したマルチ…
★ 1 2026-06-05
音楽生成 GitHub Conditional-Music-Generation
このプロジェクトは、ギター演奏の音声録音を入力とし、その音楽的特徴に基づいてドラム、ベース、ハーモニーからな…
★ 1 MIT 2026-05-12
マルチモーダル GitHub -deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
LLM GitHub RoboGuard-RLAIF
このRoboGuardは、産業用ロボットUR10eのマニュアルに基づいた技術サポートを提供するエンタープライズRAGエージェン…
★ 1 2026-06-24
ASR / 音声認識 GitHub Sara-the-ai-assistant
S.A.R.A(Smart Autonomous Response Assistant)は、Pythonで構築された、JARVISにインスパイアされた完全音声制御…
★ 1 MIT 2026-06-29
音楽生成 GitHub story-to-music
このツールは、トルコ語のテキスト(物語、コンセプト、下書きなど)をSunoやUdioといった音楽生成AI向けの音楽プロ…
★ 1 MIT 2026-05-23
ASR / 音声認識 GitHub ai-voice-assistant-nlp
このプロジェクトはPythonと自然言語処理(NLP)を活用したAI音声アシスタントです。音声コマンドを理解し、ウェブ検…
★ 1 2026-05-25
マルチモーダル GitHub mllm-persona-evaluation
本ツールは、「都市センチメント認識のためのLLMエージェントにおけるペルソナの妥当性」に関する研究の公式実装です…
★ 1 CC-BY-4.0 2026-05-26
マルチモーダル GitHub ragonfire
RagOnFireは、Apple Silicon Mac向けに設計された完全ローカルなマルチモーダルRAG(検索拡張生成)システムです。Ol…
★ 1 MIT 2026-05-21
ComfyUI GitHub comfyui-Colab
このGitHubリポジトリは、Google Colab上でComfyUIとQwen-Image-Editモデルを簡単に展開・実行するためのインタラク…
★ 1 ⑂ 1 2026-06-06
マルチモーダル GitHub residuos_yolov11m_gemma3
このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…
★ 1 2026-06-13
音声生成 / TTS GitHub Easy-TTS-Toolkit
Easy TTS Toolkitは、音声合成(TTS)機能をPythonプロジェクトに手軽に組み込むためのツールキットです。開発者は、…
★ 1 MIT 2026-06-26
LLM GitHub FrameScope
FrameScopeは、Redditやニュース記事におけるAI言説の比喩表現とスタンスを、LLMを用いて収集、ラベリング、分析する…
★ 1 MIT 2026-05-07
3D / NeRF GitHub sfm-monocular-reconstruction
このプロジェクトは、単一の画像シーケンスから3D再構築を行うための2つの主要なアプローチ、Structure from Motion …
★ 1 MIT 2026-04-27
マルチモーダル GitHub xhs-note-reader
このツールは、中国のソーシャルメディア「小紅書」の図文ノート(画像とテキスト投稿)を、タイトル、本文、全画像…
★ 1 MIT 2026-05-19