3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

ASR / 音声認識
GitHub
Jarvis
Jarvis Vision Assistantは、Python、Arduino、ウェブカメラ、テキスト読み上げ、Google Gemini Vision、パン/チルト…
★ 1 2026-06-17
画像生成
GitHub
Stream_Mirror
StreamMirrorは、Webカメラの映像をリアルタイムでアニメ、水墨画、ファンタジー風といった様々なスタイルに変換する…
★ 1 MIT 2026-05-13
3D / NeRF
GitHub
gaussian-splatter
「Gaussian Splatter / Particle Generator」は、ブラウザベースのThree.jsとGPGPUを活用したパーティクルビューアお…
★ 1 MIT 2026-06-15
ASR / 音声認識
GitHub
perihelion
Perihelionは、VRChat向けに設計された音声認識(ASR)アプリケーションです。VRChatとOSCを介して連携し、ユーザー…
★ 1 2026-06-15
ComfyUI
GitHub
ComfyUI-Image-Compress
ComfyUI用のカスタムノードで、JPEGまたはPNG形式での画像圧縮を可能にします。エンコード品質と出力スケールを独立…
★ 1 ⑂ 1 MIT 2026-04-07
ASR / 音声認識
GitHub
tiktok-extractor
このツールは、TikTokのURLから動画のメタデータ、完全な文字起こし、シーンのキーフレーム、画面上のOCRテキストを…
★ 1 MIT 2026-05-24
画像生成
GitHub
EdgeDiffusion
EdgeDiffusionは、SDXL-Lightningモデルをエッジデバイス向けに最適化し、限られたリソースでの推論を可能にする再現…
★ 1 2026-06-07
音声生成 / TTS
GitHub
tts-video-generator
この「TTS Video Generator」は、Python、ElevenLabsの音声合成、FFmpegを組み合わせて、AI音声と同期字幕付きの短い…
★ 1 ⑂ 1 MIT 2026-06-23
ASR / 音声認識
GitHub
Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
ComfyUI
GitHub
Centraliza.AI
Centraliza.AIは、LM Studio、Ollama、ComfyUI、Llama.cppなどのローカルAIモデルを一元管理するためのプレミアムダ…
★ 1 2026-06-04
マルチモーダル
GitHub
Prismer
Prismerは、OpenAI Prismのオープンソース代替として開発されたツールで、AIとのスムーズな連携と高度なコンテキスト…
★ 1 NOASSERTION 2026-06-25
画像生成
GitHub
kohya_ss-starter-cmd-code
このツールは、画像生成AIツール「Kohya SS」の起動プロセスを簡略化するワンクリックランチャーです。ユーザーが毎…
★ 1 2026-05-22
動画生成
GitHub
littleorange-video-mcp
LittleOrange Video MCPは、Model Context Protocol(MCP)に基づく動画生成サーバーサイドツールです。Sora2、Veo3.…
★ 1 2026-06-04
LLM
GitHub
light-ai-playground
AI Playgroundは、LLMエージェントの実験に特化したローカル開発ツールです。ユーザーはMarkdownでエージェントを記…
★ 1 MIT 2026-06-12
音声生成 / TTS
GitHub
Cadence
Cadenceは、Windowsユーザー向けのプライベートかつローカルファーストな会議録音・文字起こしツールです。会議音声…
★ 1 MIT 2026-06-16
ASR / 音声認識
GitHub
voiceintake
「VoiceIntake」は、AIを活用して患者の音声問診を自動化するシステムです。患者が話すだけでAIが問診内容を瞬時に文…
★ 1 2026-06-16
ComfyUI
GitHub
comfy-modal-kit
このライブラリは、モバイル環境でのComfyUIカスタムノードパック向けに設計された共有UIプリミティブを提供します。…
★ 1 2026-06-15
3D / NeRF
GitHub
Panoptic-MapAnything
このプロジェクトは、既存の3Dパノプティックシーンセグメンテーション手法が持つ高コストな最適化や入力制約といっ…
★ 1 Apache-2.0 2026-04-13
音声生成 / TTS
GitHub
MyFreeSpeech-App-Reader
このツールは、PowerShellで構築された高機能なテキスト読み上げ(TTS)アプリケーション「My Free Speech Reader」…
★ 1 GPL-3.0 2026-05-17
ComfyUI
GitHub
ConfyUI_Post_Processing_PRO
「Post_Processing_PRO for ComfyUI」は、ComfyUI向けにキュレーションされたプロフェッショナルかつ高忠実度の後処…
★ 1 ⑂ 1 GPL-3.0 2026-04-14
ASR / 音声認識
GitHub
AdversialQA
本ツールは、AIを活用した模擬試験シミュレーターであり、論文のPDFや履歴書をアップロードすることで、AIが厳しい質…
★ 1 2026-05-19
音声生成 / TTS
GitHub
mlx-indextts-webui
このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。FastAPIをバックエン…
★ 1 NOASSERTION 2026-05-20
LLM
GitHub
langgraph
Roco Kingdomは、多エージェント協力に基づく『洛克王国』ゲームの精霊百科システムです。自然言語で精霊情報、属性…
★ 1 2026-05-22
音楽生成
GitHub
story-to-music
このツールは、トルコ語のテキスト(物語、コンセプト、下書きなど)をSunoやUdioといった音楽生成AI向けの音楽プロ…
★ 1 MIT 2026-05-23