3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub chorus
Chorusは、YouTubeの長い動画コンテンツを効率的に消費するための画期的なツールです。YouTubeのURLまたは思想家の名…
★ 6 2026-04-25
音声生成 / TTS GitHub kokopop
「kokopop」は、Pythonの依存関係なしにGGUF形式のKokoroテキスト読み上げモデルを実行するためのスタンドアロンC++…
★ 6 MIT 2026-05-29
マルチモーダル GitHub egobabyvlm
本リポジトリは、EgoBabyVLMチャレンジのインフラを提供します。これは、乳幼児の一人称視点ビデオデータ(BabyView …
★ 6 NOASSERTION 2026-06-23
ComfyUI GitHub MisoTTS-ComfyUI
MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ(TTS)ノードです。Miso TTS 8BモデルとMimiオーディオトークン…
★ 6 ⑂ 3 MIT 2026-06-04
LLM GitHub pioneer
Pioneerは、手元PCや自分で管理するサーバー上で動かせるローカルファーストの個人向けAIアシスタント基盤です。永続…
★ 6 MIT 2026-06-28
画像生成 GitHub chatgpt-web-gen
このツールは、ChatGPT Plus/Pro/Teamアカウントを持つユーザー向けに、APIキーなしでChatGPT Webの画像生成機能を利…
★ 6 ⑂ 1 MIT 2026-06-07
ASR / 音声認識 GitHub Live-Church-Captions
Church Capは、教会向けに開発されたオープンソースかつローカルファーストのリアルタイムキャプションアプリです。…
★ 6 MIT 2026-06-23
ASR / 音声認識 GitHub murmur
Murmurは、macOSユーザー向けのローカルファーストなホールド・トゥ・トーク音声文字変換アプリです。ホットキーを押…
★ 6 MIT 2026-06-09
音声生成 / TTS GitHub BridgeSpeak
BridgeSpeakは、AIコーディングエージェントに音声機能を提供するBridgeMind製のクロスエージェントスキルです。Open…
★ 6 ⑂ 2 MIT 2026-05-10
画像生成 GitHub spade
SPADEは、オフラインブラックボックス最適化において、サポートされていない領域での予測の過信を防ぐためのツールで…
★ 6 MIT 2026-06-09
画像生成 GitHub M2GenCO
M²GenCOは、拡散ベースのニューラル組み合わせ最適化のためのマルチタスクメタ学習フレームワークです。ICML 2026で…
★ 6 2026-05-26
音声生成 / TTS GitHub vocalis
Zencia Vocalisは、Microsoft VibeVoiceを基盤とした、オンデバイスで動作する会話型音声AIです。ユーザーがAIと音声…
★ 6 MIT 2026-05-21
音声生成 / TTS HF mel-roformer-kim-vocal-2-mlx
Apple Silicon向けのMLX形式に変換されたMel-Band-RoFormer系のボーカル分離モデルです。44.1kHzステレオ音源からボ…
❤ 6 ↓ 131 mit 2026-05-01
ASR / 音声認識 GitHub typoless
TypolessはmacOS向けのメニューバーアプリケーションで、グローバルな音声入力を可能にします。ローカルでの自動音声…
★ 6 ⑂ 1 2026-06-04
マルチモーダル GitHub CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 6 ⑂ 1 MIT 2026-05-19
画像生成 GitHub best-ai-image-generator-resources
AI画像生成に関する最適なリソース、モデル比較フレームワーク、プロンプトガイド、編集ワークフロー、およびClipris…
★ 6 2026-04-28
ASR / 音声認識 GitHub parrot
ParrotはmacOS向けの高速、無料、プライベートな音声入力ツールです。ショートカットを押すだけで、話した言葉をきれ…
★ 6 MIT 2026-05-30
ASR / 音声認識 GitHub game_voice_trans
VoxGoは、PCゲームプレイヤー向けに開発されたオープンソースのリアルタイム音声翻訳フロートウィンドウツールです。…
★ 6 GPL-3.0 2026-06-11
LLM GitHub agentic-workspace-core
このツールは、Daaaaave/agentic-workspace-coreという、コーディングエージェントのためのポータブルなワークスペー…
★ 6 MIT 2026-06-11
ComfyUI GitHub comfyui-ai-studio
ComfyUI AI Studioは、AI画像、動画、音楽生成のためのワークフロー駆動型クリエイティブスタジオです。ComfyUIの強…
★ 6 ⑂ 1 MIT 2026-05-03
LLM GitHub agentsync
agentsyncは、複数のデバイス間でMarkdownファイルなどのフォルダをリアルタイムに同期し、ポイントインタイムリカバ…
★ 6 2026-05-17
LLM GitHub whatsorag
RAG(Retrieval Augmented Generation)パイプラインの設計を支援するビジュアルウェブアプリケーション。データ取り…
★ 6 MIT 2026-06-08
音声生成 / TTS GitHub uttera-tts-hotcold
uttera-tts-hotcoldは、ハイブリッドな「Hot/Cold」ワーカーアーキテクチャとプラグ可能なバックエンド(Coqui XTTS-…
★ 6 ⑂ 2 Apache-2.0 2026-05-15
画像生成 GitHub comfyui-lighthouse
ComfyUI用のLighthouseは、ノード間の接続関係を視覚的に明確にする非破壊的なオーバーレイツールです。クリックした…
★ 6 ⑂ 2 2026-06-07