3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
3D / NeRF GitHub UnMix-NeRF
UnMix-NeRFは、ICCV 2025で発表される新しい手法で、スペクトルアンミキシングをNeural Radiance Fields (NeRF) に統…
★ 18 ⑂ 2 Apache-2.0 2025-11-17
3D / NeRF GitHub FruitNeRFpp
FruitNeRF++は、果樹園における多様な果物の計数を汎用的に行うための新しい手法です。コントラスト学習とニューラル…
★ 18 ⑂ 1 Apache-2.0 2025-12-14
マルチモーダル GitHub JibarOS
JibarOSは、Android 16をベースにAIをプラットフォームの基盤機能として統合したOSのフォークです。テキスト補完や画…
★ 18 Apache-2.0 2026-05-06
ComfyUI GitHub ComfyUI-Actual-Denoise
ComfyUI-Actual-Denoiseは、ComfyUIのimg2imgプロセスにおいて、ノイズ量を実際に設定するためのシンプルなカスタム…
★ 18 ⑂ 1 GPL-3.0 2026-02-26
ASR / 音声認識 GitHub voicetype
VoiceTypeは、シーン適応型のAI音声入力ツールで、アプリケーションの切り替えを自動で認識します。ローカルオフライ…
★ 17 ⑂ 3 AGPL-3.0 2026-04-15
ASR / 音声認識 GitHub watch
「/watch」は、YouTube、Instagram、X(旧Twitter)など多様なオンライン動画サイトやローカルファイルから、Claude…
★ 17 ⑂ 1 MIT 2026-05-29
画像生成 GitHub RealUID
RealUIDは、ICLR 2026で発表された「Universal Inverse Distillation for Matching Models with Real-Data Supervisi…
★ 17 ⑂ 1 MIT 2026-06-24
音声生成 / TTS GitHub wallie-V2
AI VTuber/ストリーマーフレームワーク「Wallie」は、リアルタイムの視覚認識、個性エンジン、リップシンクアバター…
★ 17 ⑂ 3 MIT 2026-06-18
LLM GitHub AgentSimulator
AI Agent Simulatorは、実際のAIエージェントがチャットメッセージを処理する内部プロセスをリアルタイムで可視化す…
★ 17 ⑂ 5 MIT 2026-06-28
ASR / 音声認識 GitHub speaky
SpeakyはmacOS向けの音声テキスト変換ツールです。ホットキーを押して話すだけで、オンデバイスAIまたはオプションで…
★ 17 ⑂ 4 MIT 2026-03-09
LLM GitHub rag-system-pgvector
PostgreSQLのpgvector拡張を用いた、本番環境に対応したRAG (Retrieval-Augmented Generation) システムです。セマン…
★ 17 MIT 2026-03-24
画像生成 GitHub av-pedestrian-diffusion-mppi
このツールは、UIUC Polaris GEM e4向けの歩行者認識自律走行スタック「ADAPT」です。拡散ベースの歩行者軌道予測器…
★ 17 ⑂ 3 MIT 2026-06-09
ComfyUI GitHub ShrinkComfy
ShrinkComfyは、ComfyUIで生成されたPNG画像を、ワークフローメタデータを保持したままWEBPまたはJPG形式に縮小するW…
★ 17 2026-05-02
LLM GitHub konash
KONASHは、強化学習を用いて知識エージェントを訓練するツールです。文書コーパスから「検索する方法」を学習するエ…
★ 17 2026-03-23
ComfyUI GitHub ComfyUI-Olm-Liquify
Olm Liquifyは、Photoshopの「ゆがみ」ツールに着想を得たComfyUI用カスタムノードです。画像の一部をインタラクティ…
★ 17 ⑂ 2 NOASSERTION 2026-05-20
マルチモーダル GitHub agent-notch
macOSのMシリーズMacBookのノッチ部分に常駐するAIエージェントです。ユーザーは音声で指示を出し、Claude Sonnetが…
★ 17 MIT 2026-05-23
ComfyUI GitHub ComfyUI-TensorRT-Reforge
「ComfyUI-TensorRT-Reforge」は、ComfyUI向けに最適化された超高速TensorRTエンジンエクスポート・ロードツールです…
★ 17 ⑂ 2 MIT 2026-06-30
ASR / 音声認識 GitHub Silence-Cutter
Silenciは、AIを活用して動画の無音部分を自動的に除去し、完璧に同期した字幕を生成するmacOSネイティブアプリケー…
★ 17 ⑂ 3 Apache-2.0 2026-03-31
マルチモーダル GitHub paddleocr-pdf-api
このツールは、PDFをOCR処理し、結果をMarkdown形式で返す自己ホスト型APIです。PaddleOCRとPaddleOCR-VLモデルを搭…
★ 17 ⑂ 5 2026-06-10
ASR / 音声認識 GitHub Echo
GitHubPhobosが開発した「Ech👂 Voice Typing Assistant」は、高速でプライバシーを重視したプッシュトゥトーク方式…
★ 17 ⑂ 1 MIT 2026-05-18
LLM GitHub citelocal-agent
docagentは、手元の論文やローカルドキュメントに対して質問し、ページ単位で正確かつ検証済みの引用付き回答を得ら…
★ 17 MIT 2026-06-28
画像生成 GitHub diffusers-tuner
Diffusers Tunerは、Hugging Face Diffusersモデルのファインチューニングにおける複雑さとオーバーヘッドを排除する…
★ 17 MIT 2026-04-15
ComfyUI GitHub comfyui-refocus
EricRollei/comfyui-refocusは、ComfyUI用のカスタムノード集で、生成型リフォーカシングパイプラインを実装していま…
★ 17 ⑂ 1 Apache-2.0 2026-05-04
ASR / 音声認識 GitHub docker-whisper-live
hwdsl2/docker-whisper-liveは、faster-whisperを基盤とした自己ホスト型リアルタイム音声テキスト変換サーバーをDoc…
★ 17 ⑂ 1 NOASSERTION 2026-06-27