3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub ReceiptIQ
このツールは、レシートの画像から支出データを自動的に抽出し、その内容について自然言語で質問できる領収書解析AI…
★ 1 2026-06-03
音声生成 / TTS GitHub md-tts
md-ttsは、技術的なMarkdownファイルを音声で読み上げ、コードブロック、テーブル、フラッシュカードで再生をインタ…
★ 1 MIT 2026-06-04
マルチモーダル GitHub MultiModal-from-scratch
このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル(VLM)をゼロから構築するための詳細なステップ…
★ 1 2026-06-06
音声生成 / TTS GitHub bol-sakhi-communication-board
脳卒中からの回復者向けに設計された、アクセシブルでバイリンガル(英語とパンジャブ語)の絵ベースコミュニケーシ…
★ 1 MIT 2026-06-11
ComfyUI GitHub ComfyUI-Metadata-Tools
ComfyUI向けのカスタムノード集で、画像メタデータの読み取り・付与・保存をワークフロー内で完結できます。画像読み…
★ 1 ⑂ 1 MIT 2026-01-15
AIエージェント GitHub bug-bounty-hunting-agent
このツールは、AIを活用したバグバウンティハンティングのための包括的な知識ベースです。Matomo、Jetpack、WooComme…
★ 1 MIT 2026-05-13
音声生成 / TTS GitHub amd-zluda-local-tts-image-ai
本リポジトリは、AMD Radeon GPU(RDNA2/ZLUDA)を搭載したWindows環境で、ローカルAI(Stable Diffusion XL、Z-Imag…
★ 1 ⑂ 1 MIT 2026-06-07
3D / NeRF GitHub classic_multiview_3d_recon
このツールは、複数の視点から撮影された画像を使用して、COLMAPとopenMVSを統合し、高精度な3Dモデルを再構築するた…
★ 1 MIT 2026-05-10
LLM GitHub pull-request-summary
このGitHubアクションは、AI(LLM)を活用してプルリクエストの内容を自動的に要約し、開発者の負担を軽減します。主…
★ 1 MIT 2026-06-18
3D / NeRF GitHub telemetry-frame-mapper
本ツールは、DJIドローンで撮影された動画をGPS情報付きの3Dガウシアンスプラットへ変換する完全なパイプラインを提…
★ 1 MIT 2026-06-26
音声生成 / TTS GitHub Easy-TTS-Toolkit
Easy TTS Toolkitは、音声合成(TTS)機能をPythonプロジェクトに手軽に組み込むためのツールキットです。開発者は、…
★ 1 MIT 2026-06-26
3D / NeRF GitHub UP.route
UP.routeは、ヴロツワフ生命環境科学大学の修士論文プロジェクトとして開発された3Dウェブジオポータルアプリケーシ…
★ 1 2026-06-26
画像生成 GitHub openvino-gpu-llm-server
このプロジェクトは、Intel統合GPU(特にUHD 620以降)に最適化された、OpenAI互換のLLM推論APIサーバーです。OpenVI…
★ 1 2026-06-17
ASR / 音声認識 GitHub panakoes
Panakoesは、音声のキャプチャ、文字起こし、AIによるインサイト抽出を提供するオープンソースのクラウドプラットフ…
★ 1 MIT 2026-06-29
画像生成 GitHub Lumina-AI
Lumina AIは、高度なマルチモーダルAIバーチャルコンパニオン兼アシスタントです。Gradioインターフェース上で動作し…
★ 1 MIT 2026-06-22
ASR / 音声認識 GitHub whisper-dictate
Whisper Dictateは、Windows向けの無料オープンソースプッシュツートーク音声ディクテーションツールです。右Ctrlキ…
★ 1 NOASSERTION 2026-06-10
LLM GitHub RePrompT
RePrompTは、電子健康記録(EHR)データを大規模言語モデル(LLM)と統合するための、時間認識型LLMフレームワークの…
★ 1 Apache-2.0 2026-04-17
画像生成 GitHub gpt-image-2
「GPT Image 2」は、OpenAIの最新画像生成モデルを基盤とした無料のAI画像生成ツールです。テキストプロンプトから写…
★ 1 MIT 2026-06-01
画像生成 GitHub deepbooru-tagwalker
Deepbooru TagWalkerは、Stable DiffusionのDeepbooruタグデータセットの品質を向上させるためのツールです。本ツー…
★ 1 ⑂ 1 MIT 2026-05-03
ComfyUI GitHub ComfyUI_RH_ZImageI2L
ComfyUI_RH_ZImageI2Lは、人気の画像生成UI「ComfyUI」を拡張するプラグインです。Z-Image-i2L機能をComfyUIに統合す…
★ 1 Apache-2.0 2026-06-25
LLM GitHub language-learning-companion
このAI搭載型語学学習コンパニオンは、NestJS、Next.js、PostgreSQL、pgvectorを技術スタックとして構築されています…
★ 1 2026-06-13
画像生成 GitHub hermes-lemonade-llm-image-support
このプラグインは、Hermesエージェント向けにLemonade Serverを介した高速なローカル画像生成とLLM利用を可能にしま…
★ 1 MIT 2026-06-03
動画生成 GitHub NAVA-Text-to-Video
NAVA-Text-to-Videoは、高度なオーディオビジュアル生成フレームワークです。Native Audio-Visual Alignment (NAVA) …
★ 1 ⑂ 1 Apache-2.0 2026-06-05
動画生成 GitHub veo-3.1-api
本リポジトリは、Google DeepMindの高度なビデオ生成モデル「Veo 3.1 API」をAPIDot経由で利用するための豊富なサン…
★ 1 MIT 2026-06-14