3,636 repos GH 3,521 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub bruno
macOS向けのミニマルなデスクトップコンパニオン「Bruno」は、画面を監視し、ユーザーがタスクから外れると音声で通…
★ 1 GPL-3.0 2026-06-14
マルチモーダル GitHub pdf2md_skill
「PDF2MD」は、Claude Codeスキルとして提供されるPDFからMarkdownへの変換ツールです。特にカスタムフォント、埋め…
★ 1 MIT 2026-06-07
音声生成 / TTS GitHub YOOS-APP
YOOS-APPは、ユーザー自身の執筆スタイルを学習し、その個性を保ったまま新しいコンテンツを生成するユニバーサルな…
★ 1 MIT 2026-06-05
画像生成 GitHub awesome-gpt-image-2
このリポジトリは、OpenAIのGPT Image 2で高品質な画像を生成するための2000以上のクリエイティブなプロンプトをまと…
★ 1 NOASSERTION 2026-05-05
音声生成 / TTS GitHub voice-send-mcp
voice-send-mcpは、AIチャットクライアント内で再生可能な短い音声メッセージ(TTSボイスバブル)を送信するためのス…
★ 1 MIT 2026-06-17
マルチモーダル GitHub clip-from-scratch
このプロジェクトは、PyTorchでContrastive Language-Image Pre-training (CLIP) をゼロから実装したものです。「同…
★ 1 MIT 2026-05-12
動画生成 GitHub mcp-litmedia
このツールは、MCP(Model Context Protocol)サーバーであり、litmedia.aiのテキストから画像生成、画像から動画生…
★ 1 ⑂ 2 MIT 2026-05-11
3D / NeRF GitHub hybrid-3d-human-reconstruction
RGB-Dカメラとグラフニューラルネットワーク、LSTM、確率的モーション推定を組み合わせた、リアルタイム動的3D人体再…
★ 1 MIT 2026-04-20
ASR / 音声認識 GitHub Sara-the-ai-assistant
S.A.R.A(Smart Autonomous Response Assistant)は、Pythonで構築された、JARVISにインスパイアされた完全音声制御…
★ 1 MIT 2026-06-29
LLM GitHub Scalable-RAG-Application
このツールは、スケーラブルで低遅延、高信頼性のAI駆動型情報検索を実現する、プロダクショングレードのマルチエー…
★ 1 2026-06-01
ASR / 音声認識 GitHub visionreview-ai-showcase
VisionReview AIは、AIを活用した動画レビューおよび編集ワークフローシステムです。ビデオ編集者、コンテンツクリエ…
★ 1 2026-05-25
ASR / 音声認識 GitHub dji-mic-command
このツール「DJI Mic Command」は、DJIワイヤレスマイク受信機の接続ボタンをmacOSの右Commandキーに変換するユーテ…
★ 1 MIT 2026-05-25
ASR / 音声認識 GitHub local-dictation
Apple Silicon搭載Mac向けに設計された、超低遅延かつ完全オンデバイスで動作する音声入力ツールです。ホットキーを…
★ 1 Apache-2.0 2026-06-24
AIエージェント GitHub traceforge
TraceForgeは、AIコーディングエージェントやシェルコマンドの実行をローカルで詳細に記録し、監査するためのブラッ…
★ 1 MIT 2026-05-28
マルチモーダル GitHub qwen-visual-training-lab
「Qwen visual training lab」は、Windows環境でAMD GPUとDirectMLを利用し、QwenスタイルのビジュアルLoRA実験の実…
★ 1 2026-05-15
画像生成 GitHub claude-imagegen-skill
このClaude Codeスキルは、DALL-EによるAI画像生成、デザインシステムのインテリジェンス、およびPencil MCPとの統合…
★ 1 MIT 2026-05-30
LLM GitHub rag-chatbot-university
UniMindは、大学生向けのAIを活用したRAG(検索拡張生成)チャットボットで、大学のノートに関する質問に即座に答え…
★ 1 2026-05-30
マルチモーダル GitHub PrismRAG
PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…
★ 1 MIT 2026-06-20
LLM GitHub calfcord
Calfcordは、Discordサーバー内で独自のペルソナを持つAIエージェントの分散チームを構築できるツールです。各エージ…
★ 1 Apache-2.0 2026-06-22
動画生成 GitHub nuwa-skill
nuwa-skillは、特定の人物の思考、意思決定、話し方のパターンを詳細に分析し、その情報を再利用可能なモデルとして…
★ 1 2026-06-25
マルチモーダル GitHub MultiModal-from-scratch
このリポジトリは、PyTorchを使ってマルチモーダル大規模言語モデル(VLM)をゼロから構築するための詳細なステップ…
★ 1 2026-06-06
ASR / 音声認識 GitHub AKIRA-AI-Voice-Assistant
AKIRAはPython製のパーソナルAI音声アシスタントで、音声コマンドにより日常のPC作業を自動化します。ウェイクワード…
★ 1 2026-06-08
動画生成 GitHub veo-3.1-api
本リポジトリは、Google DeepMindの高度なビデオ生成モデル「Veo 3.1 API」をAPIDot経由で利用するための豊富なサン…
★ 1 MIT 2026-06-14
LLM GitHub prompt-template-hub
「一键 Prompt」は、日常のAIチャットで高品質なプロンプトテンプレートを素早く見つけ、生成し、入力できる軽量なCh…
★ 1 MIT 2026-06-10