3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
Cartesia
Cartesiaは、tryAGIが提供する低遅延のText-to-Speech (TTS)、Speech-to-Text (STT)、音声クローニング、AIエージェ…
★ 1 MIT 2026-06-23
マルチモーダル
GitHub
PrismRAG
PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…
★ 1 MIT 2026-06-20
動画生成
GitHub
Comic-drama
「Comic Drama Workflow」は、AIを活用してスクリプトからコミックドラマを制作するオープンソースのツールです。ス…
★ 1 MIT 2026-06-07
AIエージェント
GitHub
cell-mem
Cell-memは、AIエージェント向けに脳にインスパイアされた多層的な永続メモリシステムです。作業記憶、エピソード記…
★ 1 MIT 2026-06-09
音声生成 / TTS
GitHub
sympho
SymphoはElevenLabs.ioを基盤とした、オープンソースで高性能なAI音声生成ソリューションです。テキストからスピーチ…
★ 1 2025-09-13
マルチモーダル
GitHub
ai-chef-multimodal-assistant
AI Chefは、自宅にある食材からレシピを生成するAI搭載のマルチモーダル料理アシスタントです。テキスト入力または食…
★ 1 2026-06-09
マルチモーダル
GitHub
Wally-like-Storytelling-Scene-Interactor
この「Wally-like Storytelling Scene Interactor」は、テキストを基に画像を生成し、その画像内の特定の領域をマス…
★ 1 2025-08-12
LLM
GitHub
Content-Vigilante
Content Vigilanteは、ブランドガイドと対象コンテンツをもとに、文章がブランドの文体や語彙、構成、読みやすさに合…
★ 1 MIT 2026-06-22
ASR / 音声認識
GitHub
ClearWord
ClearWordは、AIを搭載した会話回復エージェントであり、聴覚に困難を抱える人々が会話で聞き逃した部分を理解するの…
★ 1 MIT 2026-06-11
LLM
GitHub
scrape-website-mcp
scrape-website-mcpは、ウェブサイトを高性能にスクレイピングし、クリーンなMarkdown形式でコンテンツを抽出するセ…
★ 1 MIT 2026-05-12
マルチモーダル
GitHub
mlx-mtp
mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…
★ 1 Apache-2.0 2026-06-16
音楽生成
GitHub
musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
LLM
GitHub
model-monitor
「模型 API 监控工具」は、OpenAI、DeepSeek、MiMoなど、複数のモデルAPIの利用状況をリアルタイムで監視・管理する…
★ 1 MIT 2026-06-25
画像生成
GitHub
nano-banana-2-api
APIDotのNano Banana 2 APIは、GoogleのGemini 3.1 Flash Imageモデルを活用し、高速で高品質な画像生成と自然言語に…
★ 1 MIT 2026-05-25
LLM
GitHub
local-ai-research-assistant
このツールは、OllamaなどのローカルLLM、ウェブ検索、コンテンツ抽出、および構造化レポート生成を活用した自律的な…
★ 1 MIT 2026-05-14
画像生成
GitHub
contextlm
contextlmは、ハードウェアを意識したAIモデル発見のためのターミナルツールです。CPU/GPU/NPUを詳細にプローブし、9…
★ 1 MIT 2026-06-06
LLM
GitHub
hivelink
HiveLinkは、Mac、Windows、Linux、NVIDIA、AMD、Apple Siliconといった多様なデバイスを統合し、大規模な言語モデル…
★ 1 MIT 2026-06-23
3D / NeRF
GitHub
comfyui-3D-viewport
ComfyUIワークフロー向けに設計された、ネイティブOpenGL 3Dビューポートです。物理カメラに忠実な表現が可能で、深…
★ 1 2026-05-15
ASR / 音声認識
GitHub
Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
3D / NeRF
GitHub
Gaussian-Splatting
本プロジェクトは、現実世界の画像データから3D Gaussian Splatting技術を用いてTH OWLキャンパスの建物を高精度に再…
★ 1 2026-05-27
AIエージェント
GitHub
collab-finder
collab-finderは、X(旧Twitter)上で仕事、コラボレーション、副業、コミュニティ構築の機会を自律的に発見するため…
★ 1 2026-06-11
音楽生成
GitHub
kithairon
Kithaironは、モノフォニックなメロディから演奏可能で説明可能なカノンのバリアントを生成するシンボリック音楽コン…
★ 1 Apache-2.0 2026-05-21
3D / NeRF
GitHub
MultiBEST—Multiscale-Multiphase-Bridging-Experiment-and-Simulation-Toolkit
MultiBESTは、実験で得られた2D顕微鏡写真、2D/3D EBSDデータ、またはユーザーのスケッチから、原子レベルおよび連続…
★ 1 GPL-3.0 2026-06-09
ComfyUI
GitHub
ComfyUI-Selective-Sigma-Detailer
ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…
★ 1 ⑂ 3 MIT 2026-05-10