3,628 repos GH 3,513 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

動画生成
GitHub
WaveSpeedAI-Skills
WaveSpeedAI Skillsは、700以上のメディアモデルと290以上のOpenAI互換LLMを統合したWaveSpeedAI推論プラットフォー…
★ 1 MIT 2026-06-24
マルチモーダル
GitHub
mllm-persona-evaluation
本ツールは、「都市センチメント認識のためのLLMエージェントにおけるペルソナの妥当性」に関する研究の公式実装です…
★ 1 CC-BY-4.0 2026-05-26
ASR / 音声認識
GitHub
AI-Vision-Assistant-for-Real-Time-Face-Recognition
このツールは、AIを活用したリアルタイム顔認識アシスタントです。ウェブカメラを通じて既知の人物を識別し、音声フ…
★ 1 2026-05-10
音声生成 / TTS
GitHub
minimax-hub
このツールは、MiniMaxのAI生成機能をCodex CLIに統合するためのスキルです。画像生成、動画生成、音声合成(多言語…
★ 1 MIT 2026-05-29
LLM
GitHub
TOKEN_BANK-manage-your-token-usage
TOKENBANKは、AIコーディングアシスタントのトークン使用量と費用を詳細に統計・管理するためのデスクトップアプリケ…
★ 1 2026-06-01
音声生成 / TTS
GitHub
claude-speech-skill
「claude-speech」は、Claude Code環境を言語学習に特化したワークスペースに変えるツールです。F9キーで学習言語、F…
★ 1 MIT 2026-06-21
LLM
GitHub
contextcontrol
ContextControlは、ローカル環境でのコードコンテキスト管理、大規模言語モデル(LLM)の利用、およびパッチワークフ…
★ 1 ⑂ 2 NOASSERTION 2026-05-31
動画生成
GitHub
Agentic-video-pipeline
このプロジェクトは、テキストプロンプトからプラットフォーム対応のビデオを自動生成する自律型マルチエージェントA…
★ 1 2026-06-13
LLM
GitHub
opencode-research-mcp
このツールは、学術研究プロセスを効率化するために設計された軽量な研究用MCP(Modular Cognitive Processor)サー…
★ 1 MIT 2026-06-02
画像生成
GitHub
DESIGNOSFORGE
DESIGNOSFORGEは、AIデザインにおける視覚的な問題を解決し、統制されたデザインワークフローを実現するオープンソー…
★ 1 MIT 2026-06-19
LLM
GitHub
TGS-2023035977-Agentic-AI-Automation-with-n8n
本リポジトリは、WSQコース「Agentic AI Automation with n8n」の実践的なラボワークフローとウェブアプリを提供しま…
★ 1 2026-06-25
LLM
GitHub
transformer-roofline-analyzer
Transformer Roofline Analyzerは、Hugging FaceのTransformerモデル設定ファイルから、計算量(FLOPs)、メモリ帯域…
★ 1 MIT 2026-05-30
画像生成
GitHub
amanuensis
amanuensisは、AIペルソナがMastodonやBlueskyで投稿を作成し、人間の承認を得てから公開するためのローカルファース…
★ 1 MIT 2026-06-25
ComfyUI
GitHub
comfyui-Colab
このGitHubリポジトリは、Google Colab上でComfyUIとQwen-Image-Editモデルを簡単に展開・実行するためのインタラク…
★ 1 ⑂ 1 2026-06-06
画像生成
GitHub
gpt-image-2-api
このGitHubリポジトリは、APIDot社のGPT Image 2 APIを活用した画像生成および編集のサーバーサイド実装例を提供しま…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
-deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
マルチモーダル
GitHub
blind-vision-mcp
blind-vision-mcpは、テキストベースのLLM(大規模言語モデル)に「視覚」を与えるMCPサーバーです。GPT-4 VisionやC…
★ 1 MIT 2026-06-15
音声生成 / TTS
GitHub
voxtral-fastapi
voxtral_fastapiは、高性能な音声合成CLIツールであるvoxtralのFastAPIラッパーです。このツールは、テキストからWAV…
★ 1 2026-05-17
音楽生成
GitHub
photo_sonification
静止画像を音楽に変換するインタラクティブなWebアプリです。AIモデルに頼らず、輝度、コントラスト、対称性といった…
★ 1 MIT 2026-05-14
音楽生成
GitHub
CodeBeats
「CodeBeats」は、ソースコードを音楽へと変換する革新的なツールです。独自の解析エンジンが関数のメロディ、ループ…
★ 1 MIT 2026-04-16
3D / NeRF
GitHub
openclaw-sifu
openclaw-sifuは、OpenClawのインストールとアンインストールを簡素化するためのスタンドアロンのグラフィカルツール…
★ 1 2026-06-29
音声生成 / TTS
GitHub
ai-dubbing-studio
AI Dubbing Studioは、オーディオ/ビデオファイルをAIが希望の言語でダビングしてくれるウェブサービスです。ElevenL…
★ 1 MIT 2026-07-01
LLM
GitHub
Drishti
Drishtiは、コードとドキュメントの理解を深めるためのマルチモーダルなRAG(検索拡張生成)システムです。Tree-sitt…
★ 1 MIT 2026-06-01
音声生成 / TTS
GitHub
ai-google-voice-agent
「AI Google Voice Agent」は、Groq AI、Streamlit、PyAutoGUI、Edge TTSなどを活用したAI搭載のGoogle Voice通話ア…
★ 1 2026-05-26