3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
マルチモーダル GitHub robot-episode-curator
Robot Episode Curatorは、LeRobotデータセット内の外れ値エピソードを効率的に特定し、診断するためのツールです。R…
★ 3 Apache-2.0 2026-05-05
ASR / 音声認識 GitHub astrbot_plugin_volcengine_asr
本ツールは、AstrBot向けの火山引擎豆包语音ASRプラグインです。QQおよびNapCatからの音声メッセージをテキストに変…
★ 3 2026-05-13
マルチモーダル GitHub kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
AIエージェント GitHub thesis
THESISは、X(旧Twitter)上のトークンに関する論文を評価し、Baseチェーンで自動的に取引を行う自律型AI委員会です…
★ 3 MIT 2026-06-05
3D / NeRF GitHub gaussian_lic_ros2
このツールは、LiDAR-Inertial-Camera Gaussian Splatting SLAMのROS2ネイティブポートであり、Gaussian-LIC/Gaussia…
★ 3 GPL-3.0 2026-06-21
動画生成 GitHub awesome-wam-2026
このリポジトリは、World Action Model (WAM) に関する2026年版の分類済み研究論文索引です。4つの主要な調査論文と7…
★ 3 2026-05-29
音声生成 / TTS GitHub awesome-audio-generation-2026
このAwesome Audio Generation 2026リポジトリは、2026年にリリースされたオープンソースのオーディオ生成モデルの中…
★ 3 ⑂ 1 CC0-1.0 2026-02-15
音楽生成 GitHub acestep-action
Ace-Step Audio Generation Actionは、テキストプロンプトやオプションの歌詞から高品質な音楽(WAVファイル)を生成…
★ 3 ⑂ 1 MIT 2026-03-16
音声生成 / TTS GitHub showrunner
Showrunnerは、スクリプトからAI生成のUGC(User Generated Content)動画コンテンツを作成するためのオープンソース…
★ 3 ⑂ 1 MIT 2026-05-12
マルチモーダル GitHub AI-Book-Discovery-App
Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…
★ 3 GPL-3.0 2026-05-10
音声生成 / TTS GitHub mellifluous
mellifluousは、Markdown形式のテキストを構造やインラインコンテンツを考慮し、自然な間合いで読み上げるツールです…
★ 3 MIT 2026-06-22
LLM GitHub whatifd
whatifdは、LLM(大規模言語モデル)システムにおけるプロンプト、モデル、ツールの変更がもたらす影響を客観的に評…
★ 3 ⑂ 1 Apache-2.0 2026-06-22
動画生成 GitHub imagine-mcp
「imagine-mcp」は、Google Gemini、OpenAI、Grokといった主要なAIモデルを横断し、画像や動画の理解および生成を可…
★ 3 MIT 2026-06-24
画像生成 GitHub pixeltamer-gpt-image-skill
「pixeltamer」は、Claude Code、Codex CLI、OpenCode、Cursorなど50以上のAIコーディングエージェント向けに設計さ…
★ 3 MIT 2026-06-17
ASR / 音声認識 GitHub tellix
Tellixは、Windows向けに開発された軽量なスクリーンレコーダーです。画面、マイク、そしてオプションでGoogle Meet…
★ 3 MIT 2026-05-19
画像生成 GitHub gpt-image-cookbook
gpt-image-cookbookは、OpenAI gpt-image-2、Google Imagen、Fluxといった複数のAI画像生成プロバイダーを統合したオ…
★ 3 MIT 2026-05-08
音楽生成 GitHub music-agent
music-agentは、ターミナル中心のワークフローのために設計されたオープンソースのAI音楽エージェントです。Hermesや…
★ 3 MIT 2026-04-16
ASR / 音声認識 GitHub pi-whisper-voice
「pi-whisper-voice」は、Piコーディングエージェント向けの音声入力ツールです。SPACEキーを長押しするだけで録音を…
★ 3 MIT 2026-04-27
音声生成 / TTS GitHub ovos-tts-plugin-kokoro
ovos-tts-plugin-kokoroは、Open Voice OS (OVOS) 音声アシスタント向けに開発された、多言語テキスト読み上げ(TTS…
★ 3 NOASSERTION 2026-05-03
AIエージェント GitHub HEPHAESTUS
HEPHAESTUSは、開発目標を与えるとAIエージェントが自律的にタスクを分解、実行、検証し、最終的にクリーンなコード…
★ 3 MIT 2026-06-23
音声生成 / TTS GitHub Trouver_audio_install
RoboVoiceは、Trouver、Dreame、Movaブランドのロボット掃除機の音声をカスタマイズするためのオープンソースWeb UI…
★ 3 NOASSERTION 2026-06-15
3D / NeRF GitHub lichtfeld-tensorboard-export
このツールは、LichtFeld Studio用のプラグインであり、トレーニング中の詳細なメトリクスをTensorBoardイベントファ…
★ 3 GPL-3.0 2026-05-15
ASR / 音声認識 GitHub WhisperCaption
WhisperCaptionはmacOS向けのリアルタイムキャプションアプリケーションです。マイク入力とMacのシステム音声を同時…
★ 3 MIT 2026-05-17
ASR / 音声認識 GitHub social-media-scraper-skill
このツールは、Instagram、TikTok、X (Twitter)、YouTubeといった主要ソーシャルメディアプラットフォームから、投稿…
★ 3 2026-07-02