3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub universal_caption
Universal Captionsは、Groq Whisper APIを活用し、任意のChromeブラウザタブでリアルタイムの音声テキスト変換キャ…
★ 2 2026-06-10
ComfyUI GitHub ComfyUI-iterationNode
ComfyUI-iterationNodeは、ComfyUI用のカスタムノードです。キャラクター、服装、ポーズという3つの独立したプロンプ…
★ 2 ⑂ 1 MIT 2026-05-01
動画生成 GitHub comfyui-wan-i2v-control
「Blasfemia Cheats Hacks」は、ゲームプレイを強化するためのチートおよびハッキングツールです。リアルタイムリソ…
★ 2 2026-06-26
音声生成 / TTS GitHub NeuTTS-Studio
NeuTTS-Studioは、Windows向けのローカルテキスト読み上げアプリケーションです。デバイス上で入力されたテキストを…
★ 2 NOASSERTION 2026-06-23
動画生成 GitHub sanatation
NVIDIAのビデオワールドモデル「SANA-WM」をApple Silicon (MシリーズMac) で動作させるためのパッチとインタラクテ…
★ 2 Apache-2.0 2026-05-21
LLM GitHub TrustRAG
TrustRAGは、信頼性の高いRetrieval-Augmented Generation (RAG) 知識ワークベンチです。アップロードされたドキュメ…
★ 2 ⑂ 1 Apache-2.0 2026-06-04
音声生成 / TTS GitHub UAL
UAL(Understand Any Language)は、ESP32-S3を基盤としたIoT音声翻訳プロトタイプです。距離センサーでユーザーを検…
★ 2 MIT 2026-05-23
ASR / 音声認識 GitHub memorised-them-all
「Memorised them All」は、Claudeユーザー向けのローカルで完結する知識グラフ生成ツールです。PDF、Officeドキュメ…
★ 2 MIT 2026-06-24
音声生成 / TTS GitHub Python-Autodub
Python Autodubは、AIを活用した自動動画吹き替えパイプラインです。音声抽出、Demucsによるボーカル分離、DiariZen…
★ 2 ⑂ 2 MPL-2.0 2026-06-03
マルチモーダル GitHub multimodal-music-genre-classifier
このツールは、GTZANデータセットを用いた音楽ジャンル分類のためのマルチモーダルCNNモデルを提供します。メルスペ…
★ 2 MIT 2026-05-13
音声生成 / TTS GitHub Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
LLM GitHub drm_transformer
DRM Transformerは、従来のTransformerモデルの限界を打破するために開発された、デコーダーオンリーのTransformerで…
★ 2 NOASSERTION 2026-06-17
マルチモーダル GitHub Page-agent-UI
Page-agent-UIは、ウェブページの見た目と操作性を向上させるChrome拡張機能です。UI(ユーザーインターフェース)と…
★ 2 MIT 2026-06-24
AIエージェント GitHub hermes-cockpit
Hermes Cockpitは、Hermes Agentや類似の自律コーディングワークフローを利用するAIアシストプロジェクト向けのオー…
★ 2 MIT 2026-06-22
3D / NeRF GitHub ARIS-in-AI-Offer
このツールは、「ARIS(Auto Research in Sleep)」エージェントフレームワークを活用し、AI分野での就職活動(特に…
★ 2 MIT 2026-06-25
LLM GitHub pageindex-rag
pageindex-ragは、ベクトルデータベースや埋め込みを使用せずに、ローカルファイルから回答を検索するためのWindows…
★ 2 MIT 2026-06-26
AIエージェント GitHub better-than-claude-skills
このソフトウェア「better-than-claude-skills」は、AIアシスタントに16種類のツールを追加し、その能力を最大限に引…
★ 2 2026-06-28
動画生成 GitHub ai-video-pipeline
このツールは、AIを活用してスクリプト作成、画像検索、音声合成、最終的なMP4動画生成までを完全に自動化する、無料…
★ 2 2026-05-13
画像生成 GitHub bucketsampler
このツールは、拡散モデルのトレーニング(SDXLのようなマルチARバッチ)において、アスペクト比の異なる画像を効率…
★ 2 MIT 2026-05-15
ASR / 音声認識 GitHub speaknow
SpeakNowは、Windowsデスクトップ向けの軽量な音声入力ツールです。ホットキーを押して話すだけで、認識されたテキス…
★ 2 MIT 2026-04-22
画像生成 GitHub rainfield-diffusion-models
本リポジトリは、ICML 2026で発表された「商用マイクロ波リンクと拡散モデル事前分布を用いたベイズ雨域再構築」に関…
★ 2 NOASSERTION 2026-05-21
ASR / 音声認識 GitHub hotkeys
Hotkeysは、AIを活用してあらゆるアプリケーションでのテキスト編集作業を劇的に効率化するホットキーアプリです。選…
★ 2 NOASSERTION 2026-06-15
音声生成 / TTS GitHub WatchReader
WatchReaderは、Wear OS向けのミニマリストな電子書籍リーダーで、スマートフォンから.txtや.epub形式の書籍を同期し…
★ 2 MIT 2026-04-26
3D / NeRF GitHub diff-4d-gaussian-rasterization
このリポジトリは、IROS 2025で発表されたD4DGS-SLAMで利用される、微分可能な4Dガウススプラッティングラスタライザ…
★ 2 NOASSERTION 2026-05-13