3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
ASR / 音声認識 GitHub TermSub
TermSubは、AIを活用して動画コンテンツの文字起こし、翻訳、専門用語管理を行うFastAPIアプリケーションです。マル…
★ 2 MIT 2026-07-01
LLM GitHub opencrab
opencrabは、タスクをこなすだけでなく、自己の目標を持ち自己進化を追求する「自律生命体」です。他のエージェント…
★ 2 MIT 2026-06-07
ASR / 音声認識 GitHub YanXi-KCN
Hybrid RAGとWhisper ASRを組み合わせたスマート着信分類処理システムです。ユーザーが授業中など電話に出られない状…
★ 2 2026-05-29
3D / NeRF GitHub catetus
Catetusは、Gaussian Splattingの最適化と本番環境への配信を支援するオープンソースのインフラです。巨大な.plyファ…
★ 2 NOASSERTION 2026-05-31
マルチモーダル GitHub ai-annotation-rule-doc-skill
このツールは、AIモデル訓練データのアノテーションルール文書を効率的に作成するためのClaudeスキルです。テキスト…
★ 2 MIT 2026-06-08
画像生成 GitHub hermes-image-local-tools
この「hermes-image-local-tools」は、Hermesエージェントでローカルでの画像生成を強力にサポートするためのプラグ…
★ 2 MIT 2026-06-03
動画生成 GitHub sora-2-official-api
このリポジトリは、PoyoAPIの「sora-2-official」モデルを使用して、サーバーサイドで高品質な動画を生成するための…
★ 2 MIT 2026-06-09
動画生成 GitHub muapi-ai-sdk-provider
「@muapi/ai-sdk-provider」は、Vercel AI SDKと統合するためのMuAPIプロバイダーです。Flux、Veo3、Kling、Midjourn…
★ 2 2026-06-17
3D / NeRF GitHub qi_wu_bo_yan_pointcloud_dataset
このリポジトリは、41件の中国古代文物に関する高品質な3D点群データセットを提供します。点群の品質評価、3D再構築…
★ 2 NOASSERTION 2026-05-08
音声生成 / TTS GitHub LA-Studio
LA Studioは、音声認識、テキスト読み上げ、音声クローン、音声デザイン、モデルダウンロード、ランタイム管理を一つ…
★ 2 GPL-3.0 2026-07-03
ASR / 音声認識 GitHub one-key-input
One-Key Inputは、特定のキーを押しながら話すだけで、AIが文脈を理解して洗練されたテキストをカーソル位置に直接入…
★ 2 ⑂ 1 MIT 2026-06-02
LLM GitHub SREAssistaBot
IncidentIQは、Google ADK、FastAPI、マルチエージェントオーケストレーションを用いて構築された、Slackネイティブ…
★ 2 MIT 2026-05-23
音声生成 / TTS GitHub podcast-workflow
「Podcast Workflow」は、AIを活用しポッドキャスト制作の全工程を自動化するClaude Codeスキルです。ユーザーが指定…
★ 2 MIT 2026-05-28
画像生成 GitHub aether
Aetherは、参考画像や生成結果から「視覚的記憶」を生成・管理し、美的スタイルの一貫した画像を継続的に創作するた…
★ 2 MIT 2026-06-28
ASR / 音声認識 GitHub memorised-them-all
「Memorised them All」は、Claudeユーザー向けのローカルで完結する知識グラフ生成ツールです。PDF、Officeドキュメ…
★ 2 MIT 2026-06-24
ASR / 音声認識 GitHub slidoc
slidocは、講義ビデオを各スライドとそのクリーンアップされたナレーションが対になったマークダウン形式に変換する…
★ 2 ⑂ 1 MIT 2026-05-15
マルチモーダル GitHub rag-multimodal
このプロジェクトは、複雑な表や図を含むPDF文書から情報を抽出するマルチモーダルRAGシステムの実装デモです。マル…
★ 2 MIT 2026-07-01
3D / NeRF GitHub Awesome-Embodied-3DV
この「Awesome-Embodied-3DV」は、Embodied AIの分野における3D/4D知覚、再構築、生成、シミュレーション対応アセッ…
★ 2 MIT 2026-06-27
ASR / 音声認識 GitHub runningapp
RunTrack GPSは、SwiftUIとMVVMアーキテクチャで構築された、ネイティブiOS向けの軽量GPSランニングアプリです。ユー…
★ 2 2026-06-25
音声生成 / TTS GitHub Project-Siren
Sirenは、生のビデオ/オーディオアセットからファインチューニングされた音声合成(TTS)モデルを作成するための、エ…
★ 2 2026-05-04
AIエージェント GitHub mu-brand
MUは、AIがデザイン生成から販売、製造、配送、会社運営まで全てを自律的に行う、人間不介入のアパレルブランドです…
★ 2 ⑂ 1 NOASSERTION 2026-07-01
画像生成 GitHub FluidFlow
FluidFlowは、非構造メッシュ上の流体力学シミュレーションにおいて、高性能な代理モデルを生成するためのフローマッ…
★ 2 MIT 2026-06-10
ComfyUI GitHub ComfyUI-MemoryVisualization
ComfyUI-MemoryVisualizationは、画像生成AIツールComfyUI向けに設計された視覚的なダッシュボードです。このツール…
★ 2 2026-07-01
音声生成 / TTS GitHub UAL
UAL(Understand Any Language)は、ESP32-S3を基盤としたIoT音声翻訳プロトタイプです。距離センサーでユーザーを検…
★ 2 MIT 2026-05-23