3,638 repos GH 3,523 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

LLM
GitHub
visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20
LLM
GitHub
langgraph
Roco Kingdomは、多エージェント協力に基づく『洛克王国』ゲームの精霊百科システムです。自然言語で精霊情報、属性…
★ 1 2026-05-22
画像生成
GitHub
TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
動画生成
GitHub
opencli-skill
opencli-skillは、AIエージェントがWindowsデスクトップ上でブラウザ操作やアプリケーション制御などのタスクを自動…
★ 1 ⑂ 1 MIT 2026-06-16
LLM
GitHub
yuri-os
Yuri OSは、自然言語で目標を指示するだけで、AIが自動的に複雑なマルチエージェントワークフロー(DAG)を設計し、…
★ 1 2026-06-04
マルチモーダル
GitHub
FootPrint
FootPrint Analyticsは、サッカーの試合映像をAIで分析するパイプラインシステムです。YOLOv8とByteTrackを用いて選…
★ 1 MIT 2026-05-18
ComfyUI
GitHub
comfyui-touch-numeric
「comfyui-touch-numeric」は、人気の画像生成AIツールComfyUIの数値入力ウィジェット(seedやINT/FLOAT値など)を、…
★ 1 ⑂ 1 MIT 2026-06-24
画像生成
GitHub
image-skill-cli
「Image Skill CLI」は、AIエージェント向けに画像生成・編集、動画・音声生成、3D作成をゼロセットアップで実現する…
★ 1 MIT 2026-06-25
LLM
GitHub
calfcord
Calfcordは、Discordサーバー内で独自のペルソナを持つAIエージェントの分散チームを構築できるツールです。各エージ…
★ 1 Apache-2.0 2026-06-22
ASR / 音声認識
GitHub
spoken-digits-asr
本プロジェクトは、Free Spoken Digit Datasetを用いてゼロから訓練された小型のCTC音声認識器です。1秒間の数字音声…
★ 1 MIT 2026-06-24
ASR / 音声認識
GitHub
english-vocal-medical-terminology-mini
このリポジトリは、臨床文字起こしモデル、医療音声認識(STT)パイプライン、およびヘルスケア分野の会話型インター…
★ 1 NOASSERTION 2026-06-09
3D / NeRF
GitHub
splat-slim
splat-slimは、3D Gaussian Splatting(3DGS)モデルを再トレーニングせずに軽量化するためのツールです。既存の.ply…
★ 1 MIT 2026-06-14
ComfyUI
GitHub
runpod-comfyui-controller
RunPod上でComfyUIをインタラクティブに実行するための、費用管理機能を重視したローカルファーストなセッションコン…
★ 1 MIT 2026-06-12
マルチモーダル
GitHub
vlm-from-scratch
このプロジェクトは、CLIP-ViTとQwen2.5をゼロから組み立てて開発されたミニLLaVAモデルの構築過程を記録したポート…
★ 1 MIT 2026-05-14
音声生成 / TTS
GitHub
code-driven-video-template
「Code-Driven Video Template」は、スクリプトからナレーション付きのデータスタイルの動画をコードベースで生成す…
★ 1 MIT 2026-06-14
AIエージェント
GitHub
deepscene
DeepSceneは、オープンソースのビデオ-ストーリーボードCLIエージェントであり、低コストで動画の深い理解を実現しま…
★ 1 MIT 2026-05-14
音楽生成
GitHub
definers
Definersは、AI、メディア、データ製品を構築するチーム向けの包括的なPythonプラットフォームです。このモジュール…
★ 1 MIT 2026-06-21
ComfyUI
GitHub
comfyui-weaver
comfyui-weaverは、Claude CodeがComfyUI(ローカルおよびComfy Cloud)を操作できるようにする自己完結型MCPサーバ…
★ 1 MIT 2026-06-11
LLM
GitHub
RAG_pipelines
このツールは、RAG (Retrieval-Augmented Generation) システムの設計と構築を目的とした実験的なリポジトリです。デ…
★ 1 MIT 2026-05-26
音声生成 / TTS
GitHub
Omnicut
OmniCutは、動画編集、音声ミキシング、写真編集、カラーグレーディング、AIを活用したコンテンツ作成機能を統合した…
★ 1 MIT 2026-05-21
音声生成 / TTS
GitHub
voice-tools
Voice Tools Directoryは、AI音声ツールを効率的に比較・検討するための静的なディレクトリサイトです。YouTuberやポ…
★ 1 ⑂ 1 MIT 2026-06-24
AIエージェント
GitHub
loom
loomは、耐久性のあるエージェント実行エンジン「Sibyl」のためのSlackフロントエンドです。Slackのメッセージやコマ…
★ 1 2026-05-25
音声生成 / TTS
GitHub
tts-video-generator
この「TTS Video Generator」は、Python、ElevenLabsの音声合成、FFmpegを組み合わせて、AI音声と同期字幕付きの短い…
★ 1 ⑂ 1 MIT 2026-06-23