3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
3D / NeRF GitHub qi_wu_bo_yan_pointcloud_dataset
このリポジトリは、41件の中国古代文物に関する高品質な3D点群データセットを提供します。点群の品質評価、3D再構築…
★ 2 NOASSERTION 2026-05-08
マルチモーダル GitHub MagikaDocumentFromPixel
このツールは、Magikaに触発された軽量な画像品質ゲートで、画像を「シャープ」、「ぼやけ」、「不確実」のいずれか…
★ 2 MIT 2026-04-27
マルチモーダル GitHub Viz2Speech
Viz2Speechは、インドネシアの視覚障害者のアクセシビリティを向上させるために開発された、画像から音声への変換エ…
★ 2 ⑂ 1 MIT 2026-05-16
LLM GitHub dsrp-machine-learning-engineering-20261
このリポジトリは、機械学習とAIエンジニアリングを学ぶためのコース教材です。Jupyter Notebook形式で、教師あり学…
★ 2 ⑂ 3 2026-05-28
LLM GitHub DocLens
DocLensは、PDF、研究論文、レポートなどの文書を、検索可能で構造化されたAI対応の知識に変換するオープンソースの…
★ 2 MIT 2026-06-28
音声生成 / TTS GitHub voice-meeting
「Voice Meeting」は、多人数の会議をリアルタイムで文字起こしし、発言者を識別するオンプレミスソリューションです…
★ 2 MIT 2026-06-07
画像生成 GitHub ComfyUI-AliAn-Ideogram-Magic-Prompt
このツールは、ComfyUIのカスタムノードとして機能し、Ideogramのホスト型Magic Prompt APIを利用して、一般的なテキ…
★ 2 MIT 2026-06-04
音楽生成 GitHub music-from-drawings-pro
music-from-drawings-proは、AIを活用して手描きの絵を独自の音楽に変換するデスクトップアプリケーションです。Fast…
★ 2 ⑂ 1 2026-07-04
画像生成 GitHub avatar
Simi Avatarは、ユーザーが自身のAPIキー(OpenAIまたはMiniMax)を持ち込むBYOK(Bring Your Own API Key)方式のオ…
★ 2 MIT 2026-07-01
音楽生成 GitHub Etherpad
Etherpadは、iPhone、iPad、Android向けの表現豊かなマルチタッチ音楽シンセサイザーです。プロフェッショナルなCsou…
★ 2 2026-07-02
動画生成 GitHub ai-video-pipeline
このツールは、AIを活用してスクリプト作成、画像検索、音声合成、最終的なMP4動画生成までを完全に自動化する、無料…
★ 2 2026-05-13
マルチモーダル GitHub kmetbench-release
K-MetBenchは、気象学における専門家の推論、地域性、マルチモダリティを詳細に評価するための多次元ベンチマークで…
★ 2 MIT 2026-06-24
ComfyUI GitHub Prompt808
Prompt808は、ComfyUI用のビジョンLLMプロンプト生成ノードです。画像からコンテンツやスタイルを学習し、ユーザーの…
★ 2 ⑂ 1 MIT 2026-04-25
音声生成 / TTS GitHub nvatar-demo
NVatarは、3D仮想空間で対話可能なAIアバターです。音声クローニング、9次元の感情追跡、会話に応じた性格進化といっ…
★ 2 MIT 2026-06-02
LLM GitHub SeekDeep-DiscordBot
SeekDeep Discord Botは、ローカルAIを活用した多機能なDiscordボットです。チャット、画像認識、画像生成、ウェブ検…
★ 2 ⑂ 1 GPL-2.0 2026-07-01
音楽生成 GitHub strands-strudel
strands-strudelは、AIを活用したライブコーディング音楽ツールで、Strands Agentsのエコシステム内で動作します。リ…
★ 2 2026-04-22
マルチモーダル GitHub sentra-rag-failure-modes
このリポジトリは、Googleの最新マルチモーダル埋め込みモデル`gemini-embedding-2`の経験的失敗モードと幾何学的特…
★ 2 MIT 2026-05-08
ASR / 音声認識 GitHub Qvoice
Qvoiceは、macOS向けのローカル音声テキスト変換ツールです。Controlキーをダブルタップするだけで録音の開始、停止…
★ 2 ⑂ 1 MIT 2026-06-05
音楽生成 GitHub suno-songsmith
このツールは、Claude AI向けのスキルで、Sunoでの楽曲制作において、リリース品質の素材を作成することを支援します…
★ 2 2026-06-04
LLM GitHub tiny-rag-lab
tiny-rag-labは、リトリーバル・オーグメンテッド・ジェネレーション(RAG)の仕組みをエンドツーエンドで学ぶための…
★ 2 2026-06-25
LLM GitHub opensource-ai-talk
このリポジトリ「opensource-ai-talk」は、「Building with AI Without Losing the Open Web」というトークの公式コ…
★ 2 2026-05-29
画像生成 GitHub AngeMedia-gateway
AngeMediaは、AIエージェント、New-API、およびセルフホスト環境向けのOpenAI互換画像・動画生成ゲートウェイです。…
★ 2 Apache-2.0 2026-07-03
音声生成 / TTS GitHub zotero-minimax-tts
「MiniMax SAPI5 TTS Bridge」は、クラウドまたはローカルのテキスト読み上げ(TTS)サービスが提供する音声を、Wind…
★ 2 MIT 2026-06-17
LLM GitHub GameAgent
DB GameAgentは、ローカルで動作するゲームデータベースアシスタントです。現状は「アークナイツ」のゲームデータ、…
★ 2 MIT 2026-05-16