3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

音声生成 / TTS
GitHub
edge-tts
edge-ttsは、Microsoft Edgeのオンラインテキスト読み上げサービスをPythonコードやコマンドラインから利用できるツ…
★ 11.3k ⑂ 1.1k NOASSERTION 2026-03-22
画像生成
GitHub
DALLE2-pytorch
このツールは、OpenAIのテキストから画像への合成ニューラルネットワーク「DALL-E 2」をPyTorchで再現したものです。…
★ 11.3k ⑂ 1.1k MIT 2024-05-11
音声生成 / TTS
GitHub
voice-pro
Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワー…
★ 11.0k ⑂ 1.6k GPL-3.0 2025-12-05
マルチモーダル
GitHub
rerun
Rerunは、マルチモーダルなロボットデータ(画像、点群、変換、時系列、関節状態、ビデオなど)のロギング、クエリ、…
★ 11.0k ⑂ 774 Apache-2.0 2026-06-24
3D / NeRF
GitHub
nerf
NeRF (Neural Radiance Fields)は、単一シーンの入力ビューを再現し、新しい視点からのレンダリングを可能にするニュ…
★ 10.9k ⑂ 1.4k MIT 2025-04-12
LLM
GitHub
PocketFlow
Pocket Flowは、わずか100行で記述されたミニマリストなLLM(大規模言語モデル)フレームワークです。依存関係がなく…
★ 10.8k ⑂ 1.2k MIT 2026-03-27
動画生成
GitHub
Toonflow-app
Toonflowは、小説や脚本をAIによってアニメーション短編ドラマに迅速に変換するオープンソースツールです。AIスクリ…
★ 10.8k ⑂ 2.0k Apache-2.0 2026-06-29
画像生成
GitHub
paper2gui
Paper2GUIは、一般ユーザー向けのAIデスクトップアプリケーションツールボックスです。AIペインティング、音声合成、…
★ 10.7k ⑂ 880 MIT 2024-09-20
画像生成
GitHub
pix2pix
pix2pixは、条件付き敵対的ネットワーク(GAN)を利用して、入力画像を異なるスタイルの出力画像へ変換するTorchベー…
★ 10.6k ⑂ 1.7k NOASSERTION 2021-06-06
動画生成
GitHub
LTX-Video
LTX-Video(現在開発の中心はLTX-2)は、DiTベースの最先端オーディオ・ビデオ基盤モデルで、音声同期ビデオ生成、4K…
★ 10.6k ⑂ 1.1k Apache-2.0 2026-01-05
AIエージェント
GitHub
hive
Hiveは、プロダクションAI向けのマルチエージェントハーネスで、複雑なビジネスワークフローを効率的に実行するため…
★ 10.6k ⑂ 5.6k Apache-2.0 2026-05-29
動画生成
GitHub
ViMax
ViMaxは、単一のコンセプト入力から脚本、絵コンテ、キャラクターデザイン、そして最終的な動画生成まで、動画制作プ…
★ 10.6k ⑂ 1.5k MIT 2026-06-13
画像生成
GitHub
openvino
OpenVINO™は、ディープラーニングモデルの最適化とデプロイメントを目的としたオープンソースのソフトウェアツールキ…
★ 10.4k ⑂ 3.3k Apache-2.0 2026-06-23
音声生成 / TTS
GitHub
KrillinAI
KrillinAIは、AIを活用したビデオの翻訳・吹き替えを可能にする多機能ツールです。ビデオのダウンロード、音声認識、…
★ 10.4k ⑂ 973 GPL-3.0 2026-06-25
画像生成
GitHub
runanywhere-sdks
RunAnywhereは、LLM(大規模言語モデル)、音声認識、音声合成、ボイスアシスタントといったAI機能をデバイス上で完…
★ 10.3k ⑂ 359 NOASSERTION 2026-06-27
画像生成
GitHub
krita-ai-diffusion
Krita用AI画像生成プラグイン「Generative AI for Krita」は、画像ペイント・編集ワークフローにAIを統合します。本…
★ 10.2k ⑂ 597 GPL-3.0 2026-06-17
ASR / 音声認識
GitHub
RTranslator
RTranslatorは、Androidデバイス向けに設計されたほぼオープンソースの無料リアルタイム翻訳アプリです。このアプリ…
★ 10.2k ⑂ 938 Apache-2.0 2026-06-18
3D / NeRF
GitHub
3D-Machine-Learning
このリポジトリは、コンピュータビジョン、コンピュータグラフィックス、機械学習を融合した学際的な分野である3D機…
★ 10.2k ⑂ 1.8k 2024-07-04
音声生成 / TTS
GitHub
TTS
TTSは、最先端の研究に基づいた高度なText-to-Speech生成ライブラリです。トレーニングの容易さ、速度、品質のバラン…
★ 10.2k ⑂ 1.3k MPL-2.0 2023-11-09
マルチモーダル
GitHub
InternVL
InternVL Familyは、GPT-4o/GPT-5に匹敵する性能を目指すオープンソースの多モーダル会話モデル群です。特にInternVL…
★ 10.1k ⑂ 788 MIT 2025-09-22
LLM
GitHub
prompt-master
「Prompt Master」は、Claudeのスキルとして動作し、様々なAIツール向けに正確なプロンプトを生成します。トークンや…
★ 10.0k ⑂ 1.2k MIT 2026-06-10
ASR / 音声認識
GitHub
RealtimeSTT
RealtimeSTTは、音声アクティビティ検出、高速な文字起こし、リアルタイムテキスト更新、ウェイクワード機能を備えた…
★ 9.9k ⑂ 843 MIT 2026-06-12
音楽生成
GitHub
Amphion
Amphionは、音声、音楽、スピーチ生成のためのオープンソースツールキットです。再現可能な研究を支援し、音声生成分…
★ 9.9k ⑂ 819 MIT 2026-03-25
マルチモーダル
GitHub
pyod
PyOD 3は、表形式、時系列、グラフ、テキスト、画像といった多様なデータ形式に対応した、包括的なPython異常検知ラ…
★ 9.9k ⑂ 1.5k BSD-2-Clause 2026-06-17