3,624 repos GH 3,509 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2211 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
動画生成 GitHub imagine-mcp
「imagine-mcp」は、Google Gemini、OpenAI、Grokといった主要なAIモデルを横断し、画像や動画の理解および生成を可…
★ 3 MIT 2026-06-24
音声生成 / TTS GitHub awesome-audio-generation
このリポジトリは、AIによる音声生成技術(テキスト読み上げ、音楽生成、サウンドデザイン)に関する厳選されたAPI、…
★ 3 ⑂ 5 CC0-1.0 2026-06-17
AIエージェント GitHub Runa-Agent-Digital-Being
Runa Agentは、既存AIエージェントの制限に不満を持つ開発者向けに設計された、自律的で自己認識を持つデジタルAIコ…
★ 3 MIT 2026-05-18
画像生成 GitHub geometry-of-noise
このMarimoノートブックは、拡散モデルがなぜノイズレベルの条件付けを必要としないのかを、研究論文「The Geometry …
★ 3 2026-04-27
音声生成 / TTS GitHub LocalVoiceTTS
LocalVoice TTSは、無料でローカル環境で動作するテキスト読み上げ(TTS)アプリケーションです。ユーザーは、ダイア…
★ 3 ⑂ 2 MIT 2026-05-30
LLM GitHub Neura-Learn-Personal-AI-Study-Assistant
NeuraLearnは、AIを活用して学生の学習をサポートするWebアプリケーションです。主要な機能として、指定したトピック…
★ 3 2026-05-10
ASR / 音声認識 GitHub astrbot_plugin_volcengine_asr
本ツールは、AstrBot向けの火山引擎豆包语音ASRプラグインです。QQおよびNapCatからの音声メッセージをテキストに変…
★ 3 2026-05-13
マルチモーダル GitHub tri-ai
Tri-AIは、Claude、Codex、Kimiなどの複数のAIモデルを連携させるためのポータブルなディスパッチプロトコルです。Cl…
★ 3 2026-04-14
LLM GitHub GEORank
GEOrankは、GEO(生成式エンジン最適化)に特化したオープンソースのワークベンチです。AI検索におけるウェブサイト…
★ 3 ⑂ 1 Apache-2.0 2026-06-18
ComfyUI GitHub comfyui-node-canvas
「ComfyUI Node Builder」は、視覚的なGUIとAIの力を活用し、ComfyUIのカスタムノードやノードパックを効率的に構築…
★ 3 ⑂ 1 MIT 2026-05-14
マルチモーダル GitHub OmniMemo
OmniMemoは、MiMo V2.5 全スタックモデルを基盤とした多モーダル会議インテリジェントエージェントです。最大の特長…
★ 3 MIT 2026-06-01
音声生成 / TTS GitHub ghosttone-ai
GhostTone AIは、CPUで動作する無料のオープンソース音声クローンシステムです。わずか6〜10秒の音声サンプルから、…
★ 3 MIT 2026-05-15
マルチモーダル GitHub kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
音声生成 / TTS GitHub supertonic_embeddings_trainer
Supertonic Embeddings Trainerは、SupertonicTTS向けのローカルボイスクローニングパイプラインです。WAVファイルを…
★ 3 MIT 2026-05-26
ASR / 音声認識 GitHub OmniVid
OmniVidは、YouTube、Bilibili、抖音、TikTokを含む1800以上の動画プラットフォームに対応した万能動画ダウンロード…
★ 3 2026-06-16
動画生成 GitHub slope-studio
Slope Studioは、アイデアからYouTubeショート動画の公開までを自動化するAI駆動のショート動画スタジオです。1本あ…
★ 3 MIT 2026-06-15
音声生成 / TTS GitHub LetAITalk
LetAITalkは、AI音声アシスタントとしてユーザーに代わって電話に応答し、着信の意図を理解して安全な範囲で返答する…
★ 3 2026-05-14
マルチモーダル GitHub robot-episode-curator
Robot Episode Curatorは、LeRobotデータセット内の外れ値エピソードを効率的に特定し、診断するためのツールです。R…
★ 3 Apache-2.0 2026-05-05
LLM GitHub PFD-toolkit
PFD Toolkitは、Future Death (PFD) レポートの収集、スクリーニング、テーマ発見といった手作業をAIで自動化し、構…
★ 3 ⑂ 1 AGPL-3.0 2026-06-22
LLM GitHub dsm
DSM(Dynamic Segmented Memory)は、LLMが数百万トークンのデータセット上で推論することを可能にする、高性能なメ…
★ 3 MIT 2026-05-13
音楽生成 GitHub sirenum
Sirenumは、任意の画像を基に、決定的かつ再現性の高い音楽を生成するツールです。楽譜(MusicXML)、MIDI、およびロ…
★ 3 ⑂ 1 AGPL-3.0 2026-04-28
音声生成 / TTS GitHub fableforge
FableForgeは、AIを活用して管理学の寓話的な短編ビデオを自動生成するパイプラインです。ユーザーが用意した管理コ…
★ 3 MIT 2026-05-22
3D / NeRF GitHub FoveaCore
FoveaEngineは、Godot 4.6+向けに開発された次世代VRレンダリングエンジンです。従来の3Dパイプラインを超越するため…
★ 3 MIT 2026-06-27
音声生成 / TTS GitHub crashout-buddy
Crashout Buddyは、Vision AgentsとStream Video上に構築された、リアルタイムで感情認識を行う音声AIエージェントの…
★ 3 MIT 2026-05-15