3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#Python (2214 repos)

「Python」タグが付いたリポジトリ

← 全リポジトリ

音声生成 / TTS
GitHub
crashout-buddy
Crashout Buddyは、Vision AgentsとStream Video上に構築された、リアルタイムで感情認識を行う音声AIエージェントの…
★ 3 MIT 2026-05-15
マルチモーダル
GitHub
opencode-vision
opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。ユーザーが…
★ 3 MIT 2026-06-24
画像生成
GitHub
CTGMWorkshop
このリポジトリは、拡散モデルやフローマッチングモデルといった連続時間生成モデルの開発およびトレーニングコード…
★ 3 Unlicense 2026-06-23
音声生成 / TTS
GitHub
Audicle
Audicleは、保存した記事をパーソナルポッドキャストフィードに変換する自己ホスト型サービスです。記事のURLを貼り…
★ 3 NOASSERTION 2026-06-26
ASR / 音声認識
GitHub
jp2zh-video-subs
このプロジェクトは、ローカルの日本語動画ファイルから簡体字中国語のSRT字幕を生成するCLIツールです。Qwen3-ASRと…
★ 3 2026-06-14
音声生成 / TTS
GitHub
epubvoice
EpubVoiceは、自己ホスト型の個人用EPUBリーダーで、テキスト読み上げ(TTS)機能を備えています。購読や制限がなく…
★ 3 ⑂ 1 2026-06-21
LLM
GitHub
financebench-rag-agent
本ツールは、役割ベースのアクセス制御を備えた金融文書Q&A向けマルチエージェントRAGシステムです。FinanceBenchで7…
★ 3 MIT 2026-06-09
LLM
GitHub
provenance-energy-rag-chatbot
本ツールは、太陽光発電やエネルギー機器のマニュアルに対応した、信頼性の高いドキュメント指向型RAGチャットボット…
★ 3 MIT 2026-06-08
音声生成 / TTS
GitHub
supertonic3-book-reader
「EPUB TTS Reader API」は、EPUBファイルをテキストに変換し、Supertonic-3モデルを使用してテキスト読み上げ(TTS…
★ 3 MIT 2026-05-15
マルチモーダル
GitHub
AI-Book-Discovery-App
Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…
★ 3 GPL-3.0 2026-05-10
LLM
GitHub
Llaboratory
Llaboratoryは、LLMが架空のツールを使用する際の挙動を研究するための、自己ホスト可能なオープンソースの実験プラ…
★ 3 ⑂ 1 MIT 2026-06-26
動画生成
GitHub
volcengine-hermes-plugin
このプラグインは、Hermes Agentに火山引擎(Volcengine)のDoubao LLM(大規模言語モデル)、Doubao Seedream(画像…
★ 3 ⑂ 1 2026-06-30
LLM
GitHub
openmodels
OpenModels Registryは、大規模言語モデル(LLM)とその推論プロバイダー、および両者のマッピングに関する情報を集…
★ 3 ⑂ 1 2026-06-30
画像生成
GitHub
awesome-ai-image-prompts
このリポジトリは、GPT-Image-2、Nano Banana、Seedance、Qwen-VL、Gemini ImagenなどのAI画像生成モデル向けの、955…
★ 3 ⑂ 2 Apache-2.0 2026-05-26
ASR / 音声認識
GitHub
athena-whisper
Athena Whisperは、ローカル環境で動作するデスクトップ向け音声入力ウィジェットです。faster-whisperを利用した高…
★ 3 ⑂ 2 2026-06-06
動画生成
GitHub
ai-video-skill
このツールは、Claude Code向けに設計されたAIビデオ生成スキルです。プロンプトから最終的な編集まで、エンドツーエ…
★ 3 MIT 2026-06-09
ASR / 音声認識
GitHub
smart-meeting-assistant
「拼好会-智能会議辅助系统」は、AIを活用したリアルタイム会議支援ソフトウェアです。PCの音声とマイク入力を同時に…
★ 3 2026-05-25
音楽生成
GitHub
AuraDev
AuraDevは、開発者のリアルタイムの認知状態(集中、行き詰まり、デバッグなど)に適応してアンビエント音楽を生成す…
★ 3 GPL-3.0 2026-05-31
音声生成 / TTS
GitHub
fiona-anne
Fiona Anneは、プライバシーを最優先に考え、外部APIを一切使用せずに自身のマシン上で動作する、自己ホスト型の音声…
★ 3 2026-04-09
音声生成 / TTS
GitHub
voice-to-text
CogNativeは、既存の声をクローンし、その声で別の言語の音声を生成できる翻訳音声合成ツールです。GUIとCLIの両方を…
★ 3 2026-05-13
3D / NeRF
GitHub
lichtfeld-tensorboard-export
このツールは、LichtFeld Studio用のプラグインであり、トレーニング中の詳細なメトリクスをTensorBoardイベントファ…
★ 3 GPL-3.0 2026-05-15
ASR / 音声認識
GitHub
hexy
HexySARは、洞窟での捜索救助活動のために開発されたAI搭載の六足歩行ロボットシステムです。危険な洞窟環境にロボッ…
★ 3 ⑂ 1 2026-05-10
動画生成
GitHub
paper2video
「paper2video」は、あらゆる技術記事や論文を、著名な「3Blue1Brown」スタイルに倣った2〜5分間の解説動画へと自動…
★ 3 Apache-2.0 2026-04-13
マルチモーダル
GitHub
loci-db
LOCIはAIワールドモデル向けの4次元時空間ベクトルデータベースです。埋め込みベクトルの位置と時間情報(x,y,z,t)…
★ 3 Apache-2.0 2026-06-11