3,618 repos GH 3,503 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2208 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub mllm-persona-evaluation
本ツールは、「都市センチメント認識のためのLLMエージェントにおけるペルソナの妥当性」に関する研究の公式実装です…
★ 1 CC-BY-4.0 2026-05-26
ComfyUI GitHub niren-drama
泥人剧场 (Niren Drama) は、縦型ショートドラマ制作に特化したフルスタックAIプラットフォームです。このツールは、…
★ 1 MIT 2026-07-03
ComfyUI GitHub ComfyUI-ZMongo
ComfyUI-ZMongoは、ComfyUIのワークフローデータをZMongo形式で保存、読み込み、閲覧、マスク、再利用するためのカス…
★ 1 ⑂ 1 Apache-2.0 2026-06-20
音楽生成 GitHub musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
画像生成 GitHub GenAI-From-Scratch
このリポジトリは、様々な生成AIアーキテクチャ(VAE、GAN、DDPMなど)をPythonでゼロから実装したコンパクトなコレ…
★ 1 MIT 2026-06-14
マルチモーダル GitHub whatfirst-small
whatfirst · smallは、タスクの優先順位付けを支援する、ローカルで動作する小型のビジョン言語モデル(Qwen2.5-VL-3…
★ 1 Apache-2.0 2026-06-19
音声生成 / TTS GitHub YOOS-APP
YOOS-APPは、ユーザー自身の執筆スタイルを学習し、その個性を保ったまま新しいコンテンツを生成するユニバーサルな…
★ 1 MIT 2026-06-05
画像生成 GitHub ideogram4-mps
Apple Silicon搭載Mac上で人気の画像生成モデルIdeogram 4を実行可能にするツールです。CUDAやNVIDIA GPUが不要で、M…
★ 1 MIT 2026-06-26
音声生成 / TTS GitHub SpeakPro
SpeakProは、Macのターミナル(iTerm2やその他のターミナルアプリ)で選択したテキストを、ホットキー一つで自然なニ…
★ 1 MIT 2026-05-18
ASR / 音声認識 GitHub kokkai-webtv-captions
「kokkai-webtv-captions」は、国立国会図書館の国会会議録が公式に公開されるまでの未収録期間を埋めるための個人用…
★ 1 MIT 2026-05-25
マルチモーダル GitHub control-sci
ControlMindは、MinerUを活用した科学文書インテリジェンスシステムです。生PDFから直接情報を抽出し、科学論文の理…
★ 1 NOASSERTION 2026-05-30
ASR / 音声認識 GitHub smart-class-attendance
「Sureshjangid99/smart-class-attendance」は、顔認識技術を活用した自動クラス出席管理システムです。教師が出席を…
★ 1 2026-04-27
ASR / 音声認識 GitHub voice_input_tool
本ツールは、Windows向けの軽量な音声入力アシスタントです。フローティングボタンのクリックで録音を開始・停止し、…
★ 1 MIT 2026-06-09
動画生成 GitHub HappyHorse-1.0
Happy Horse 1.0は、最先端のAIビデオ生成モデルです。150億パラメータの統一Transformerを基盤とし、ビデオフレーム…
★ 1 2026-04-11
LLM GitHub agentguard
AgentGuardは、RAGやエージェントAIアプリケーション向けの自己ホスト型AI信頼性プラットフォームです。AIアプリケー…
★ 1 Apache-2.0 2026-06-18
マルチモーダル GitHub -deepseek-skills
このツールは、Claude CodeやDeepSeekのようなテキストベースのAIモデルに、画像認識(OCR機能を含む)と音声認識(…
★ 1 2026-06-04
音声生成 / TTS GitHub global-translation
このツールは、Googleの翻訳エンジンとMicrosoft Edge TTSを活用した、AI駆動型のリアルタイム言語翻訳アプリケーシ…
★ 1 2026-06-20
ASR / 音声認識 GitHub VoiceGPT
VoiceGPTは、GPT-4oとDALL·E 3を搭載した音声制御AIアシスタントです。ユーザーは「hello」というウェイクワードでア…
★ 1 MIT 2026-05-17
LLM GitHub awesome-opd
「Awesome On-Policy Distillation」は、強化学習におけるOn-Policy Distillation (OPD) に関する厳選されたリソース…
★ 1 2026-05-15
LLM GitHub Scalable-RAG-Application
このツールは、スケーラブルで低遅延、高信頼性のAI駆動型情報検索を実現する、プロダクショングレードのマルチエー…
★ 1 2026-06-01
ASR / 音声認識 GitHub AdversialQA
本ツールは、AIを活用した模擬試験シミュレーターであり、論文のPDFや履歴書をアップロードすることで、AIが厳しい質…
★ 1 2026-05-19
LLM GitHub Agentic-IRC-Bot
本ツールはPythonで開発されたエージェント型IRCボットです。LLMを中核に据え、ツール呼び出し、結果統合、長期記憶…
★ 1 MIT 2026-05-24
音楽生成 GitHub BachGen
BachGenは、カスタムMusicTransformerを用いてバッハのコラール様式の音楽を自動生成するツールです。4声のSATBコラ…
★ 1 MIT 2026-05-08
動画生成 GitHub manim-coding-skill
このツールは、AIエージェントがManimGLを使用して高品質なSTEM教育アニメーション動画を自動生成、レンダリング、結…
★ 1 ⑂ 1 MIT 2026-06-12