3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub VisualClaw
VisualClawは、物理世界向けのリアルタイムでパーソナライズされたエージェントを構築するための自己進化型マルチモ…
★ 42 ⑂ 3 MIT 2026-06-16
音楽生成 GitHub studiomi300
studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…
★ 42 ⑂ 8 MIT 2026-05-22
画像生成 GitHub Coarse-guided-Gen
「Coarse-guided-Gen」は、粗いサンプルをガイドとして、条件付きのビジュアルコンテンツ生成を可能にするツールです…
★ 42 ⑂ 4 2026-05-08
LLM GitHub hermes-katana
Hermes Katanaは、AIエージェント向けの多層防御セキュリティレイヤーです。テキストの出所を文字レベルで追跡し、プ…
★ 42 ⑂ 2 MIT 2026-06-22
音声生成 / TTS GitHub call-translator
「Realtime Call Translator」は、ビデオ/音声通話中にリアルタイムで音声を翻訳するツールです。あなたが話す言語は…
★ 42 ⑂ 11 MIT 2026-04-04
音声生成 / TTS GitHub Audio-Oscar
Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…
★ 42 ⑂ 4 Apache-2.0 2026-06-08
LLM GitHub ThinkJEPA
ThinkJEPAは、ビジョン-言語モデル(VLM)とJEPA(Joint Embedding Predictive Architecture)を統合したデュアルパス具…
★ 42 ⑂ 5 NOASSERTION 2026-04-30
マルチモーダル HF music-flamingo-think-2601-hf
Music Flamingo Thinkは、音楽や楽曲音声を入力として詳細な説明や質疑応答を行えるNVIDIAの音声言語モデルです。ジ…
❤ 41 ↓ 533 other 2026-04-07
LLM GitHub mAIcro
mAIcroは、MicroClub-USTHBによって開発された、コミュニティや組織向けのオープンソースAI知識サービスです。このツ…
★ 41 ⑂ 4 MIT 2026-03-30
LLM GitHub bit-brain
BitBrainは、最小限のGPUリソース(RTX 3090以上)で独自の小型LLM(miniLLM)を学習できるプロジェクトです。Qwen3-…
★ 41 ⑂ 2 Apache-2.0 2026-05-04
ComfyUI GitHub ComfyUI-Grounding
ComfyUI-Groundingは、ComfyUI上でテキスト指定による物体検出・領域マスク生成・SAM2セグメンテーションをまとめて…
★ 41 ⑂ 3 MIT 2026-06-22
3D / NeRF GitHub OVGGT
OVGGTは、トレーニング不要で、任意に長いビデオストリームからリアルタイムで3D再構成を可能にする革新的なフレーム…
★ 41 ⑂ 1 NOASSERTION 2026-06-15
LLM GitHub grok-dreamcore
このツールは、感情状態、記憶の固定点、象徴的な原型に基づいて超現実的な夢のシーケンスを生成するエンジンです。…
★ 41 ⑂ 6 NOASSERTION 2026-05-26
音声生成 / TTS GitHub Irodori-TTS-Server
「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Spe…
★ 41 ⑂ 10 MIT 2026-06-22
ASR / 音声認識 GitHub echoic
Echoicは、AIを活用した発話練習ツールです。任意の音声ファイルをインポートし、文章ごとに発話練習を行い、音素レ…
★ 41 ⑂ 5 MIT 2026-05-19
ComfyUI GitHub ComfyUI-FBCNN
「ComfyUI-FBCNN」は、人気の画像生成UI「ComfyUI」に、JPEG画像の圧縮ノイズ(アーティファクト)除去に特化したFBC…
★ 41 ⑂ 7 GPL-3.0 2025-02-24
ComfyUI GitHub ComfyUI_SeeCoder
ComfyUI向けの実験的なカスタムノード集で、SeeCodersを使って画像から埋め込みを生成し、既存のテキスト埋め込みな…
★ 40 ⑂ 8 GPL-3.0 2024-05-22
ASR / 音声認識 GitHub voiceInput
「VoiceInput」は、Windows OS向けのAI音声入力ツールです。指定されたショートカットキーを押すだけで、話した内容…
★ 40 ⑂ 7 MIT 2026-06-25
音楽生成 GitHub latentscore
LatentScoreは、テキスト記述からアンビエントミュージックを生成するPythonライブラリです。GPU不要でローカル環境…
★ 40 ⑂ 4 Apache-2.0 2026-05-29
ComfyUI GitHub GF_nodes
このツールは、ComfyUI用のカスタムノード「RMBG-2.0 Background Removal Node」です。briaai/RMBG-2.0モデルとBEN2:…
★ 40 ⑂ 1 MIT 2025-04-19
ComfyUI GitHub ComfyUI-sudo-latent-upscale
ComfyUI向けの潜在空間アップスケール用カスタム実装・モデル集です。画像をRGBで拡大してから再エンコードするので…
★ 40 ⑂ 7 BSD-3-Clause 2024-05-22
動画生成 GitHub PhyMotion
PhyMotionは、人間のビデオ生成におけるリアルなモーション生成の課題を解決するために提案された、構造化された詳細…
★ 39 ⑂ 5 MIT 2026-05-15
ComfyUI GitHub ComfyUI-Img2Img-Turbo
このツールは、人気の画像生成UIであるComfyUIのImg2Img機能を高速化するための拡張機能です。GaParmar氏のImg2Img-T…
★ 39 ⑂ 7 MIT 2024-05-22
音声生成 / TTS GitHub voice-zero
Voice-Zeroは、ゼロショットテキスト音声合成エンジン(Chatterbox、Pocket TTSなど)で利用可能な、高品質なオープ…
★ 39 ⑂ 7 NOASSERTION 2026-05-14