3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#Python (2218 repos)
「Python」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub rs-paper-hub
RS-Paper-Hubは、arXivからリモートセンシングおよび地球観測関連の論文を自動的に収集、整理、分類、タスクタグ付け…
★ 44 ⑂ 7 2026-06-29
音声生成 / TTS GitHub Higgs_v3-TTS-ComfyUI
このツールは、ComfyUI用のノード集であり、bosonai/higgs-audio-v3-tts-4bモデルを活用して、多言語(100言語対応)…
★ 43 ⑂ 8 MIT 2026-06-20
LLM GitHub AlphaAnalyst-open-source-autonomous-equity-research-agent
AlphaAnalystは、米国株のティッカーから、DCF評価、ピア比較、ニュースセンチメント、決算コールのトーン分析などを…
★ 43 ⑂ 7 Apache-2.0 2026-04-29
LLM GitHub turbo-graph
turbo-graphは、軽量な埋め込み検索ライブラリであるturbovecを基盤とし、グラフメモリ機能を追加することで、制約付…
★ 43 ⑂ 28 MIT 2026-06-19
AIエージェント GitHub Tokenless
Tokenlessは、Claude Codeのトークン使用量を最大50%以上削減することに特化したコマンドラインツールです。大規模な…
★ 43 ⑂ 2 MIT 2026-05-19
LLM GitHub hermes-katana
Hermes Katanaは、AIエージェント向けの多層防御セキュリティレイヤーです。テキストの出所を文字レベルで追跡し、プ…
★ 42 ⑂ 2 MIT 2026-06-22
音声生成 / TTS GitHub Audio-Oscar
Audio-Oscarは、複雑な音声シーン記述から長尺で制御可能な音声を生成するためのマルチエージェントフレームワークで…
★ 42 ⑂ 4 Apache-2.0 2026-06-08
音楽生成 GitHub studiomi300
studiomi300は、1つのプロンプトから30秒のシネマティックなリール動画を生成するエンドツーエンドのツールです。Dir…
★ 42 ⑂ 8 MIT 2026-05-22
LLM GitHub ThinkJEPA
ThinkJEPAは、ビジョン-言語モデル(VLM)とJEPA(Joint Embedding Predictive Architecture)を統合したデュアルパス具…
★ 42 ⑂ 5 NOASSERTION 2026-04-30
画像生成 GitHub Coarse-guided-Gen
「Coarse-guided-Gen」は、粗いサンプルをガイドとして、条件付きのビジュアルコンテンツ生成を可能にするツールです…
★ 42 ⑂ 4 2026-05-08
マルチモーダル GitHub VisualClaw
VisualClawは、物理世界向けのリアルタイムでパーソナライズされたエージェントを構築するための自己進化型マルチモ…
★ 42 ⑂ 3 MIT 2026-06-16
音声生成 / TTS GitHub call-translator
「Realtime Call Translator」は、ビデオ/音声通話中にリアルタイムで音声を翻訳するツールです。あなたが話す言語は…
★ 42 ⑂ 11 MIT 2026-04-04
音声生成 / TTS GitHub Irodori-TTS-Server
「Irodori OpenAI TTS Server」は、Aratako/Irodori-TTSの500M v3ベースモデル向けに開発された、OpenAI Text-to-Spe…
★ 41 ⑂ 10 MIT 2026-06-22
マルチモーダル HF music-flamingo-think-2601-hf
Music Flamingo Thinkは、音楽や楽曲音声を入力として詳細な説明や質疑応答を行えるNVIDIAの音声言語モデルです。ジ…
❤ 41 ↓ 533 other 2026-04-07
LLM GitHub grok-dreamcore
このツールは、感情状態、記憶の固定点、象徴的な原型に基づいて超現実的な夢のシーケンスを生成するエンジンです。…
★ 41 ⑂ 6 NOASSERTION 2026-05-26
ASR / 音声認識 GitHub echoic
Echoicは、AIを活用した発話練習ツールです。任意の音声ファイルをインポートし、文章ごとに発話練習を行い、音素レ…
★ 41 ⑂ 5 MIT 2026-05-19
ComfyUI GitHub ComfyUI-Grounding
ComfyUI-Groundingは、ComfyUI上でテキスト指定による物体検出・領域マスク生成・SAM2セグメンテーションをまとめて…
★ 41 ⑂ 3 MIT 2026-06-22
3D / NeRF GitHub OVGGT
OVGGTは、トレーニング不要で、任意に長いビデオストリームからリアルタイムで3D再構成を可能にする革新的なフレーム…
★ 41 ⑂ 1 NOASSERTION 2026-06-15
LLM GitHub bit-brain
BitBrainは、最小限のGPUリソース(RTX 3090以上)で独自の小型LLM(miniLLM)を学習できるプロジェクトです。Qwen3-…
★ 41 ⑂ 2 Apache-2.0 2026-05-04
音楽生成 GitHub latentscore
LatentScoreは、テキスト記述からアンビエントミュージックを生成するPythonライブラリです。GPU不要でローカル環境…
★ 40 ⑂ 4 Apache-2.0 2026-05-29
ASR / 音声認識 GitHub voiceInput
「VoiceInput」は、Windows OS向けのAI音声入力ツールです。指定されたショートカットキーを押すだけで、話した内容…
★ 40 ⑂ 7 MIT 2026-06-25
動画生成 GitHub PhyMotion
PhyMotionは、人間のビデオ生成におけるリアルなモーション生成の課題を解決するために提案された、構造化された詳細…
★ 39 ⑂ 5 MIT 2026-05-15
音声生成 / TTS GitHub voice-zero
Voice-Zeroは、ゼロショットテキスト音声合成エンジン(Chatterbox、Pocket TTSなど)で利用可能な、高品質なオープ…
★ 39 ⑂ 7 NOASSERTION 2026-05-14
画像生成 GitHub image2-ads-studio
Image2 Ads Studioは、Image2向けの広告プロンプト生成エージェントです。顧客のビジネス要件、コピー、参考画像を分…
★ 39 ⑂ 3 Apache-2.0 2026-05-06