3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#AI/ML (74 repos)

「AI/ML」タグが付いたリポジトリ

← 全リポジトリ

ASR / 音声認識
GitHub
CWX-Transcribe
CWX-Transcribeは、OpenAIの`gpt-4o-transcribe-diarize`モデルを基盤とした、長時間の2話者インタビュー向け高精度…
★ 2 Apache-2.0 2026-05-06
音声生成 / TTS
GitHub
newscriber
NewScriberは、AIを活用した自律型の多言語ニュース編集・ポッドキャストスクリプト作成・音声ブリーフィング配信ネ…
★ 2 NOASSERTION 2026-06-10
マルチモーダル
GitHub
Viz2Speech
Viz2Speechは、インドネシアの視覚障害者のアクセシビリティを向上させるために開発された、画像から音声への変換エ…
★ 2 ⑂ 1 MIT 2026-05-16
LLM
GitHub
rag-chatbot-university
UniMindは、大学生向けのAIを活用したRAG(検索拡張生成)チャットボットで、大学のノートに関する質問に即座に答え…
★ 1 2026-05-30
画像生成
GitHub
TBAF
TBAF(Triangle Based Activation Function)は、画像ベースモデル向けの画期的な活性化関数です。自己回帰的な画像…
★ 1 MIT 2026-05-25
画像生成
GitHub
nano-banana-2-api
APIDotのNano Banana 2 APIは、GoogleのGemini 3.1 Flash Imageモデルを活用し、高速で高品質な画像生成と自然言語に…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
Open-AutoGLM
AIを活用して電話でのモバイルタスクを自動化するスマートアシスタントフレームワークです。AutoGLMを基盤とし、直感…
★ 1 ⑂ 1 Apache-2.0 2026-06-26
音声生成 / TTS
GitHub
logica-voice
Logica Voiceは、オープンソースで音声ネイティブな会話型AIエンジンです。フルデュプレックス、マルチエージェント…
★ 1 ⑂ 1 MIT 2026-06-04
3D / NeRF
GitHub
faster-trellis
「faster-trellis」は、Microsoftの「TRELLIS v1」における画像から3Dモデルへの変換を、学習不要で高速化するライブ…
★ 1 NOASSERTION 2026-06-11
動画生成
GitHub
awesome-ai-restaurant-video-prompts
このGitHubリポジトリは、AIを活用したレストランおよび食品マーケティングのビデオプロンプト、反復可能なワークフ…
★ 1 2026-04-28
ASR / 音声認識
GitHub
BaltiVoice-ASR
BaltiVoice ASRは、バルティ語(チベット語族の低リソース言語)の音声をテキストに変換する初のAI音声認識(ASR)シ…
★ 1 MIT 2026-06-12
マルチモーダル
GitHub
residuos_yolov11m_gemma3
このリポジトリは、ブラジルの都市部における不法投棄監視のためのAI活用に関する大学の卒業研究の成果物です。オブ…
★ 1 2026-06-13
LLM
GitHub
fish-ecology-assistant
Panta Rhei · Everything Flows(Fish Ecology Assistant)は、コーディングエージェントを動的な世界観とDeepSeekレ…
★ 0 MIT 2026-06-25