3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

genobert

★ 8 MIT 更新: 2026-05-02 GitHubで見る →

概要

GenoBERTは、遺伝子型シーケンスを言語モデリングの問題として捉えるBERTベースの深層学習モデルです。

マスクされた言語モデリングを活用し、遺伝子型データから連鎖不平衡パターンを学習することで、欠損した遺伝子型を高精度に補完します。

ゲノム位置バイアスを考慮したアテンションや、クラスバランス学習など、ゲノムデータに特化した革新的な機能を備えています。

主にゲノム研究者や生物情報科学者が、遺伝子型インピュテーションの精度向上に利用することを想定しており、Python環境とPyTorch上で動作し、GPUおよびHPCクラスターでの大規模なトレーニングをサポートしています。

互換性・特徴

  • GPU必須
  • Python
  • CLI
  • 深層学習
  • ゲノム解析

基本情報

ライセンスMIT
Stars8
カテゴリLLM
アクティビティlow

GitHub: https://github.com/learnslowly/genobert