概要
GenoBERTは、遺伝子型シーケンスを言語モデリングの問題として捉えるBERTベースの深層学習モデルです。
マスクされた言語モデリングを活用し、遺伝子型データから連鎖不平衡パターンを学習することで、欠損した遺伝子型を高精度に補完します。
ゲノム位置バイアスを考慮したアテンションや、クラスバランス学習など、ゲノムデータに特化した革新的な機能を備えています。
主にゲノム研究者や生物情報科学者が、遺伝子型インピュテーションの精度向上に利用することを想定しており、Python環境とPyTorch上で動作し、GPUおよびHPCクラスターでの大規模なトレーニングをサポートしています。
互換性・特徴
- GPU必須
- Python
- CLI
- 深層学習
- ゲノム解析
基本情報
| ライセンス | MIT |
| Stars | 8 |
| カテゴリ | LLM |
| アクティビティ | low |
