經驗要求:8年以上生物信息學開發經驗,5年以上云平臺架構經驗
核心優勢亮點
1.高性能計算與云平臺架構
- 主導搭建國家基因庫Hadoop/Spark大數據平臺、天津天河超算集群等,支持PB級數據計算
- 精通AWS/華為云等云平臺生信環境部署,實現動態資源調度與成本優化
2.算法工程化與極致優化
- 具備極致的程序運行優化思想,并有相關的案例。
3.獨立云平臺開發能力
- 從0到1構建生信自動化分析平臺。
崗位職責
4.云原生生信平臺架構
- 設計基于Kubernetes的分布式計算框架,支持AWS/Azure/GCP多云環境自動擴縮容
- 優化Spark/Hadoop集群資源利用率,開發Serverless計算管道應對突發任務
5.高性能算法開發
- 主導基因組比對、變異檢測等核心算法研發,要求TB級數據處理時效性達小時級
- 實現Python/C++混合編程優化,關鍵模塊響應延遲控制在毫秒級(需提供性能壓測報告)
6.工程化體系建設
- 建立CI/CD自動化測試體系,要求萬級QPS壓力下系統可用性≥99.99%
- 制定代碼性能審查標準,將Big-O復雜度分析納入開發規范
7.技術攻堅與團隊賦能
- 解決EB級數據存儲/計算瓶頸,主導GPU加速、近似算法等前沿技術預研
- 培養3-5人技術團隊,輸出高性能計算最佳實踐手冊
硬性要求
8.技術棧深度
- 語言:Python(Cython/Numba優化)
- 大數據:Hadoop/Spark/Flink,HBase/Redis
9.性能指標背書
- 至少1個TB級數據優化案例(如計算耗時壓縮50%+,單位成本下降40%+)
- GitHub需展示性能攻堅代碼(如開源工具加速模塊)
10.領域知識
- 精通代謝組學,蛋白等多組學生信分析。