主要職責:
1、設計和構建高性能的數據倉庫架構,包括數據湖、數據倉庫和數據集市。
2、引領數據開發團隊,指導數據集成、ETL(抽取、轉換、加載)流程的設計與實施。
3、選擇并優化數據存儲和檢索技術,確保數據的完整性、一致性和安全性。
4、監控數據倉庫的性能,進行調優和擴展,以應對不斷增長的數據量和復雜性。
5、與業務分析師和數據科學家合作,理解數據需求并轉化為技術解決方案。
6、制定數據治理政策,確保數據質量和合規性,符合HIPAA、GDPR等醫療數據隱私法規。
7、評估和引入新技術和工具,以增強數據倉庫的功能和效率。
8、培訓和指導團隊成員,提升團隊的數據開發能力和數據管理意識。
任職要求:
擁有計算機科學、數據科學或相關領域的學士或碩士學位。
至少5年以上數據倉庫架構和開發經驗,有醫療行業經驗者優先。
精通數據倉庫建模方法(如星型模式、雪花模式)。
熟練掌握SQL和至少一種ETL工具(如Informatica、Talend、DataStage)。
熟悉大數據處理框架(如Hadoop、Spark)和NoSQL數據庫(如MongoDB、Cassandra)。
有云數據倉庫經驗,熟悉AWS Redshift、Google BigQuery或Azure Synapse等云服務。
強大的問題解決能力和項目管理技巧。
良好的溝通和團隊領導能力,能與非技術背景的同事有效溝通
加分項:
擁有數據倉庫相關的專業認證(如CDWA、CDEP)。
有BI工具的配置和集成經驗。
熟悉數據治理和數據質量工具。
有醫療數據隱私法規(如HIPAA、GDPR)的合規經驗。