1.參與建設統一的數據體系,持續集成相關工具產品,以及搭建大數據業務統一計算層等相關工作;
2.參與數據倉庫的架構設計和研發,挖掘數據價值,建設與管理百PB級的公共數據平臺和服務系統,實現高質量數據的互通與共享;
3.助力數據化運營業務,構建豐富多樣的BI應用;
4.對數據采集、數據融合、數據質量、數據應用鏈路有深入理解,并能協助業務數據集市建設,搭建業務領域模型
任職要求
1.數學、計算機、統計學等相關專業,5年以上相關工作經歷;
2.從事數據倉庫領域至少5年以上,熟悉數據倉庫模型設計與ETL開發經驗 ,掌握Kimball的維度建模設計方法,具備海量數據加工處理(ETL)相關經驗;
3.有從事分布式數據存儲與計算平臺應用開發經驗,熟悉Hadoop生態相關技術并有相關實踐經驗著優先,重點考察Hdfs、Mapreduce、Hive、Hbase;
4.有實時ETL研發經驗,對分布式實時大數據處理系統有深入理解,包括但不限于Spark streaming、Flink、Storm...;
5.熟悉數據倉庫領域知識和技能者優先,對數據質量管理有獨到的見解;
6.具有電商行業經驗,有業務sense,能夠通過梳理設計業務模型發現業務問題,并驅動業務目標實現。
加分項
1.對數據挖掘和機器學習有所了解,包括常用的機器學習算法和數據建模過程的優先,并有落地的項目;
2.對Elasticsearch、Hbase、Druid、Kylin有深入理解并成功應用的大型項目