工作內容
1、負責公司GPU設備的日常維護和保養,保障算力輸出的持續、穩定、高效;
2、對設備硬件進行維護,包括設備上下架,設備開關機,RAID配置,網口或者線纜維護等;
3、實時操作系統安裝及網絡基礎配置,基本操作系統和網絡故障排查;包括配置網卡、管理卡IP,修改系統密碼,系統服務開啟/關閉/重啟等;
4、實施相關設備的資產管理工作,包括資產盤點、統計、貼簽等;
5、實施各模塊機房和網絡機房相關設備的定期巡檢,對異常按要求時間進行通報;
6、實施數據中心相關業務開通,設備遷入遷出,現場代為操作等工單任務;
7、協助客戶綜合布線或者其他服務請求等工單任務;
8、協助處理故障和制作客戶故障報告;
9、配合帶領客戶和領導進行參觀訪問;
10、完成其他領導交辦的工作。
任職要求
1、本科以上學歷,計算機或相關專業畢業,一年以上工作經驗;
2、熟悉Windows、Linux操作系統的安裝、配置、故障排除,具備各類系統環境,如雙機群、冷熱備等管理模式的部署,優化配置能力;
3、有扎實的服務器硬件知識,熟悉不同服務器型號和品牌,能夠進行服務器的安裝、配置和維護,包括硬件組件的更換和升級;
4、具備GPU計算卡經驗,熟悉主流的GPU計算卡型號和架構,能夠安裝、配置和管理GPU計算卡,并進行性能優化和故障排除;
5、熟悉服務器硬件的性能監測和調優工具,能夠進行性能分析和瓶頸識別;
6、熟悉服務器虛擬化技術,如VMware、KVM等優先考慮;
7、具備深入了解GPU計算框架,如CUDA、OpenCL等優先考慮。