崗位職責:
1.大模型性能優化:負責大型深度學習模型(如Transformer、BERT、GPT等)的性能調優工作,包括但不限于模型收斂速度、準確率、泛化能力等關鍵指標的優化。
2.算法研究與實現:跟蹤并研究最新的深度學習算法、優化技巧及前沿技術,將研究成果轉化為實際應用,提升模型效果。
3.數據預處理與分析:參與數據集的預處理與分析工作,設計并實施數據清洗、特征工程等策略,確保數據質量滿足模型訓練需求。
4.模型訓練與評估:利用TensorFlow、PyTorch等深度學習框架進行模型訓練,設計合理的評估指標體系,對模型效果進行全面評估。
5.團隊協作與溝通:與產品經理、數據工程師、其他算法工程師緊密合作,共同推動項目進展,確保項目按時按質完成。
6.文檔撰寫與分享:撰寫技術文檔,分享研究成果與經驗,提升團隊整體技術水平。
任職要求:
1.教育背景:計算機科學、數學、統計學、物理等相關專業本科及以上學歷,碩士及以上學歷優先。
2.工作經驗:
o5年或以上算法工程師相關工作經驗,有大模型調優項目經驗者優先。
o具備良好的問題解決能力和創新能力,能夠獨立承擔項目任務。
3.專業技能:
o精通Python編程語言,熟悉TensorFlow、PyTorch等深度學習框架。
o對機器學習、深度學習算法有深入理解,具備扎實的數學基礎(線性代數、概率統計、微積分等)。
o熟悉常見的模型優化算法(如梯度下降、Adam等),了解模型并行計算、分布式訓練等技術。
o有NLP、CV等大模型調優經驗者優先。