崗位職責:
1、 參數數學模型數據清洗方面的工作,包括收集、整理與清洗等內容,優化數據質量
2、 參數數學模型數據合成方面的工作,包括預訓練數據、后訓練數據等內容
3、 參與數學模型預訓練驗證相關工作,對數據配比、數據調度等方向進行優化
4、 參與數學模型后訓練對齊相關工作,包括指令微調、強化學習方面的內容
任職要求:
1、熟悉大模型、深度學習、機器學習等相關領域的基本概念和技術。
2、具備較強的編程能力,熟悉Python,對TensorFlow、PyTorch等主流深度學習框架有一定的使用經驗。
3、掌握業界領先大模型的基本原理和訓練以及微調方法,如LLaMA、Qwen、deepseek等模型的訓練過程及LoRA微調等。
4、對大模型的數據合成、數據處理、數據質量評估等方面具有相應的研究經驗。