崗位職責:
1、模型微調與優化:參與大模型在協同辦公及建筑行業場景下的應用,包括但不限于:基于公有云大模型做局部私有資料的對接微調,基于私有大模型做垂直領域的數據抓取、自動標注、微調訓練;
2、應用落地:負責大模型的模型適配與應用落地,包括但不限于LLM、Langchain、Agent、Eval等技術;
3、性能評估監測與部署:定期監控模型性能,進行在特定應用場景下的各類模型能力的評估,確保模型達到業務要求,能夠進行模型的容器化部署。
任職要求:
1、參與過大模型相關開發工作,包括但不限于:數據清洗、開源模型實際微調、訓練框架開發、評測、推理部署等;
2、精通Python編程語言,熟悉Java等其他編程語言,熟悉常用框架如PyTorch,TensorFlow等深度學習框架;
3、熟悉大語言模型的增量預訓練、指令微調、偏好微調等多種訓練方法 ,有全場景訓練實戰落地經驗;
4、熟悉全參數、LoRA 、QLoRA 等微調方法, 有微調場景落地經驗;
5、熟悉DeepSpeed、flash-attn、vllm等大模型訓練及推理加速方法;
6、熟悉數據收集、清洗和預處理的流程。有訓練數據構造落地經驗;
7、熟悉Docker、Kubernetes等容器化技術。
8、扎實的數學功底,熟悉概率統計、線性代數、優化方法等領域的相關知識 。
9、有成功優化模型訓練算法、提升模型性能的項目經驗,能夠獨立承擔算法設計和開發任務,能獨當一面。
10、對深度學習領域的技術創新有敏銳的洞察力,樂于學習并積極探索新技術 。