【工作職責】
基于業務場景需求,分析大模型應用的技術路徑,設計針對性微調方案與評估體系。
基于大模型微調框架,完成模型參數調優、領域適配及性能優化,提升模型任務表現。
構建高質量訓練數據集,設計數據增強策略,開發數據清洗與標注工具鏈。
搭建模型評估平臺,設計多維度測試用例,持續監控并優化模型推理效果。
研究模型蒸餾、量化、加速等技術,推動大模型在具體業務場景的工程化落地。
【任職要求】
計算機、人工智能相關專業碩士及以上學歷,3年以上NLP、深度學習研發經驗。
深入理解Transformer架構,熟悉BERT、GPT、DeepSeek等主流大模型的技術原理與實現細節。
掌握PyTorch、TensorFlow等框架,具備分布式訓練實戰經驗。
精通Prompt工程、LoRA、P-tuning等微調技術,具有多任務遷移學習項目經驗。
熟悉HuggingFace生態,具備完整的大模型訓練-評估-部署全鏈路開發能力。
具備優秀的數據處理能力,熟悉SQL/NoSQL數據庫及大數據處理框架。
對模型安全、可解釋性有深入理解,具有大模型對齊經驗者優先。