崗位職責:
1. 負責大模型(LLM)的研發與優化,包括但不限于模型架構設計、訓練調優(SFT、RLHF)、推理加速等,提升模型在搜索、問答等場景的性能。
2. 探索前沿技術方向,如RAG(檢索增強生成)、多模態融合、數據飛輪等,推動大模型在垂直領域的應用落地。
3. 參與海量數據清洗、標注及預處理,構建高質量訓練數據集,優化模型泛化能力。
4. 主導大模型(LLM)與智能體(AI Agent)系統的聯合研發,包括智能體任務規劃、決策推理、記憶機制等核心模塊設計,提升復雜場景(如自動化辦公、多輪交互)的自主執行能力。
5. 熟悉大模型驅動的智能體技術棧,如AutoGen、LangChain框架開發,實現API調用、工具擴展、多智能體協作等高級功能。
6. 參與大模型訓練全流程(預訓練、SFT、RLHF),支撐智能體底層認知與推理能力。
-
崗位要求:
1. 計算機/AI相關專業,熟悉機器學習、強化學習及NLP核心技術,掌握Transformer、BERT/GPT等模型架構。
2. 精通Python,具備PyTorch/TensorFlow實戰經驗,熟悉智能體開發框架(如AutoGen、LangChain)及工具鏈集成。
3. 有大模型結合智能體落地項目經驗,包括但不限于任務分解、記憶管理、API調用優化等。
4. 熟悉智能體評估方法論,能獨立設計測試用例與性能指標。