崗位職責:
1、開源大語言模型項目的微調和優化,提升模型性能和準確性;
2、負責公司多種場景大模型核心算法研發(包括:文本、視頻、圖片、音頻等);
3、參與大模型全流程的研發工作:系統方案設計、數據處理、算法模型設計、模型開發、訓練、部署、調試、評測、業務聯合調試;
4、負責大語言模型的持續調優:人機對話、多輪對話、智能問答、知識庫檢索、意圖理解等;
5、積極探索和跟進技術前沿方向,在實際業務場景落地并沉淀通用的算法能力或解決方案。
1、學歷:碩士及以上學歷,統招院校,計算機科學、統計學、人工智能、軟件工程或相關領域教育背景
2、1-3年在AI領域的工作經驗,特別是大語言模型的開發和優化經驗。
3、專業素質要求:
(1)對自然語言處理和機器學習領域的前沿技術有深入的了解和研究;
(2)精通多模態預訓練模型技術,精通分布式訓練技術,具備多模態預訓練大模型經驗;
(3)熟悉LLM大模型基本原理、langchain框架、Agent技術、RAG技術等及應用,對大模型相關技術有finetuning、應用或落地實踐優先;
(4)有大型語言模型訓練經驗優先考慮;
(5)學習能力、邏輯思維能力強,對數據敏感,能深入理解復雜的業務邏輯。