崗位職責:
1.開源大模型框架部署及微調;
2.大模型技術團隊的規劃及培訓;
3.相關模型的技術文檔撰寫,協助公司售前落單相關項目;
4.可以基于大模型去衍生相關應用產品。
技能要求:
1.本科及以上學歷。
2.熟練掌握一種或多種主流深度學習框架,如 TensorFlow、PyTorch、Hugging Face 等。
3.深入理解 Transformer、BERT、GPT、Llama 等語言模型的結構和原理,熟悉大模型的訓練機制,如預訓練、微調訓練等。
4.熟練掌握 Python、Java、Go 等編程語言中的一種或多種。
5.了解自然語言處理的基本概念、原理和方法,熟悉常見的 NLP 任務和算法,如文本分類、情感分析、機器翻譯、命名實體識別等。
6.掌握機器學習的基本算法和原理,能夠根據實際問題選擇合適的算法進行模型訓練和優化。
7.熟悉視覺、語言等多模態數據的處理和融合方法,了解相關的模型和技術。
8.大模型應用開發經驗優先,如在 RAG(檢索增強生成)、NL2SQL(自然語言轉結構化查詢語言)、ChatBI(基于聊天的商業智能)、NL2API(自然語言轉應用程序接口)、Agent(智能體)等模塊的研發與應用落地經驗者優先。
9.模型訓練與調優經驗,熟悉分布式訓練框架,如 DeepSpeed、Megatron 等,具備在大規模數據集上進行模型訓練的能力,有 LLM(大型語言模型)中的預訓練、SFT(有監督微調)、RLHF(基于人類反饋的強化學習)等相關訓練經驗者優先。