崗位職責:
1.負責大語言模型(如Deepseek、Qwen、GLM等)的微調、訓練及性能優化,提升模型在特定場景下的表現。
2.構建行業垂直領域的專用模型與知識庫系統,推動業務場景的智能化解決方案落地。
3.協同研發團隊完成智能應用產品的設計、開發與部署,包括但不限于對話系統、知識推理等方向。
4.跟蹤前沿技術進展,探索大語言模型與行業需求結合的技術創新點。
任職要求:
1.本科及以上學歷,計算機科學、人工智能、數學或相關專業,2年以上人工智能開發經驗者優先。
2.熟練掌握PyTorch/TensorFlow等深度學習框架,熟悉Transformer架構及NLP領域核心技術(如預訓練、微調、Prompt工程)。
3.具備大語言模型實戰經驗,包括分布式訓練、模型壓縮、推理加速等技術,熟悉LangChain、Hugging Face等工具鏈。
4.扎實的編程能力,精通Python,熟悉Linux開發環境及CUDA加速,有工程落地經驗者優先。
5.邏輯清晰,具備跨團隊協作能力,對AI技術商業化有強烈興趣。
6.加分項:擁有Deepseek、Qwen、LAMM、GLM等模型的實際項目經驗或開源貢獻。