崗位職責:
1、引領團隊開展開源大模型應用落地探索與開發,尤其是與公司相關業務結合的應用落地;
2、參與對業務數據進行清洗、分類、分析、存儲,完成業務數據集建設;
3、參與業務知識庫、大模型文本生成、智能問答、知識圖譜等應用構建;
4、負責對模型進行微調與優化,包括主流大模型Qwen、DeepSeek等;使用Dify、Langchain、Ollama等AI開發工具,運用LORA等技術優化模型性能;
5、關注大模型前沿技術,跟進業內最新研究進展和應用趨勢,提出創新思路和方向。參與對業務數據進行挖掘,完成大模型訓練數據集的建設等。
崗位要求:
1、碩士研究生學歷,計算機、人工智能、數學、自然語言處理等相關專業優先;
2、在自然語言處理、機器學習相關算法有一定理論功底或學習熱情,有AI產品或NLP應用開發經驗者優先;
3、掌握PyTorch、TensorFlow等機器學習框架,熟悉常見的深度學習模型及其應用方法;
4、理解大模型相關的訓練和推理技術者優先,包括多機多卡、全參微調、加速、蒸餾、高質量數據構建等;
5、熟悉主流大模型(如 GPT、Gemini、LLaMA、Claude、DeepSeek等)工作原理及應用,熟悉Dify、Langchain、Ollama等一種或多種主流開源LLM/Agent應用開發框架,有實際大模型調優/應用經驗者(Prompt tuning、prefix tuning、LORA等一種即可)優先;
6、能輕松閱讀和理解相關英文技術文檔;
7、強學習能力、熱愛AIGC技術,良好的溝通能力,良好的團隊合作精神。