崗位職責
1、參與公司大模型的開源應用落地,尤其是結合公司核心業務的實際應用開發與實踐;
2、負責公司業務相關數據的處理工作,包括數據清洗、分類、分析和存儲,助力構建高質量的數據集;
3、協助公司業務知識庫的建設,支持大模型文本生成、智能問答、知識圖譜等應用的開發與優化;
4、負責大模型微調與優化工作,涵蓋主流大模型(如Qwen、DeepSeek等),使用Dify、Langchain、Ollama等開發工具,以及LORA技術提升模型性能;
5、持續關注大模型領域的技術前沿,及時跟進最新研究動態與行業趨勢,并結合公司實際需求提出創新思路與解決方案。同時,參與數據挖掘,完成大模型訓練數據集的構建。
任職資格
1、計算機、人工智能、數學、自然語言處理等相關專業本科及以上學歷(985,211優先),具備一定的學術背景和實踐經驗;
2、熟練掌握Python,熟悉PyTorch以及最新的Transformer、diffusion等模型架構,具備常見深度學習模型的應用經驗;
3、熟悉多個主流大模型(如GPT、Gemini、LLaMA、Claude、DeepSeek、Qwen等)的工作原理及應用,精通Dify、Langchain、Ollama等一種或多種開源LLM/Agent開發框架;
4、有豐富的深度學習、多模態、NLP、大模型等領域的相關模型訓練和調試經驗,優先考慮有多機多卡訓練、全參數微調、加速、蒸餾以及高質量數據構建等相關經驗者;
5、擁有扎實的自然語言處理(NLP)或機器學習算法理論基礎,熱衷于AI產品或NLP應用的開發與實踐經驗者優先;
6、在大數據處理、大規模分布式計算、分布式訓練等領域有科研或實踐經歷優先;
7、具備較強的學習能力和問題解決能力,能夠在快節奏環境中工作。