1.工程化落地與性能調優
o搭建大模型服務框架,熟悉HTTP接口設計,部署高并發、低延遲的模型服務。
o利用vLLM、Ollama等框架優化推理性能,探索量化、蒸餾等技術壓縮模型規模。
o構建模型評估體系,設計自動化評測腳本,監控模型輸出穩定性及安全性(如幻覺抑制)。
2.業務場景賦能
o與售前團隊協作,針對審計領域需求,設計大模型應用方案(如制度問答,審計問題定性,審計文書生成)。
o熟練運用工具鏈與中間件,例如LangChain、LlamaIndex等框架實現復雜任務編排,結合向量數據庫(如Milvus、Pinecone)優化檢索效率。
3.大模型開發與優化
o負責大語言模型(LLM)的預訓練、精調(SFT)、強化學習(RLHF)等流程開發,優化模型在問答、摘要、知識推理等場景的性能。
o應用LoRA、QLoRA等技術實現模型參數高效微調,結合業務需求適配開源模型(如LLaMA、GLM、Qwen等),減少資源消耗并提升推理效率。
o設計并實施RAG(檢索增強生成)技術方案,優化端到端鏈路效果,提升知識密集型任務準確率。
任職要求
1.技術能力
o精通Python,熟悉PyTorch/TensorFlow框架,具備分布式訓練及混合精度調優經驗者優先。
o熟悉Prompt Engineering設計模式,具備多輪對話、角色扮演等交互式場景的調優經驗。
o熟悉大模型生態工具鏈,包括但不限于Hugging Face、LLaMA Factory等。
o熟悉Linux操作系統,掌握基礎運維及性能調優命令(如Shell腳本、資源監控)
o理解網絡基礎(如HTTP協議、RESTful API設計、高并發服務架構),具備服務部署及調試經驗。
o熟悉數據庫技術,包括關系型數據庫(如MySQL)和NoSQL數據庫(如MongoDB),了解向量數據庫的應用場景。
o了解前后端開發框架(如Django/Flask、React/Vue),能夠協作完成服務接口聯調及輕量化前端開發。
2.經驗要求
o3年以上NLP/或1年以上大模型研發經驗,完整參與過至少一個LLM項目的訓練或落地應用者優先。
o有金融、政務、審計等領域AI項目經驗者優先。
o熟悉華為昇騰生態(如MindSpore、ModelArts)或云計算平臺集成經驗者優先。
o具備基于通用技術棧(如Linux服務器部署、數據庫優化、前后端協作)的工程化落地經驗者優先
3.團隊能力素質
o能力獨立實施大模型工程類項目者優先。
o具備團隊協作能力,能將復雜技術問題轉化為可落地的業務解決方案者優先。