職責描述:
1. 負責開源大模型算法洞察、引入與改造工作,包括模型的能力洞察、架構設計、算法優化、性能調優、適配改造等;
2. 支撐LLM技術的產品化落地,包括但不限于智能問答、文本生成、圖像識別等;
3. 深度參與連接開源大模型與應用場景的工作,理解應用需求,進行定制化技術預研;
4. 協助移植算法到ARM、GPU、CPU等目標計算平臺;
5. 專利挖掘、知識產權資料編寫與申請,參與行業活動。
任職要求:
1. 計算機、電子工程、自動化、數學、物理等相關方向碩士學歷,具備Python編程能力;
2. 熟悉transformer、seq2seq等模型結構;熟練掌握常見的任一種機器學習或者深度學習框架(Tensorflow、Pytorch、Paddle等);
3. 熟悉業界主流開源大模型者,如QWen、LLaMA、ChatGLM等;
4. 在語義分析、知識圖譜、RAG、工作流等相關領域有深入研究或相關項目經驗;
5. 具備良好的學習/溝通表達能力,較強的團隊合作意識、對技術有濃厚的興趣,熱衷于追求技術極致與創新。
6. 有LLM大模型微調、全參數訓練經驗優先。
7. 熟悉Agent、MCP、A2A等相關技術,有利用開源大模型進行大模型調小模型API接口項目的實際經驗優先。