職位描述
崗位職責:
1、負責Agent系統的穩定性建設,設計高可用架構與容災降級方案,保障系統在極端場景下穩定運行;
2、優化系統性能,解決分布式場景下的任務調度、數據一致性、故障自愈等挑戰,提升服務SLA;
3、建立系統監控、告警及應急響應機制,負責重大故障的排查與恢復;
4、持續優化系統架構,通過代碼重構、性能調優等手段提升系統擴展性與可維護性;
5、探索分布式計算、任務調度、流式數據處理等領域的前沿技術(如分布式事務、彈性擴縮容、異構計算等),推動技術成果轉化。
任職要求:
1、本科及以上學歷,計算機、通訊等相關專業,5年及以上研發相關工作經驗優先;
2、扎實的計算機知識,有較強的邏輯能力和學習能力;深入了解Go、Python、Java等至少一門語言;
3、熟悉分布式系統設計、微服務系統設計、穩定性治理、常用中間件原理以及實踐等優先;
4、在系統容災(多活架構、流量調度)、服務降級(熔斷限流)、性能優化(JVM/網絡/存儲)等領域有成功落地經驗;
5、有AI/Agent系統開發經驗,熟悉LLM、RAG、分布式模型推理等技術棧的優先;
6、熱愛技術,主動負責,樂于直面挑戰;能夠保持開放、持續學習,善于發現問題,具備良好的團隊合作精神;有良好的代碼編程風格。