主要職責:
1.參與RAG(檢索增強生成)系統的設計、開發、測試和優化,包括知識庫的構建、索引的創建、檢索算法的實現和評估。
2.協助構建基于大型語言模型(例如DEEPSEEK、千問等)的智能對話機器人,參與對話流程的設計、模型的微調和評估。
3.研究和探索最新的RAG和LLM相關技術和方法,例如更先進的檢索策略、更有效的上下文融合技術等。
4.參與知識庫的建設和維護,包括數據清洗、數據標注和知識抽取等工作。
5.協助進行系統性能的評估和監控,發現并解決潛在的技術問題。
6.參與編寫技術文檔和研究報告,分享學習和實踐經驗。
7.根據項目需求,參與其他與自然語言處理和生成式AI相關的任務。
能力要求:
1.計算機科學、軟件工程、人工智能、自然語言處理或相關專業本科或碩士在讀學生。
2.對人工智能、自然語言處理和機器學習領域有濃厚的興趣和一定的了解。
3.熟悉Python,具備良好的編程基礎。
4.了解RAG(檢索增強生成)的基本原理和流程,有相關項目經驗者優先。
5.對大型語言模型(LLM)有一定的了解,熟悉常用的模型架構和應用場景。
6.具備良好的學習能力、溝通能力和團隊合作精神。
7.能夠積極主動地解決問題,并對技術細節有深入的理解和追求。
8.每周能保證至少5天的實習時間,實習期至少6個月。
加分項:
1.有使用Dify等相關工具的經驗。
2.有使用Hugging Face Transformers庫的經驗。
3.參與過開源NLP項目或相關競賽。
4.熟悉信息檢索、提示工程、知識圖譜等相關技術。
5.有搭建和部署AI應用經驗者優先。