職位描述
崗位要求: 1、熟悉主流大模型生態(tài),包括閉源模型(GPT-4o、文心一言、通義千問)和開源模型(Llama 3、Qwen、Mistral)的調(diào)用方式與特性差異;2、具備模型選型與適配能力,能根據(jù)業(yè)務成本、性能要求選擇合適的模型,并完成 API 對接、參數(shù)調(diào)優(yōu)(temperature、top_p 等),提示詞工程、模型微調(diào); 3、了解輕量化模型部署,如基于 llama.cpp、vLLM 進行開源模型本地部署與量化(4-bit/8-bit),滿足低資源環(huán)境下的應用需求; 4、精通LangChain/LangGraph 核心組件使用,包括 Document Loaders(文檔加載)、Text Splitters(文本分割)、Vector Stores(向量存儲,如 Chroma、FAISS)、Retrievers(檢索器)、Chains(鏈)、Agents(智能體); 5、能基于LangChain 搭建檢索增強生成(RAG)系統(tǒng),實現(xiàn) “知識庫加載→文本向量化→檢索→生成” 全流程閉環(huán); 6、具備LangChain 應用優(yōu)化能力,如優(yōu)化檢索策略(混合檢索、重排序)、解決上下文窗口限制、提升生成結(jié)果的準確性與相關(guān)性;崗位職責: 1、負責企業(yè)級大模型應用的設(shè)計與開發(fā),基于提示詞工程優(yōu)化模型輸出效果,提升業(yè)務場景下的智能交互體驗; 2、基于LangChain框架搭建RAG系統(tǒng)、智能體(Agent)等應用,完成文檔檢索、多模態(tài)交互、流程自動化等功能; 3、完成開源/閉源大模型的選型、對接、調(diào)優(yōu)與部署,解決模型調(diào)用中的性能、成本、穩(wěn)定性問題; 4、沉淀提示詞模板、LangChain組件封裝、模型調(diào)優(yōu)的標準化方案,形成技術(shù)文檔與最佳實踐; 5、與業(yè)務側(cè)協(xié)作,理解需求并轉(zhuǎn)化為技術(shù)方案,推動大模型應用在實際業(yè)務中落地; 6、AI自動化新方向的探索和推進,給自動化測試賦能。