職位描述
崗位要求: 1、熟悉主流大模型生態(tài),包括閉源模型(GPT-4o、文心一言、通義千問(wèn))和開(kāi)源模型(Llama 3、Qwen、Mistral)的調(diào)用方式與特性差異;2、具備模型選型與適配能力,能根據(jù)業(yè)務(wù)成本、性能要求選擇合適的模型,并完成 API 對(duì)接、參數(shù)調(diào)優(yōu)(temperature、top_p 等),提示詞工程、模型微調(diào); 3、了解輕量化模型部署,如基于 llama.cpp、vLLM 進(jìn)行開(kāi)源模型本地部署與量化(4-bit/8-bit),滿(mǎn)足低資源環(huán)境下的應(yīng)用需求; 4、精通LangChain/LangGraph 核心組件使用,包括 Document Loaders(文檔加載)、Text Splitters(文本分割)、Vector Stores(向量存儲(chǔ),如 Chroma、FAISS)、Retrievers(檢索器)、Chains(鏈)、Agents(智能體); 5、能基于LangChain 搭建檢索增強(qiáng)生成(RAG)系統(tǒng),實(shí)現(xiàn) “知識(shí)庫(kù)加載→文本向量化→檢索→生成” 全流程閉環(huán); 6、具備LangChain 應(yīng)用優(yōu)化能力,如優(yōu)化檢索策略(混合檢索、重排序)、解決上下文窗口限制、提升生成結(jié)果的準(zhǔn)確性與相關(guān)性;崗位職責(zé): 1、負(fù)責(zé)企業(yè)級(jí)大模型應(yīng)用的設(shè)計(jì)與開(kāi)發(fā),基于提示詞工程優(yōu)化模型輸出效果,提升業(yè)務(wù)場(chǎng)景下的智能交互體驗(yàn); 2、基于LangChain框架搭建RAG系統(tǒng)、智能體(Agent)等應(yīng)用,完成文檔檢索、多模態(tài)交互、流程自動(dòng)化等功能; 3、完成開(kāi)源/閉源大模型的選型、對(duì)接、調(diào)優(yōu)與部署,解決模型調(diào)用中的性能、成本、穩(wěn)定性問(wèn)題; 4、沉淀提示詞模板、LangChain組件封裝、模型調(diào)優(yōu)的標(biāo)準(zhǔn)化方案,形成技術(shù)文檔與最佳實(shí)踐; 5、與業(yè)務(wù)側(cè)協(xié)作,理解需求并轉(zhuǎn)化為技術(shù)方案,推動(dòng)大模型應(yīng)用在實(shí)際業(yè)務(wù)中落地; 6、AI自動(dòng)化新方向的探索和推進(jìn),給自動(dòng)化測(cè)試賦能。