職位描述
主要職責(zé)1.【模型戰(zhàn)略規(guī)劃】: 負(fù)責(zé)垂直大模型整體技術(shù)方向與發(fā)展戰(zhàn)略制定,依據(jù)行業(yè)趨勢(shì)與公司業(yè)務(wù)需求,規(guī)劃模型的長期發(fā)展路線,確保模型保持競(jìng)爭(zhēng)力并貼合業(yè)務(wù)實(shí)際。2.【技術(shù)體系搭建】:全面負(fù)責(zé)搭建涵蓋數(shù)據(jù)處理、模型訓(xùn)練、部署及優(yōu)化的完整技術(shù)體系3.【模型研發(fā)推進(jìn)】:帶領(lǐng)團(tuán)隊(duì)開展模型研發(fā)工作,監(jiān)督從數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練到評(píng)估優(yōu)化的全流程。4.【模型部署與維護(hù)】與工程團(tuán)隊(duì)緊密合作,負(fù)責(zé)將訓(xùn)練好的垂直大模型部署到生產(chǎn)環(huán)境中,確保模型能夠穩(wěn)定、高效地運(yùn)行。5.【前沿技術(shù)探索】關(guān)注模型壓縮、安全隱私保護(hù)等新技術(shù),優(yōu)化模型性能,降低成本,增強(qiáng)模型安全性與隱私保護(hù)能力,提升公司在國際供應(yīng)鏈大模型領(lǐng)域的技術(shù)競(jìng)爭(zhēng)力。任職要求:1. 計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等相關(guān)專業(yè),碩士及以上學(xué)歷。2. 具有5年以上深度學(xué)習(xí)、機(jī)器學(xué)習(xí)相關(guān)技術(shù)研發(fā)經(jīng)驗(yàn),其中3 年以上大模型項(xiàng)目開發(fā)經(jīng)驗(yàn),有成功的大模型落地案例。3. 精通 Python、TensorFlow 或 PyTorch 等主流深度學(xué)習(xí)框架,熟悉常用的機(jī)器學(xué)習(xí)算法,如線性回歸、決策樹、神經(jīng)網(wǎng)絡(luò)等,能夠熟練運(yùn)用其進(jìn)行模型開發(fā)與優(yōu)化。4. 深入理解 Transformer 架構(gòu)及其變體,掌握模型訓(xùn)練過程中的超參數(shù)調(diào)整、分布式訓(xùn)練等技術(shù),具備解決復(fù)雜模型訓(xùn)練問題的能力。5. 熟練掌握模型微調(diào)、后訓(xùn)練等相關(guān)技術(shù),在實(shí)際項(xiàng)目中成功應(yīng)用并取得顯著成果。6. 了解模型部署相關(guān)技術(shù),如容器化技術(shù)(Docker、Kubernetes)、云計(jì)算平臺(tái)(AWS、Azure、阿里云等),能夠?qū)⒛P透咝Р渴鸬缴a(chǎn)環(huán)境中,并進(jìn)行性能監(jiān)控與優(yōu)化
企業(yè)介紹
1、團(tuán)隊(duì):核心成員組成阿里,華為,百度
2、產(chǎn)品:輿情監(jiān)測(cè)方向
3、上??偛?,武漢研發(fā)中心,北京分公司下半年
4、上海辦公地點(diǎn):上海市靜安區(qū)彭江路大寧易園