職位描述
崗位職責(zé):1、負(fù)責(zé)開發(fā)和優(yōu)化大模型的AI推理效率,通過算子切片、內(nèi)存優(yōu)化、GPU并行計算特性、分布式集群推理等高性能優(yōu)化技術(shù)打造高性能大模型AI推理引擎;2、負(fù)責(zé)將多模態(tài)大模型在Nvidia平臺/國產(chǎn)GPU平臺優(yōu)化與部署,支撐公司AI方向核心業(yè)務(wù)的發(fā)展;3、設(shè)計并實現(xiàn)包括算子融合、模型量化、模型壓縮、蒸餾等在內(nèi)的推理引擎優(yōu)化技術(shù);4、負(fù)責(zé)大規(guī)模深度學(xué)習(xí)推理框架的研發(fā)與優(yōu)化;5、參與針對大模型的訓(xùn)練與推理加速、模型服務(wù)化、GPU資源調(diào)度等功能的研發(fā);6、協(xié)同上下游團(tuán)隊,分析并解決模型中遇到的大模型訓(xùn)練、推理的精度和性能問題,提出性能優(yōu)化策略達(dá)成性能目標(biāo)。任職資格:1、計算機(jī)相關(guān)專業(yè)本科以上學(xué)歷,5年以上Linux C++開發(fā)經(jīng)驗,熟悉C++/Python編程,具備扎實的算法和數(shù)據(jù)結(jié)構(gòu)功底2、了解CPU/GPU架構(gòu)與工作原理,熟悉LLM算法算子計算原理,熟悉CUDA編程并有相關(guān)開發(fā)經(jīng)驗;3、了解AI加速技術(shù),包括但不限于TensorRT/TVM等,熟悉模型壓縮、模型量化等技術(shù);4、具有推理加速相關(guān),精度、速度,調(diào)優(yōu)分析工具鏈的開發(fā)經(jīng)驗;5.、熟悉GPT/transformer結(jié)構(gòu)的深度優(yōu)化方法和深度學(xué)習(xí)量化優(yōu)化實現(xiàn);6、良好的團(tuán)隊溝通能力、技術(shù)攻關(guān)能力,責(zé)任心強(qiáng),具備一定抗壓能力。
企業(yè)介紹
暗物智能科技(以下簡稱“暗物智能”)創(chuàng)辦于2017年,公司匯聚國內(nèi)外人工智能專家與多元化人才管理團(tuán)隊,致力于打造新一代強(qiáng)認(rèn)知人工智能技術(shù)平臺,服務(wù)國家戰(zhàn)略,提升人類福祉。依托于顛覆性的"小數(shù)據(jù)、大任務(wù)"創(chuàng)新研究范式,公司以強(qiáng)認(rèn)知人工智能核心技術(shù)為主攻方向,致力于構(gòu)筑以場景認(rèn)知理解、多模態(tài)人機(jī)交互、認(rèn)知智能決策等為核心技術(shù)優(yōu)勢的強(qiáng)認(rèn)知人工智能技術(shù)平臺,深度賦能智慧城市、智慧商業(yè)、素質(zhì)教育等國計民生領(lǐng)域。公司自成立以來屢獲殊榮,先后斬獲德勤中國明日之星、廣州“未來獨角獸”創(chuàng)新企業(yè)、國家高新技術(shù)企業(yè)、中國產(chǎn)學(xué)研合作創(chuàng)新示范企業(yè)等行業(yè)殊榮。暗物智能作為強(qiáng)認(rèn)知人工智能科技的重要實踐載體,堅持原創(chuàng)科技與市場需求雙輪驅(qū)動,未來將持續(xù)依托與各省市政府、專業(yè)學(xué)術(shù)機(jī)構(gòu)、知名科研院所、產(chǎn)業(yè)龍頭企業(yè)等機(jī)構(gòu)的合作勢能,構(gòu)建融通學(xué)、研、產(chǎn)、用的新型創(chuàng)新鏈,深度賦能產(chǎn)業(yè)轉(zhuǎn)型升級與智能社會治理。