職位描述
崗位職責(zé):1、負(fù)責(zé)芯片異構(gòu)計(jì)算大模型相關(guān)算子、框架的開(kāi)發(fā)與優(yōu)化;2、負(fù)責(zé)分析定位系統(tǒng)性能瓶頸,針對(duì)特定AI芯片做高性能計(jì)算加速和優(yōu)化;3、針對(duì)特定GPU架構(gòu),開(kāi)展調(diào)優(yōu)工作,確保產(chǎn)品在性能和功耗上的優(yōu)勢(shì);4、負(fù)責(zé)優(yōu)化大模型推理效率和性能提升;崗位要求:1、碩士以上學(xué)歷,計(jì)算機(jī)、自動(dòng)化、通信等相關(guān)專業(yè);2、熟悉系統(tǒng)性能調(diào)優(yōu)的方法,熟練掌握CUDA語(yǔ)言,具備GPU算子開(kāi)發(fā)能力;3、熟悉GPU、NPU等算子底層細(xì)節(jié)、具備大模型算子優(yōu)化經(jīng)驗(yàn)(矩陣計(jì)算庫(kù)、Attention算子、訪存瓶頸算子、融合算子)等;4、有常用大模型推理框架的設(shè)計(jì)與實(shí)現(xiàn)經(jīng)驗(yàn),例如:vllm、SGLang、TensorRT-llm等;
企業(yè)介紹
中國(guó)電信人工智能研究院(TeleAI)由人工智能科學(xué)家、中國(guó)電信集團(tuán)CTO及首席科學(xué)家李學(xué)龍教授牽頭組建,面向國(guó)家戰(zhàn)略需求和人工智能發(fā)展趨勢(shì),結(jié)合中國(guó)電信在算力、數(shù)據(jù)、應(yīng)用場(chǎng)景及5G/6G通信等多方面的優(yōu)勢(shì),圍繞大模型、具身智能、AIGC、AI平臺(tái)設(shè)施等方向開(kāi)展基礎(chǔ)研究、技術(shù)攻關(guān)和應(yīng)用落地。