職位描述
職責(zé)描述:1.主導(dǎo)設(shè)計高性能、低延遲的異構(gòu)編程模型(如類CUDA/OpenCL的指令集、內(nèi)存模型、任務(wù)調(diào)度機制)及配套Runtime系統(tǒng)。優(yōu)化硬件與軟件協(xié)同設(shè)計,確保編程模型在GPGPU、AI加速器等異構(gòu)硬件上的高效執(zhí)行。2.構(gòu)建核心Runtime組件(任務(wù)調(diào)度器、設(shè)備管理、內(nèi)存分配、跨設(shè)備通信、異常處理等),解決多級流水線、低開銷上下文切換、異構(gòu)同步等系統(tǒng)級問題。3.開發(fā)設(shè)計Profiling工具鏈,定位內(nèi)核執(zhí)行熱點,提出架構(gòu)級改進方案4.與硬件團隊合作定義計算單元架構(gòu),驅(qū)動ISA(指令集架構(gòu))設(shè)計;與算法團隊合作優(yōu)化計算庫(如BLAS、FFT)的硬件加速策略。任職要求:1. 計算機科學(xué)、電子工程、數(shù)學(xué)等相關(guān)專業(yè)碩士及以上學(xué)歷,8年以上系統(tǒng)級軟件開發(fā)經(jīng)驗,其中至少5年專注異構(gòu)計算領(lǐng)域。2. 精通CUDA/ROCm/OpenCL等主流異構(gòu)編程模型,深入理解其Runtime實現(xiàn)原理(如CUDA Driver API、HIP Runtime、OpenCL任務(wù)調(diào)度)。3. 對現(xiàn)代GPGPU架構(gòu)(如NVIDIA Ampere/AMD CDNA)有深入研究,熟悉SIMT執(zhí)行模型、層級內(nèi)存體系、硬件調(diào)度隊列等核心機制。4. 具備構(gòu)建復(fù)雜系統(tǒng)的能力,熟練掌握C/C++/Rust,精通Linux內(nèi)核模塊、DMA、PCIe通信等底層開發(fā)技術(shù)。加分項:參與過國際開源異構(gòu)計算項目(如PyTorch/XLA、TVM、Vulkan計算管線)并貢獻(xiàn)核心代碼。有GPGPU/FPGA/ASIC等芯片廠商底層工具鏈開發(fā)經(jīng)驗,熟悉指令集模擬器(ISS)或性能建模工具。發(fā)表過體系結(jié)構(gòu)頂會(ISCA、MICRO、HPCA)論文或持有相關(guān)專利。
企業(yè)介紹
曙光信息產(chǎn)業(yè)股份有限公司(以下簡稱“中科曙光”)作為我國核心信息基礎(chǔ)設(shè)施企業(yè),為中國及全球用戶提供創(chuàng)新、高效、可靠的IT產(chǎn)品、解決方案及服務(wù)。 公司于2014年在上海證券交易所上市(股票代碼:603019)。經(jīng)歷20余年發(fā)展,中科曙光在高端計算、存儲、安全、數(shù)據(jù)中心等領(lǐng)域擁有深厚的技術(shù)積淀和市場份額,并充分發(fā)揮高端計算優(yōu)勢,布局智能計算、云計算、大數(shù)據(jù)等領(lǐng)域的技術(shù)研發(fā),打造計算產(chǎn)業(yè)生態(tài),為科研探索創(chuàng)新、行業(yè)信息化建設(shè)、產(chǎn)業(yè)轉(zhuǎn)型升級、數(shù)字經(jīng)濟發(fā)展提供了堅實可信的支撐。 中科曙光在全國各省、自治區(qū)和直轄市均設(shè)立了分支機構(gòu),擁有國際的3大智能制造生產(chǎn)基地、5大研發(fā)中心,在全國50多個城市部署了城市云計算中心。 作為以技術(shù)創(chuàng)新為基因的科技企業(yè),中科曙光未來將持續(xù)專注于核心技術(shù)研發(fā),并與用戶、合作伙伴攜手共建應(yīng)用生態(tài)、推動產(chǎn)業(yè)進步,以科技創(chuàng)新助力“數(shù)字中國”建設(shè),驅(qū)動經(jīng)濟高質(zhì)量發(fā)展。