
Algorithm Powers Innovation
算法驅(qū)動(dòng)創(chuàng)新

Algorithm Powers Innovation
算法驅(qū)動(dòng)創(chuàng)新
實(shí)習(xí)生招聘
華為云業(yè)務(wù)快速增長(zhǎng),算法需求不斷增加,特開放以下崗位,歡迎有識(shí)之士加入算法創(chuàng)新Lab。
有意向的同學(xué)請(qǐng)發(fā)送簡(jiǎn)歷到招聘郵箱AlgInnovLab@huawei.com,我們將盡快聯(lián)系您。
崗位
工作地點(diǎn)
工作職責(zé)
技能要求
備注
昇騰算子實(shí)習(xí)生
上海、西安、深圳、北京
1. 充分利用NPU硬件結(jié)構(gòu)設(shè)計(jì)以及網(wǎng)絡(luò)模型結(jié)構(gòu),使用多核流水并行、內(nèi)存管理優(yōu)化、算子融合等關(guān)鍵技術(shù),構(gòu)建高性能、低時(shí)延、低消耗cube、vector基礎(chǔ)&融合算子,使能大模型性能提升
2. 參與面向下一代算子相關(guān)自動(dòng)化工具、自動(dòng)化平臺(tái)等設(shè)計(jì)與開發(fā)。
1、即將取得計(jì)算機(jī)、軟件、電子信息類等相關(guān)專業(yè)本科及以上學(xué)歷,編程基礎(chǔ)扎實(shí)。????????????????????????
2. 具有C/C++編程經(jīng)驗(yàn)。
2. 了解AI網(wǎng)絡(luò)模型和AI算子基礎(chǔ)知識(shí),如Flashattention、AllToAll、融合算子、量化算子等。
3. 了解昇騰AI處理器基礎(chǔ)知識(shí)。
4. 工作認(rèn)真負(fù)責(zé)。有偏硬件特別是芯片的編程經(jīng)驗(yàn)者優(yōu)先。
相關(guān)項(xiàng)目:
大模型訓(xùn)練實(shí)習(xí)生
上海、西安、深圳、北京
1.探索新型大模型架構(gòu)及其預(yù)訓(xùn)練、后訓(xùn)練、模型微調(diào)等技術(shù),提升大模型在復(fù)雜場(chǎng)景下的泛化能力和訓(xùn)練性能。
2.優(yōu)化訓(xùn)練吞吐量,通過并行策略、算子融合、通信優(yōu)化、計(jì)算-通信重疊、顯存優(yōu)化等方法提升集群利用率,加快模型吞吐,降低訓(xùn)練成本。
3.持續(xù)跟蹤如MoE架構(gòu)、長(zhǎng)序列、混合精度訓(xùn)練等前沿方向,輸出新算法洞察與創(chuàng)新IDEA。
1、即將取得計(jì)算機(jī)、軟件、人工智能等相關(guān)專業(yè)本科及以上學(xué)歷,編程基礎(chǔ)扎實(shí)。
2、熟悉常見的AI網(wǎng)絡(luò)模型結(jié)構(gòu)、如Deepseek,Transformer底層原理。
3、熟悉常用的深度學(xué)習(xí)框架,如Pytorch/DeepSpeed/Megatron/Colossal-AI等分布式框架者優(yōu)先,有實(shí)際大模型、AIGC模型落地經(jīng)驗(yàn)者優(yōu)先。
4、有良好的學(xué)習(xí)能力和英文文獻(xiàn)閱讀能力,能夠與團(tuán)隊(duì)良好合作溝通,工作積極主動(dòng)。
相關(guān)項(xiàng)目:
大模型推理實(shí)習(xí)生??
上海、西安、深圳、北京
1. 參與全場(chǎng)景AI推理框架的架構(gòu)設(shè)計(jì)、技術(shù)選型、關(guān)鍵技術(shù)研究及核心代碼開發(fā)工作
2. 參與并行分布式策略、高性能算子、小型化工具(量化、稀疏、剪枝)、高性能代碼自動(dòng)生成相關(guān)設(shè)計(jì)與開發(fā)工作,提升模型壓縮與推理性能
3. 參與分布式推理、異構(gòu)并行推理的設(shè)計(jì)和調(diào)優(yōu)、開發(fā),實(shí)現(xiàn)大模型推理的性能和擴(kuò)展性領(lǐng)先和項(xiàng)目落地
1、即將取得計(jì)算機(jī)、軟件等相關(guān)專業(yè)本科及以上學(xué)歷,編程基礎(chǔ)扎實(shí)。????????????????????????????????????????
2、掌握常用的深度學(xué)習(xí)框架,如Pytorch、MindSpore、Tensorflow等優(yōu)先,有CV/NLP/機(jī)器學(xué)習(xí)等落地經(jīng)驗(yàn)者優(yōu)先。
3、掌握Python/C/C++/Java/Go任意一種編程語言,熟悉分布式、微服務(wù)、數(shù)據(jù)庫(kù)等技術(shù)。
4、掌握LLM、AIGC相關(guān)落地經(jīng)驗(yàn)、有大模型部署、推理、微調(diào)、增訓(xùn)、評(píng)測(cè)、量化等經(jīng)驗(yàn),熟悉vllm/TGI者優(yōu)先。
5、熟悉deepspeed/tensor-llm/ascendspeed等加速庫(kù)者優(yōu)先。
6. 有良好的學(xué)習(xí)能力和英文文獻(xiàn)閱讀能力,能夠與團(tuán)隊(duì)良好合作溝通,工作積極主動(dòng)。
相關(guān)項(xiàng)目:
軟件研發(fā)實(shí)習(xí)生
上海、西安、深圳、北京
1、分布式訓(xùn)練框架開發(fā):設(shè)計(jì)基于GPU/NPU集群的大規(guī)模并行訓(xùn)練架構(gòu),優(yōu)化數(shù)據(jù)/模型/流水線并行策略,實(shí)現(xiàn)千卡級(jí)資源利用率突破(如Horovod/DeepSpeed深度定制)。
2、高性能計(jì)算優(yōu)化:開發(fā)算子級(jí)加速庫(kù)(CUDA/TensorRT),突破內(nèi)存墻/通信瓶頸,針對(duì)LLM/Vision模型優(yōu)化計(jì)算圖編譯與顯存復(fù)用策略。
3、推理引擎架構(gòu)設(shè)計(jì):構(gòu)建低延遲服務(wù)框架,實(shí)現(xiàn)動(dòng)態(tài)批處理、模型切片、量化蒸餾等生產(chǎn)級(jí)部署方案,支持萬億參數(shù)模型毫秒級(jí)響應(yīng)。
1、即將取得計(jì)算機(jī)、軟件等相關(guān)專業(yè)本科及以上學(xué)歷,編程基礎(chǔ)扎實(shí)。????????????????????????
2、熟練掌握java/python/C/go等編程語言一種或多種,理解并熟練應(yīng)用常見設(shè)計(jì)模式。
3、 有分布式訓(xùn)練框架,推理引擎框架設(shè)計(jì)開發(fā)經(jīng)驗(yàn)者優(yōu)先。
4、對(duì)開源社區(qū)廣泛運(yùn)用的軟件源碼熟悉,或有貢獻(xiàn)者優(yōu)先。
5、ICPC/CCPC競(jìng)賽獲獎(jiǎng)?wù)?,或熟悉AI算法,或熟悉運(yùn)籌優(yōu)化算法等優(yōu)先。
AI算法實(shí)習(xí)生??
上海、西安、深圳、北京
1、 通過算法技術(shù)創(chuàng)新,不斷突破業(yè)界領(lǐng)先指標(biāo),協(xié)同軟件技術(shù)創(chuàng)新,構(gòu)筑算法競(jìng)爭(zhēng)力。
2、 持續(xù)輸出新算法洞察,創(chuàng)新IDEA,領(lǐng)先算法設(shè)計(jì),突破性算法技術(shù),Clean Code高質(zhì)量代碼等。
3、算法技術(shù)創(chuàng)新領(lǐng)域包括計(jì)算機(jī)算法與數(shù)據(jù)結(jié)構(gòu)、大模型設(shè)計(jì)、大模型訓(xùn)練推理、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、存儲(chǔ)算法等,通過算法解決云服務(wù)分布式大規(guī)模場(chǎng)景下的各種挑戰(zhàn)。并能與軟件引擎融合創(chuàng)新,構(gòu)筑競(jìng)爭(zhēng)力。
1、即將取得計(jì)算機(jī)、應(yīng)用數(shù)學(xué)、統(tǒng)計(jì)、人工智能等相關(guān)專業(yè)本科及以上學(xué)歷。
2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。
3、精通如下一種或幾種技能,機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)、壓縮算法、緩存算法、組合優(yōu)化、整數(shù)/線性規(guī)劃等。
4、ICPC/CCPC/數(shù)模競(jìng)賽等獲獎(jiǎng)?wù)邇?yōu)先,有相關(guān)專利和學(xué)術(shù)期刊或會(huì)議論文發(fā)表者優(yōu)先。
AI Agent研發(fā)實(shí)習(xí)生
上海、西安、深圳、北京
1、復(fù)雜決策算法設(shè)計(jì):構(gòu)建基于強(qiáng)化學(xué)習(xí)、規(guī)劃推理的多模態(tài)Agent框架,解決動(dòng)態(tài)環(huán)境中的長(zhǎng)周期任務(wù)分解與協(xié)同優(yōu)化問題,需平衡實(shí)時(shí)性與泛化性。
2、系統(tǒng)工程化落地:實(shí)現(xiàn)大規(guī)模訓(xùn)練/推理框架的高效部署,解決多模塊(感知、決策、執(zhí)行)的端到端協(xié)同及資源調(diào)度瓶頸,保障低延遲、高可靠生產(chǎn)級(jí)運(yùn)行。
3、未知場(chǎng)景泛化突破:通過元學(xué)習(xí)、因果推理等技術(shù)提升Agent對(duì)未見過業(yè)務(wù)場(chǎng)景的快速適應(yīng)能力,突破數(shù)據(jù)/規(guī)則邊界,需融合領(lǐng)域知識(shí)建模與零樣本遷移技術(shù)。
1、即將取得計(jì)算機(jī)、應(yīng)用數(shù)學(xué)、統(tǒng)計(jì)、人工智能等相關(guān)專業(yè)本科及以上學(xué)歷。
2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。
3、熟悉掌握業(yè)界AIAgent的開發(fā)框架,如LangChain, llamaindex,AutoGen, QwenAgent等其中一種或多種。
相關(guān)項(xiàng)目:
1、AI智能體
AI編譯器研發(fā)實(shí)習(xí)生
上海、西安、深圳、北京
1、參與AI編譯器的設(shè)計(jì)與開發(fā),優(yōu)化AI模型在昇騰硬件的編譯與部署效率。
2、研究LLVM、MLIR等編譯器框架,構(gòu)建高性能算子自動(dòng)生成、圖優(yōu)化、內(nèi)存優(yōu)化等技術(shù)方案
3、與算法團(tuán)隊(duì)合作設(shè)計(jì)編譯友好的大模型架構(gòu),推動(dòng)MoE、混合精度訓(xùn)練等技術(shù)的編譯器級(jí)支持
4、探索AI與編譯技術(shù)的結(jié)合方向(如自動(dòng)并行化、動(dòng)態(tài)shape優(yōu)化、稀疏計(jì)算加速等)
1、即將取得計(jì)算機(jī)/人工智能/電子工程/數(shù)學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷。
2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。
3、深入理解大模型技術(shù)棧(Megatron/DeepSpeed/ColossalAI),熟悉LLM訓(xùn)練/推理的顯存與算力瓶頸。
4、熟悉GPU/昇騰NPU結(jié)構(gòu),了解LLVM/MLIR/TVM/Triton等AI編譯器經(jīng)驗(yàn)者優(yōu)先。