亚洲农村老熟妇肥BBBB_无码人妻精品一区二区蜜桃色_精品亚洲AⅤ无码午夜在线观看_中文字幕熟妇人妻在线视频_囯产色无码精品视频免费

當(dāng)前位置: 首頁(yè) > 科技新聞 >

值得一提的是,MindSpore 預(yù)計(jì)將在 2020 年 Q1 開源

時(shí)間:2020-02-07 15:32來源:網(wǎng)絡(luò)整理 瀏覽:
隨著社會(huì)的發(fā)展,科技的進(jìn)步,5G 落地、AI 爆發(fā)、大數(shù)據(jù)持續(xù)突破、云計(jì)算已然成為新時(shí)代的水電煤。日益增多的新興技術(shù),為開發(fā)者帶來機(jī)遇的同時(shí)

隨著社會(huì)的發(fā)展,科技的進(jìn)步,5G 落地、AI 爆發(fā)、大數(shù)據(jù)持續(xù)突破、云計(jì)算已然成為新時(shí)代的水電煤。日益增多的新興技術(shù),為開發(fā)者帶來機(jī)遇的同時(shí)也帶來了不少挑戰(zhàn)。盡管開發(fā)者們經(jīng)常身處歷史性事件的前沿,但由于很多技術(shù)學(xué)習(xí)門檻較高,且沒有相對(duì)完整的配套技術(shù)生態(tài),開發(fā)者們其實(shí)很難時(shí)刻保持良好的學(xué)習(xí)曲線。

在簡(jiǎn)化開發(fā)、降低技術(shù)門檻、提高研發(fā)效率等方面,華為每年投入大量的資金和人力,而小編將為大家介紹的這十大硬核技術(shù),正是華為加速技術(shù)發(fā)展、構(gòu)建產(chǎn)業(yè)生態(tài)的助燃劑。

在小編看來,作為開發(fā)者,了解學(xué)習(xí)到這 TOP 10 技術(shù),不僅可以了解技術(shù)產(chǎn)業(yè)前沿趨勢(shì),也是為未來職業(yè)生涯發(fā)展打基礎(chǔ)。因?yàn)榧夹g(shù)隱藏在產(chǎn)品之后,看不見摸不著,開發(fā)者們也可以先行體驗(yàn)華為承接的系列核心產(chǎn)品,感受強(qiáng)大技術(shù)背后的黑科技力量。

TOP 1 達(dá)芬奇架構(gòu)

毋庸置疑,AI 技術(shù)正成為各行業(yè)數(shù)字化轉(zhuǎn)型的發(fā)動(dòng)機(jī),大到智慧城市,小到 IoT 等,都少不了 AI 的身影。那么多的應(yīng)用場(chǎng)景,如何才能實(shí)現(xiàn) AI 在多平臺(tái)、多場(chǎng)景之間的協(xié)同?

華為用達(dá)芬奇架構(gòu)給出了答案。作為華為自研的面向 AI 計(jì)算特征的全新計(jì)算架構(gòu),達(dá)芬奇架構(gòu)具備高算力、高能效、靈活可裁剪的特性。

具體說來,達(dá)芬奇架構(gòu)采用 3D Cube 針對(duì)矩陣運(yùn)算做加速,大幅提升了單位功耗下的 AI 算力,同時(shí)還集成了向量、標(biāo)量、硬件加速器等多種計(jì)算單元,輔以最小的計(jì)算代價(jià)增加矩陣乘的算力,來提升 AI 計(jì)算的完備性和不同場(chǎng)景的 AI 能效。

(3D Cube)

而靈活可裁剪的特性則讓達(dá)芬奇架構(gòu)能夠滿足端側(cè)、邊緣側(cè)及云端的應(yīng)用場(chǎng)景,可用于小到幾十毫瓦,大到幾百瓦的訓(xùn)練場(chǎng)景,解鎖 AI 的無限可能。

以華為昇騰處理器為例,昇騰系列處理器就采用了統(tǒng)一的、可擴(kuò)展的達(dá)芬奇架構(gòu),是全球第一個(gè)覆蓋全場(chǎng)景的人工智能芯片系列,無論在低功耗的邊緣場(chǎng)景,還是大算力的數(shù)據(jù)中心場(chǎng)景,昇騰系列都將提供出色的性能和能效比。

此前,華為推出的目前業(yè)界單芯片計(jì)算密度最大的處理器昇騰 910 就可應(yīng)用于自動(dòng)駕駛、平安城市、智能制造、運(yùn)營(yíng)商、金融等應(yīng)用場(chǎng)景。

(昇騰 910 處理器)

不僅如此,華為還基于達(dá)芬奇架構(gòu)提供了高性能的人工智能計(jì)算平臺(tái) Atlas。通過 Atlas 200 DK AI 開發(fā)者套件,開發(fā)者可以在 30 分鐘內(nèi)完成開發(fā)環(huán)境搭建,內(nèi)置的圖形化編程環(huán)境,將極大地提升開發(fā)效率。并且,得益于昇騰處理器的全棧全場(chǎng)景能力,基于開發(fā)者套件開發(fā)的程序只需一次開發(fā),即可實(shí)現(xiàn)端、邊、云全場(chǎng)景部署。

依托采用達(dá)芬奇架構(gòu)的華為昇騰系列 AI 芯片提供的超強(qiáng)算力和全場(chǎng)景需求覆蓋,Atlas 已實(shí)現(xiàn)算力、邊界兩大突破??梢哉f,達(dá)芬奇架構(gòu)滿足了人工智能領(lǐng)域?qū)Ω咚懔偷凸牡男枨?是專為人工智能算力需求而設(shè)計(jì)的芯片架構(gòu)。

由此可以說,達(dá)芬奇架構(gòu)是華為面向開發(fā)者的十大“嚇人技術(shù)”的當(dāng)之無愧的 TOP1。

TOP 2 A-Tune 智能調(diào)優(yōu)技術(shù)

對(duì)開發(fā)者來說,要想軟件獲得更好的體驗(yàn),手動(dòng)調(diào)優(yōu)是個(gè)必不可少的過程。不過現(xiàn)在計(jì)算機(jī)硬件結(jié)構(gòu)越來越復(fù)雜,豐富多樣的應(yīng)用對(duì)資源的需求也各不相同,這也導(dǎo)致調(diào)優(yōu)過程異常復(fù)雜。

為了減少開發(fā)者在軟件調(diào)優(yōu)上消耗的時(shí)間,華為 A-Tune 智能調(diào)優(yōu)技術(shù),可以在程序運(yùn)行中實(shí)時(shí)感知應(yīng)用的運(yùn)行特征,使系統(tǒng)主動(dòng)調(diào)整底層資源;還可以通過學(xué)習(xí)引擎對(duì)特征進(jìn)行建模,根據(jù)業(yè)務(wù)負(fù)載去匹配最佳資源模型,通過負(fù)反饋持續(xù)優(yōu)化。

簡(jiǎn)而言之,A-Tune 技術(shù)相當(dāng)于在現(xiàn)有系統(tǒng)上加裝了大腦,讓系統(tǒng)“懂”業(yè)務(wù)場(chǎng)景,給出最合適的資源模型,使得系統(tǒng)運(yùn)行更加智能,達(dá)到應(yīng)用性能加速的目的。

由于不必考慮硬件和系統(tǒng)的底層細(xì)節(jié),即使是入門開發(fā)者,也能達(dá)到調(diào)優(yōu)效果,高階開發(fā)者更可針對(duì)具體的業(yè)務(wù)場(chǎng)景進(jìn)行定制,實(shí)現(xiàn)更細(xì)粒度的調(diào)優(yōu)。通過將應(yīng)用 & 系統(tǒng)性能做到最優(yōu),A-Tune 技術(shù)可以從總體上降低成本。比如,以前你可能需要購(gòu)買 10 臺(tái)服務(wù)器才能完成的工作,現(xiàn)在可能需要 7-8 臺(tái)服務(wù)器就能實(shí)現(xiàn)。

目前,基于 A-Tune 技術(shù)構(gòu)建的華為自研操作系統(tǒng) openEuler,就體現(xiàn)出了高安全性、高可擴(kuò)展性、高性能等優(yōu)勢(shì)特點(diǎn)。首先,openEuler 能夠以加固策略、內(nèi)核級(jí) OS 安全能力、及多款安全漏掃工具等有效防止入侵,保障系統(tǒng)安全。

同時(shí),openEuler 能夠向用戶提供服務(wù)保障體系,保證超長(zhǎng)期的可靠性和穩(wěn)定性。另外,openEuler 在編譯系統(tǒng)、虛擬存儲(chǔ)系統(tǒng)、CPU 調(diào)度、IO 驅(qū)動(dòng)、網(wǎng)絡(luò)和文件系統(tǒng)等方面也做了大量的優(yōu)化。作為高性能的操作系統(tǒng)平臺(tái),openEuler 能夠滿足客戶從傳統(tǒng) IT 基礎(chǔ)設(shè)施到云計(jì)算服務(wù)的各種需求。

如此友好的技術(shù),排在 TOP 2 也是當(dāng)之無愧的吧。

TOP 3 S2S 自動(dòng)微分

第三個(gè)技術(shù)我們來說說自動(dòng)微分。

資深的深度學(xué)習(xí)開發(fā)者應(yīng)該都體會(huì)過手動(dòng)求解的痛苦,不僅求導(dǎo)過程復(fù)雜,結(jié)果還很容易出錯(cuò),好在現(xiàn)在有深度學(xué)習(xí)框架,可以利用自動(dòng)微分技術(shù)輕松解決這個(gè)復(fù)雜又關(guān)鍵的過程。

我們都知道,深度學(xué)習(xí)框架的自動(dòng)微分根據(jù)實(shí)現(xiàn)原理的不同,分為以 Google 的 TensorFlow 為代表的圖方法,以 Facebook 的 PyTorch 為代表的運(yùn)算符重載,以及以華為自研的 MindSpore 為代表的源碼轉(zhuǎn)化方法(Source To Source,S2S)。

(自動(dòng)微分)

前不久,華為剛發(fā)布了自研的全場(chǎng)景 AI 計(jì)算框架 MindSpore,而在 MindSpore 中的自動(dòng)微分就采用了 S2S 形式。在性能和可編程性上,S2S 自動(dòng)微分顯著優(yōu)于業(yè)界圖和運(yùn)算符重載方式,開發(fā)者無需重新學(xué)習(xí)一套新的表達(dá)邏輯(圖邏輯),用原生 Python 就能實(shí)現(xiàn) AI 算法。

同時(shí),S2S 自動(dòng)微分能夠?qū)崿F(xiàn)任意算子的微分表達(dá)和編譯優(yōu)化,同時(shí)實(shí)現(xiàn)反向算子自動(dòng)生成,極大地方便模型開發(fā),為開發(fā)者的代碼帶來更佳性能。在軟件硬件協(xié)同方面,支持自動(dòng)優(yōu)化,無需像其他兩種方式需要手動(dòng)定制。

此外,S2S 自動(dòng)微分還有著豐富的調(diào)試手段。開發(fā)者可以使用可視化接口,方便觀察程序運(yùn)行時(shí)的狀態(tài),同時(shí)支持動(dòng)態(tài)執(zhí)行,幫助開發(fā)者在程序運(yùn)行時(shí)進(jìn)行代碼調(diào)試。

基于此項(xiàng)技術(shù),華為 MindSpore 不僅可以支持端、邊、云獨(dú)立的和協(xié)同的統(tǒng)一訓(xùn)練和推理,同時(shí)支持華為提出的全場(chǎng)景。通過這款完整的軟件堆棧,華為正在實(shí)現(xiàn)一次性算子開發(fā)、一致的開發(fā)和調(diào)試體驗(yàn),以此幫助開發(fā)者實(shí)現(xiàn)一次性開發(fā),應(yīng)用在所有設(shè)備端、邊緣及云端平滑遷移的能力。

值得一提的是,MindSpore 預(yù)計(jì)將在 2020 年 Q1 開源。

TOP 4 分布式深度學(xué)習(xí)技術(shù)

通常,深度學(xué)習(xí)訓(xùn)練過程涉及大規(guī)模參數(shù)的網(wǎng)絡(luò)間傳遞。TensorFlow 使用中心化的網(wǎng)絡(luò)參數(shù)服務(wù)器(Parameter Server)來承擔(dān)梯度的收集、平均和分發(fā)工作,對(duì) server 節(jié)點(diǎn)的訪問會(huì)成為瓶頸,帶寬利用率低。

為了提高深度學(xué)習(xí)訓(xùn)練效率,華為采用了 AllReduce 算法進(jìn)行梯度聚合來優(yōu)化帶寬,這樣可以同時(shí)利用多個(gè)工作節(jié)點(diǎn),分布式地、高效地訓(xùn)練出性能優(yōu)良的神經(jīng)網(wǎng)絡(luò)模型。

同時(shí)對(duì)傳輸?shù)奶荻冗M(jìn)行融合,對(duì)小于閾值大小的梯度多次傳輸合并為一次,提升帶寬利用率;另外在通信底層采用 NVIDIA 的 NvLink、P2P 等技術(shù)來提升節(jié)點(diǎn)內(nèi)和節(jié)點(diǎn)間通信帶寬,降低通信時(shí)延。

一般情況下,在衡量分布式深度學(xué)習(xí)的加速性能時(shí),主要有吞吐量和收斂時(shí)間兩個(gè)重要指標(biāo)。而對(duì)開發(fā)者而言,最關(guān)心的指標(biāo)也是收斂時(shí)間。內(nèi)置的分布式深度學(xué)習(xí)技術(shù)使得華為云 ModelArts 訓(xùn)練速度有了很大的提升,同時(shí)以全棧優(yōu)化極大地縮短了訓(xùn)練收斂時(shí)間。2019 年 5 月在斯坦福大學(xué) DAWNBench 榜單中,華為云 ModelArts 就以 2 分 43 秒的成績(jī)獲得圖像識(shí)別訓(xùn)練世界第一。

責(zé)任編輯:

推薦內(nèi)容