本文翻譯自Tomshardware
用于DRAM的PAM4
在上周的一次發(fā)布會(huì)上,美光分享了Nvidia的Geforce rtx30系列顯卡使用的最新GDDR 6x SGDRAM的一些額外細(xì)節(jié)。公司透露,他們針對(duì)這種新型存儲(chǔ)器的技術(shù)進(jìn)行了十多年的試驗(yàn),目前GDDR6X SGRAM并沒有被JEDEC標(biāo)準(zhǔn)化,只有Nvidia使用GDDR6X內(nèi)存,但美光希望這種情況會(huì)隨著時(shí)間的推移而改變。可以嗎?
PAM4:自2006年開始的研發(fā)
美光位于德國慕尼黑的圖形DRAM設(shè)計(jì)中心,自從設(shè)計(jì)中心當(dāng)年隸屬于奇蒙達(dá)(Qimonda)以來,就有著圖形內(nèi)存研發(fā)的歷史,這是英飛凌(Infineon)長(zhǎng)期以來的衍生產(chǎn)品。來自這些實(shí)驗(yàn)室的工程師們帶來了業(yè)界第一個(gè)GDDR5、GDDR5X和現(xiàn)在的GDDR6X芯片的批量生產(chǎn)。事實(shí)上,美光是GDDR5X的唯一制造商,現(xiàn)在它是GDDR6X的唯一生產(chǎn)商。
不同GDDR之間對(duì)比(圖片來源:美光)
PAM4信號(hào)是GDDR6X存儲(chǔ)器的關(guān)鍵特性。這種技術(shù)使用四個(gè)信號(hào)電平每周期傳輸兩個(gè)數(shù)據(jù)位,因此與上一代SGRAM類型相比,任何工作頻率的有效帶寬都增加了一倍。此外,PAM4為更高的數(shù)據(jù)傳輸速率打開了大門(盡管要付出代價(jià))。因此,PAM4提高了每時(shí)鐘的效率和速度。
不過,值得注意的是,GDDR6的突發(fā)長(zhǎng)度為16字節(jié)(BL16),這意味著它的兩個(gè)16位通道中的都可以在每次操作中傳送32個(gè)字節(jié)。GDDR6X的突發(fā)長(zhǎng)度為8字節(jié)(BL8),但由于PAM4信令,其16位信道的每個(gè)操作也將傳送32字節(jié)。為此,在同一時(shí)鐘下,GDDR6X并不比GDDR6快。
(圖片來源:美光科技)
PAM4信令已用于數(shù)據(jù)中心網(wǎng)絡(luò)標(biāo)準(zhǔn),如Infiniband,多年來,PAM4本身并不是什么特別新鮮的事情。與傳統(tǒng)的PAM2/NRZ調(diào)制相比,PAM4仍然用于大型數(shù)據(jù)中心和超級(jí)計(jì)算機(jī)的主要原因是其實(shí)現(xiàn)成本。
但高昂的成本并不妨礙在實(shí)驗(yàn)室中對(duì)這項(xiàng)技術(shù)的探索,這也是美光美國分公司的科學(xué)家自2006年以來一直在做的事情。在此過程中,他們獲得了45項(xiàng)專利。
“在美光,我們的科學(xué)家從2006年就開始研究如何在內(nèi)存中使用PAM4,”美光公司圖形部門主管Ralf Ebert說。
經(jīng)過多年對(duì)PAM4的探索,美光認(rèn)為是時(shí)候?qū)⑦@項(xiàng)技術(shù)應(yīng)用到圖形內(nèi)存中了。從2007年(GDDR5)到2018年(GDDR6),GDDR的演變?cè)诩軜?gòu)上非常簡(jiǎn)單(盡管回歸了BL8),因此引入一種新的信令方案需要美光將其來自美國的科學(xué)家和來自德國的工程師聚集在一起。
“科學(xué)家們必須與GDDR的開發(fā)者們并肩工作,這些人開發(fā)了芯片,”Ebert說:“此外,他們還與系統(tǒng)工程師和產(chǎn)品工程師密切合作,這些工程師從系統(tǒng)和大規(guī)模制造的角度了解這些挑戰(zhàn)。”
我們今天所知的GDDR6X的工作始于不到三年前的2017年末。通常,將一種新型的DRAM推向市場(chǎng)需要更長(zhǎng)的時(shí)間,但由于這主要是一個(gè)內(nèi)部項(xiàng)目(至少在內(nèi)存設(shè)備級(jí)別),美光已經(jīng)采用的技術(shù)的實(shí)現(xiàn)非常迅速。不過,這是有原因的。
(圖片來源:美光科技)
與Nvidia密切合作開發(fā)
新型存儲(chǔ)器的開發(fā)不僅考慮到某些應(yīng)用,而且也考慮到某些客戶。Nvidia是第一家使用GDDR5X和GDDR6的公司(早在21世紀(jì)初,還有GDDR2和GDDR3),因此它很早就與美光就GDDR6X項(xiàng)目進(jìn)行了接觸也就不足為奇了。事實(shí)上,根據(jù)美光的說法,Nvidia要求美光提供比GDDR6更高性能的內(nèi)存解決方案。
“你必須與客戶合作,”Ebert說你:“必須確定一個(gè)與之合作的客戶,并且最好依賴于多年來建立的密切的業(yè)務(wù)和技術(shù)合作關(guān)系。[我們必須確保]產(chǎn)品從一開始就可以在應(yīng)用程序中正常工作。”
Nvidia不得不為GDDR6X開發(fā)一個(gè)全新的內(nèi)存控制器和PHY,因?yàn)镻AM4信令改變了內(nèi)存子系統(tǒng)的工作方式。基于到目前為止還沒有IP設(shè)計(jì)公司宣布他們的GDDR6X產(chǎn)品,看起來Nvidia已經(jīng)設(shè)計(jì)了所有的內(nèi)部產(chǎn)品。
目前,Nvidia在其GeForce RTX 3080/3090顯卡上使用GDDR6X,基于GA102 GPU,主要面向玩家。最終,該公司還將提供QuadroRTX專業(yè)圖形卡,具有相同的芯片和GDDR6X內(nèi)存。同時(shí),美光表示,GDDR6X也用于AI和HPC應(yīng)用,這兩種應(yīng)用都不屬于Nvidia的GeForce RTX(因?yàn)檫@些卡在用于AI的FP16和FP32張量性能以及用于HPC的FP64性能方面都有限制)和Quadro RTX focus。也許美光意味著假想的用途,或者它意味著即將推出的Nvidia Titan系列卡,將為AI和HPC提供更高級(jí)的性能。
Nvidia是美光唯一的GDDR6X發(fā)布合作伙伴,但美光強(qiáng)調(diào),它并不是專門為GPU開發(fā)者設(shè)計(jì)這種新型內(nèi)存的。這家DRAM制造商也計(jì)劃向其他公司提供GDDR6X。
“我們現(xiàn)在開始提供并向業(yè)界開放,GDDR6X不是針對(duì)某些客戶的。”Ebert說:“我們希望其他客戶有興趣向前發(fā)展,然后我們也會(huì)與他們接洽。”
帶PAM4的GDDR6X:較難構(gòu)建,但比HBM2便宜
美光表示,PAM4要求其重新設(shè)計(jì)其GDDR6X存儲(chǔ)設(shè)備中的寫入數(shù)據(jù)捕獲電路(接收器),以精確地采樣和解析四種不同的信號(hào)電平。為此,每個(gè)GDDR6X DRAM每個(gè)I/O和數(shù)據(jù)總線反轉(zhuǎn)(DQ/DBI)管腳都包含三個(gè)輸入子接收器。主機(jī)可以在寫入訓(xùn)練序列期間微調(diào)參考電壓電平。GDDR6X的輸出驅(qū)動(dòng)程序也必須重新設(shè)計(jì)。
PAM4的更高傳輸效率(圖片來源:美光科技)
美光承認(rèn),與上一代GDDR6設(shè)備相比,GDDR6X芯片的生產(chǎn)成本更高。此外,他們需要一個(gè)非常干凈和穩(wěn)定的信號(hào),這就是為什么Nvidia的GA102 GPU驅(qū)動(dòng)GeForce RTX 3080/3090卡的內(nèi)存控制器現(xiàn)在需要獨(dú)立的電源軌上,以確保非常干凈和穩(wěn)定的電源。
談到功率,有必要注意到,由于性能顯著提高,根據(jù)美光的數(shù)據(jù),GDDR6X在設(shè)備級(jí)別比GDDR6(7.25pj/bit vs 7.5pj/bit)高出15%。
總體而言,GDDR6X芯片及其實(shí)現(xiàn)比GDDR6更昂貴,但它仍然比HBM2類內(nèi)存便宜得多。GDDR6X不需要堆疊,它是分立的芯片的形式,可以在工廠安裝。用分立DRAM的整個(gè)基礎(chǔ)設(shè)施已經(jīng)存在了幾十年,而且所有的過程都是熟悉的并且便宜的。相比之下,HBM2-KGSDs(已知良好的疊層模具)必須在半導(dǎo)體工廠封裝,然后放置在另一家潔凈室中的GPU旁邊。
“更高性能的DRAM通常也需要更高的成本,”Ebert說:“GDDR6X的最大優(yōu)點(diǎn)是,我們可以將性能標(biāo)準(zhǔn)提高到更高的水平,同時(shí)仍然保持在一定的成本范圍內(nèi)。這是因?yàn)镚DDR6X仍然是一個(gè)分立內(nèi)存解決方案。GDDR6X內(nèi)存可以像其他任何內(nèi)存一樣,由制造商在其標(biāo)準(zhǔn)環(huán)境中組裝。當(dāng)你觀察不同速度等級(jí)的內(nèi)存時(shí),通常有不同的范圍;我們將GDDR6X與典型范圍一致。對(duì)于客戶來說,這并不是一種成本極高的產(chǎn)品,這主要是因?yàn)樗匀皇且环N分立內(nèi)存解決方案。”
美光沒有透露其8Gb GDDR6X的芯片尺寸,也沒有將其與8Gb GDDR6器件進(jìn)行比較。該公司強(qiáng)調(diào),這是第一種使用PAM4信號(hào)的存儲(chǔ)器,后者是一種突破,為各種創(chuàng)新打開了大門。
“PAM4是一個(gè)挑戰(zhàn),我們相信,有了這一突破,可以一直向前推進(jìn)。”美光圖形DRAM主管說:“我們相信,這將改變DRAM行業(yè)。我們是最早做到這一點(diǎn)的,我們已經(jīng)為此努力了一段時(shí)間。”
GDDR6X可縮放密度和數(shù)據(jù)速率
新的器件使用公司成熟的第四代10nm級(jí)工藝技術(shù)(也稱為1αnm)生產(chǎn)的。該公司已經(jīng)制定了在容量和速度方面擴(kuò)展GDDR6X的路線圖。
明年,美光打算增加16Gb的密度,并隨著時(shí)間的推移提供更快的芯片。目前,美光是GDDR6X的唯一生產(chǎn)商,Nvidia是唯一的客戶,因此GDDR6X的發(fā)展取決于Nvidia的需求和美光的量產(chǎn)能力。這里的關(guān)鍵信息是,GDDR6X的性能可以擴(kuò)展到21Gbps以上。
GDDR6X:不是JEDEC標(biāo)準(zhǔn),但也不是專有的
為了盡快完成GDDR6X,使其與Nvidia的Ampere GPU協(xié)同工作,兩家公司幾乎在保密模式下工作。這兩家公司從未將規(guī)范提交給JEDEC進(jìn)行標(biāo)準(zhǔn)化,因此GDDR6X是目前只能從美光獲得的一種專有內(nèi)存。
Ebert說:“目前為止,它還沒有提交給JEDEC進(jìn)行標(biāo)準(zhǔn)化。
GDDR5X主要由美光開發(fā),幾乎沒有其他公司對(duì)此投入。在美光開始量產(chǎn)GDDR5X之前,JEDEC正式發(fā)布了該標(biāo)準(zhǔn),并將其提供給組織成員。然而,除了Nvidia,沒有人使用GDDR5X,除了美光之外,沒有人生產(chǎn)這種類型的內(nèi)存。
GDDR6X也許可以用在圖形之外
(圖片來源:美光科技)
傳統(tǒng)上,GDDR類型的內(nèi)存幾乎只用于顯卡和游戲機(jī)。有了GDDR6,美光和業(yè)界同行開始為其他需要高帶寬的應(yīng)用程序推廣圖形DRAM。在潛在的使用案例中,他們瞄準(zhǔn)了汽車、網(wǎng)絡(luò)和FPGA應(yīng)用。美光希望GDDR6X能夠解決非GPU市場(chǎng)。
如今,GPU廣泛應(yīng)用于各種人工智能應(yīng)用,因此,在美光的簡(jiǎn)報(bào)會(huì)上,當(dāng)公司談到GDDR6X用于非圖形垂直領(lǐng)域時(shí),自然會(huì)提到培訓(xùn)和推理的AI。同時(shí),由于Nvidia將其泰坦系列顯卡瞄準(zhǔn)了游戲玩家、人工智能、發(fā)燒友和各種產(chǎn)品消費(fèi)者,如果Nvidia推出泰坦——Ampere系列,美光的GDDR6X將從技術(shù)上解決這些市場(chǎng)的問題。
為了應(yīng)對(duì)新興市場(chǎng),美光不僅需要提供內(nèi)存本身,還需要提供內(nèi)存控制器IP、PHY IP和驗(yàn)證IP。這些類型的東西是由IP設(shè)計(jì)公司提供的,如Avery、Cadence、Rambus和Synopsys。由于GDDR6X才剛剛開始,如果他們看到了行業(yè)對(duì)GDDR6X的潛在需求,他們也將進(jìn)入這一領(lǐng)域。當(dāng)然這并不能完全保證,尤其是考慮到GDDR6X不是JEDEC支持的行業(yè)標(biāo)準(zhǔn)。
CPU也可以使用GDDR6X
Ebert說:“從歷史上看,沒有什么能阻止這個(gè)行業(yè)使用CPU與GDDR RAM結(jié)合使用。”
圖形內(nèi)存的未來:PAM4將繼續(xù)存在,即使對(duì)于HBM也是如此
對(duì)于美光來說,GDDR6X不僅是一個(gè)高度完善的產(chǎn)品,而且是其將PAM4信號(hào)應(yīng)用到DRAM上的偉大創(chuàng)舉。雖然這種編碼方式不會(huì)用于DDR5 SDRAM,但美光相信從長(zhǎng)遠(yuǎn)來看,這是內(nèi)存的未來。
“GDDR6X是我們首次利用了PAM4,我們肯定可以看到這一點(diǎn)的繼續(xù)發(fā)展。”美光圖形內(nèi)存總監(jiān)說,“未來有可能,PAM4可以用于其他內(nèi)存標(biāo)準(zhǔn)。這類技術(shù)很可能會(huì)被CPU或其他處理器使用。”
內(nèi)存演進(jìn)流程(圖片來源:美光科技)
PAM4確實(shí)會(huì)被工業(yè)界廣泛使用,遠(yuǎn)遠(yuǎn)超過今天的使用范圍。PCIe6.0將于2021年面世,它使用PAM4信令來獲取更高的效率和更高的數(shù)據(jù)速率。考慮到PCIe的廣泛采用,CPU和ASIC公司最終將同時(shí)支持PCIe6.0和PAM4。一旦業(yè)界了解了如何使用PCI6.0實(shí)現(xiàn)PAM4調(diào)制,它肯定會(huì)將其應(yīng)用到其他領(lǐng)域。
美光表示,他們首先將PAM4實(shí)現(xiàn)到一個(gè)LPDDR測(cè)試芯片中,對(duì)這項(xiàng)技術(shù)進(jìn)行實(shí)驗(yàn)。此外,在我們準(zhǔn)備這篇報(bào)道時(shí)發(fā)現(xiàn)的一項(xiàng)專利表明,美光在三年前申請(qǐng)了PAM4和PAM8信令的HBM類內(nèi)存的專利。
HBM類型的內(nèi)存還必須采用離散DRAM設(shè)備(QDR、BL8/BL16等)所使用的負(fù)載,因此很難預(yù)測(cè)何時(shí)可以采用新的信令。目前可用的HBM2E 3.6GBps芯片如果采用PAM4調(diào)制,則帶寬將翻倍,達(dá)到922Gb/s,這意味著一個(gè)6模塊6144位DRAM子系統(tǒng)將提供高達(dá)5.5tb/s的帶寬。不過,在這一點(diǎn)上,這純粹是猜測(cè)。
總結(jié)
美光的GDDR6X是業(yè)界第一款使用四電平脈沖幅度調(diào)制信號(hào)(PAM4)的量產(chǎn)型存儲(chǔ)器。這種新的編碼方式使用四個(gè)信號(hào)電平每周期傳輸兩個(gè)數(shù)據(jù)位(而對(duì)于PAM2則為一個(gè)數(shù)據(jù)位),這意味著可以實(shí)現(xiàn)更高頻率。從2006年開始,我們就把它看作是一個(gè)巨大的進(jìn)化論者。雖然DDR5不使用PAM4,但美光已經(jīng)獲得了PAM4專利,甚至支持PAM8的HBM內(nèi)存。
DRAM制造商承認(rèn),與GDDR6相比,GDDR6X更難構(gòu)建和實(shí)現(xiàn)(可能更昂貴)。然而,即使是在它的嬰兒期,GDDR6X也比成熟的HBM2E便宜,因?yàn)槲覀冞@里處理的是分立內(nèi)存芯片。同時(shí),由于GDDR6X恢復(fù)到8字節(jié)的突發(fā)長(zhǎng)度(從GDDR6的16字節(jié)下降),在相同的每針數(shù)據(jù)速率下,它并不比其前身GDDR6快。
在這一點(diǎn)上,GDDR6X最大的特點(diǎn)是,它是由美光公司單獨(dú)開發(fā)的,有來自Nvidia的一些要求。美光尚未將該標(biāo)準(zhǔn)提交給JEDEC,目前尚不清楚GDDR6X是否會(huì)成為行業(yè)標(biāo)準(zhǔn)。美光希望GDDR6X能用于非圖形應(yīng)用,但如果沒有其他公司的支持,這種新型內(nèi)存的推廣將很困難。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“機(jī)電號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.







