<nav id="4uuuu"></nav>
  • <tr id="4uuuu"></tr>
  • <tr id="4uuuu"></tr>
  • <tfoot id="4uuuu"><dd id="4uuuu"></dd></tfoot>
    • <noscript id="4uuuu"><optgroup id="4uuuu"></optgroup></noscript>

      久久精品福利网站免费,亚洲色大情网站WWW在线观看,久久水蜜桃网国产免费网手机 ,男女性高视频免费观看国内,老色鬼第一页av在线,久久久久精品婷婷

      算力突圍之戰(zhàn):AI芯片封堵再加劇 國內(nèi)算力需求尋路

      錢玉娟2023-07-07 22:13

      經(jīng)濟(jì)觀察報(bào)記者 錢玉娟

      關(guān)于英偉達(dá)A800芯片可能被禁售的消息,正在引發(fā)連鎖反應(yīng)。

      一位英偉達(dá)芯片代理商告訴記者,大約一周前,關(guān)于英偉達(dá)A800芯片被禁售的這個(gè)信號讓市場上的A800價(jià)格一下子漲了起來。”

      據(jù)這位代理商介紹,英偉達(dá)A800 80GB PCie標(biāo)準(zhǔn)版GPU的市場價(jià),15天前在9萬元人民幣/顆,“現(xiàn)在(一顆)11萬元左右。”即便價(jià)格飛漲,他告訴記者,英偉達(dá)的高端算力GPU芯片依然是“搶手貨”,在他看來,英偉達(dá)的H800系列GPU芯片目前還可以正常供應(yīng),只不過價(jià)格更高了。

      一面是越來越貴、越來越稀缺的高端芯片,一面是下游需求高漲的“百模大戰(zhàn)”,尋找另一條道路,成為迫在眉睫的選擇。

      在被認(rèn)為是“史上最火爆”的上海2023年世界人工智能大會(huì)(WAIC)上,算力需求和缺口成為了高頻詞匯。

      7月7日上午,清華大學(xué)電子工程系教授汪玉表示,若以大語言模型作為底座,同時(shí)處理我國14億人的推理請求,所需的計(jì)算量超過目前我國數(shù)據(jù)中心總算力的3個(gè)數(shù)量級。他由此強(qiáng)調(diào)我國現(xiàn)有算力資源的緊張程度。

      “沒有大算力,做大模型就是天方夜譚。”中國工程院院士、鵬城實(shí)驗(yàn)室主任高文也在WAIC上透露,團(tuán)隊(duì)正在緊鑼密鼓地對一個(gè)2000億參數(shù)的大模型進(jìn)行訓(xùn)練,至少“需要4000塊卡訓(xùn)練100天”。

      云計(jì)算技術(shù)專家劉世民早早注意到,國內(nèi)正式渠道如今愈發(fā)買不到高端AI芯片,面對算力發(fā)展遭遇限制,他也看到,一些云廠商基于相關(guān)AI產(chǎn)品可以提供GPU算力這一最基礎(chǔ)的AI服務(wù),當(dāng)然,其中不乏AWS、Azure這樣的海外云服務(wù)商。

      “目前算力比較緊張,所以會(huì)選擇租賃云算力。”云從科技研究院的孫進(jìn)透露,買不到高端算力卡,加之自建算力集群周期長,即便租賃云算力成本相較自建要高,“高出50%~100%”,但這依然成為一些對算力有需求的科技公司的選擇。

      如今,這條道路也在面臨更多挑戰(zhàn):7月4日,有消息稱美國計(jì)劃對使用亞馬遜云、微軟云等海外云計(jì)算服務(wù)的中國企業(yè)施加限制。這是繼去年美國限制對華半導(dǎo)體出口,今年拉攏日本、荷蘭對華限制出口先進(jìn)芯片制造設(shè)備后又一舉措,“現(xiàn)在估計(jì)又要封堵云GPU了。” Vibranium Consulting副總裁陳沛說。

      圍堵加碼

      陳沛介紹,云GPU要比自建GPU算力集群貴,“大型云廠商的價(jià)格差不多一小時(shí)2-3美元。”據(jù)他所知,AWS、Azure這樣的大型云服務(wù)商在新加坡有提供部分種類的云算力服務(wù),在中國亦然。

      2022年8月,當(dāng)英偉達(dá)的GPU計(jì)算芯片A100和H100被美國政府要求限制向中國出口后,對高端算力有需求的廠商,還可以在擁有先進(jìn)制程AI芯片的AWS、Azure等云廠商提供的云端算力服務(wù)中得到滿足。

      而今限制如果繼續(xù)升級,中國廠商未來若想使用AWS、Azure等海外云服務(wù)商的云端算力服務(wù),也要獲得美國政府許可才行。

      2022年,由IDC、浪潮信息、清華大學(xué)全球產(chǎn)業(yè)研究院聯(lián)合編制了一份《2021-2022全球計(jì)算力指數(shù)評估報(bào)告》,量化揭示了算力的重要性:全球各國算力規(guī)模與經(jīng)濟(jì)發(fā)展水平顯著正相關(guān),計(jì)算力指數(shù)平均每提高1點(diǎn),數(shù)字經(jīng)濟(jì)和GDP將分別增長3.5‰和1.8‰;美國和中國的計(jì)算力指數(shù)分別為77分和70分,同屬國別計(jì)算力的領(lǐng)跑者。

      上述半導(dǎo)體行業(yè)觀察人士建議,正在算力側(cè)展開自研創(chuàng)新的中國廠商們,當(dāng)下“需要丟掉幻想”,她認(rèn)為,只有不斷攻克芯片的成熟制程,疊加軟件創(chuàng)新才能共同提升算力。

      在中國算力突圍路徑中,國產(chǎn)GPU芯片自研替代被認(rèn)為是第一大選擇,但這一選擇需要時(shí)間。目前最現(xiàn)實(shí)的選擇是,如何最大化地利用現(xiàn)有的高端芯片資源。

      算力共享

      按照外媒此前披露,作為微軟全力扶持的AI創(chuàng)業(yè)公司,OpenAI擁有微軟Azure云最高優(yōu)先級的支持——約有2.5萬個(gè)英偉達(dá)GPU正在支持GPT大模型的訓(xùn)練,這是目前世界上規(guī)模最龐大的AI服務(wù)器之一。而OpenAI光用在訓(xùn)練ChatGPT上,就使用了1萬個(gè)英偉達(dá)的GPU。

      但即便是微軟,GPU也面臨缺口。今年6月,在公開的OpenAI CEO Sam Altman 談話紀(jì)要中提到,GPU的短缺拖延了Open AI客戶的許多短期計(jì)劃。但這份談話紀(jì)要很快被刪除。

      按照此前媒體報(bào)道,目前中國企業(yè)GPU芯片持有量超過1萬枚的不超過5家,擁有1萬枚A100的至多1家。且由于美國去年8月開始算力封鎖,這些存貨的剩余使用壽命約為4-6年。

      但現(xiàn)實(shí)正在急劇變化:伴隨著今年以來的生成式AI浪潮和大模型井噴,此前存在的缺口無疑還在進(jìn)一步放大。

      由此,在國內(nèi)推動(dòng)“算力共享”被提上日程。

      北京市經(jīng)信局4月下旬公布的“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃”,進(jìn)展迅速。7月3日,計(jì)劃公布了第二批伙伴名單中共有63家企業(yè),其中包括百度、京東、神州數(shù)碼和金山等10家算力供應(yīng)伙伴。

      北京市經(jīng)信局公布的第一批算力供應(yīng)方伙伴名單只有兩家,一個(gè)是北京超級云計(jì)算中心,另一個(gè)便是阿里云計(jì)算有限公司。

      2022年8月30日,阿里云推出飛天智算平臺的同時(shí),還啟動(dòng)了張北和烏蘭察布兩座超大規(guī)模智算中心,以公有云和專有云兩種模式,為各類機(jī)構(gòu)提供服務(wù)。

      彼時(shí)阿里云表示,其智算平臺以及智算中心可將計(jì)算資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍。毫無疑問,當(dāng)國內(nèi)算力供應(yīng)因芯片卡短缺陷入緊張時(shí),云端算力可以補(bǔ)位。

      當(dāng)阿里云提出“算力普惠”的目標(biāo)愿景時(shí),華為也通過推出昇騰AI集群解決方案,以填補(bǔ)著算力需求和硬件算力供給間的溝壑。在7月6日下午的WAIC上,華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊宣布,昇騰AI集群規(guī)模從最初的4000卡擴(kuò)展升級至16000卡,成為業(yè)內(nèi)首個(gè)萬卡AI集群,其算力已經(jīng)在支撐像科大訊飛等企業(yè)進(jìn)行大模型訓(xùn)練以及智能化轉(zhuǎn)型。

      AI缺口

      如今受益于昇騰AI集群的算力支持,訊飛星火大模型的優(yōu)化訓(xùn)練在有序進(jìn)行中。科大訊飛高級副總裁胡國平在WAIC上強(qiáng)調(diào),所有的大模型訓(xùn)練都強(qiáng)烈依賴高端AI芯片集群和生態(tài)。

      不過,孫進(jìn)告訴記者,云端算力共享或租賃,往往適用于低頻訓(xùn)練需求的廠商。“基于同樣或同類型的算力芯片,云廠商提供的云GPU確實(shí)可以形成替代。”但他表示,“各地建設(shè)的訓(xùn)練算力集群,大部分是消費(fèi)級推理卡集群,或者是CPU集群。”

      一般來說,算力被分為三類:通用算力、智能算力、超算算力。在傳統(tǒng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的場景中,基于普通CPU芯片集成的服務(wù)器所能提供的通用算力就可滿足;而人工智能發(fā)展、大模型的訓(xùn)練和推理,這些對應(yīng)的則是智能算力,是要基于AI芯片所提供的算力。此外,天體物理、航空航天等復(fù)雜運(yùn)算則需要超算算力。

      據(jù)工信部消息,近年來中國算力產(chǎn)業(yè)規(guī)模快速增長,年增長率近30%,算力規(guī)模排名全球第二,僅次于美國。

      但當(dāng)下的問題在于,這其中一部分并不是本輪生成式AI所需求的智能算力,而只是通用算力。

      此前發(fā)布的《中國算力指數(shù)發(fā)展白皮書(2022)》顯示,中、美在全球算力規(guī)模中的份額分別為33%、34%,其中通用算力份額分別為26%、37%,智能算力分別為28%、45%,超級算力分別為18%、48%。

      在劉世民看來,算力共享確實(shí)可以讓更多企業(yè)能用上算力,但先進(jìn)芯片所代表的高端算力,一旦被限制,勢必限制國內(nèi)算力的增長。而今,中國的人工智能產(chǎn)業(yè)又已經(jīng)步入AIGC時(shí)代,參與其中的廠商需要進(jìn)行的是高頻訓(xùn)練,持續(xù)的優(yōu)化迭代。

      值得關(guān)注的是,算力需求暴增下,供給背后的國產(chǎn)GPU自研以及軟件創(chuàng)新,都將是中國廠商亦步亦趨要解決的問題。

      陳沛說,種種限制框架下,英偉達(dá)提供的高端算力,在市場上不只受歡迎,還是剛需。陳沛記得2020年OpenAI訓(xùn)練GPT-3時(shí),用的是英偉達(dá)GPU芯片V100,“一萬顆,耗時(shí)14.8天”,但在一周前,他看到英偉達(dá)發(fā)出的最新測試結(jié)果中顯示,僅用3000多顆H100 GPU芯片,11分鐘就完成了GPT-3的模型訓(xùn)練。

      “英偉達(dá)依然是AI訓(xùn)練領(lǐng)域的老大。”陳沛說。

      一位國產(chǎn)AI大模型廠商的創(chuàng)始人也告訴記者,目前其自研的大模型正在儲備的英偉達(dá)算力芯片上“跑著”,盡管芯片禁售是未來式,但面對大模型浪潮所帶來的高頻算力需求,目前我們沒有太多的備選方案。

      版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電:【010-60910566-1260】。
      TMT新聞部記者
      長期關(guān)注并報(bào)道TMT領(lǐng)域的重大事件,時(shí)刻保持新聞敏感,發(fā)現(xiàn)前沿趨勢。擅長企業(yè)模式、人物專訪及行業(yè)深度報(bào)道。
      重要新聞線索可聯(lián)系qianyujuan@eeo.com.cn
      微信號:EstherQ138279

      熱新聞

      久久精品福利网站免费
      <nav id="4uuuu"></nav>
    • <tr id="4uuuu"></tr>
    • <tr id="4uuuu"></tr>
    • <tfoot id="4uuuu"><dd id="4uuuu"></dd></tfoot>
      • <noscript id="4uuuu"><optgroup id="4uuuu"></optgroup></noscript>