我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。
歡迎瀏覽我們的案例。
在人工智能前沿領(lǐng)域,中國 AI 實(shí)現突破。
11 月 8 日,阿里巴巴達摩院公布多模態(tài)大模型 M6 最新進(jìn)展,其參數已從萬(wàn)億躍遷至 10 萬(wàn)億,規模遠超谷歌、微軟此前發(fā)布的萬(wàn)億級模型,成為全球最大的 AI 預訓練模型。
同時(shí),M6 做到了業(yè)內極致的低碳高效,使用 512 GPU 在 10 天內即訓練出具有可用水平的 10 萬(wàn)億模型。
相比去年發(fā)布的大模型 GPT-3,M6 實(shí)現同等參數規模,能耗僅為其1%。
M6 是達摩院研發(fā)的通用性人工智能大模型,擁有多模態(tài)、多任務(wù)能力,其認知和創(chuàng )造能力超越傳統 AI,尤其擅長(cháng)設計、寫(xiě)作、問(wèn)答,在電商、制造業(yè)、文學(xué)藝術(shù)、科學(xué)研究等領(lǐng)域有廣泛應用前景。
與傳統 AI 相比,大模型擁有成百上千倍“神經(jīng)元”數量,且預先學(xué)習過(guò)海量知識,表現出像人類(lèi)一樣“舉一反三”的學(xué)習能力。
因此,大模型被普遍認為是未來(lái)的“基礎模型”,將成下一代 AI 基礎設施。然而,其算力成本相當高昂,訓練 1750 億參數語(yǔ)言大模型 GPT-3 所需能耗,相當于汽車(chē)行駛地月往返距離。
今年 5 月,通過(guò)專(zhuān)家并行策略及優(yōu)化技術(shù),達摩院 M6 團隊將萬(wàn)億模型能耗降低超八成、效率提升近 11 倍。
10 月,M6 再次突破業(yè)界極限,通過(guò)更細粒度的 CPU offload、共享-解除算法等創(chuàng )新技術(shù),讓收斂效率進(jìn)一步提升 7 倍,這使得模型規模擴大 10 倍的情況下,能耗未顯著(zhù)增加。
這一系列突破極大降低了大模型研究門(mén)檻,讓一臺機器訓練出一個(gè)千億模型成為可能。

同時(shí),達摩院聯(lián)合阿里云推出了 M6 服務(wù)化平臺,為大模型訓練及應用提供完備工具,首次讓大模型實(shí)現“開(kāi)箱即用”,算法人員及普通用戶(hù)均可方便地使用平臺。
達摩院還推出了當前最大規模的中文多模態(tài)評測數據集 MUGE,覆蓋圖文描述、文本生成圖像、跨模態(tài)檢索任務(wù),填補了缺少中文多模態(tài)權威評測基準的空白。

作為國內首個(gè)商業(yè)化落地的多模態(tài)大模型,M6 已在超 40 個(gè)場(chǎng)景中應用,日調用量上億。
今年,大模型首次支持雙 11。M6 在犀牛智造為品牌設計的服飾已在淘寶上線(xiàn);憑借流暢的寫(xiě)作能力,M6 正為天貓虛擬主播創(chuàng )作劇本;依靠多模態(tài)理解能力,M6 正在增進(jìn)淘寶、支付寶等平臺的搜索及內容認知精度。

M6 生成的未來(lái)感汽車(chē)圖
達摩院智能計算實(shí)驗室負責人周靖人表示,“接下來(lái),我們將深入研究大腦認知機理,致力于將 M6 的認知力提升至接近人類(lèi)的水平,比如,通過(guò)模擬人類(lèi)跨模態(tài)的知識抽取和理解方式,構建通用的人工智能算法底層框架;另一方面,不斷增強 M6 在不同場(chǎng)景中的創(chuàng )造力,產(chǎn)生出色的應用價(jià)值。”
據了解,達摩院語(yǔ)言大模型 PLUG 近期也已升級至 2 萬(wàn)億參數,成為全球最大中文語(yǔ)言模型,其所屬 AliceMind 語(yǔ)言模型體系同樣推出了服務(wù)化平臺。
?。?a href="http://www.mtjwjy.com/website/">邯鄲網(wǎng)站建設)


小米應用商店發(fā)布消息稱(chēng) 持續開(kāi)展“APP 侵害用戶(hù)權益治理”系列行動(dòng) 11:37:04
騰訊云與CSIG成立政企業(yè)務(wù)線(xiàn) 加速數字技術(shù)在實(shí)體經(jīng)濟中的落地和應用 11:34:49
樂(lè )視回應還有400多人 期待新的朋友加入 11:29:25
亞馬遜表示 公司正在將其智能購物車(chē)擴展到馬薩諸塞州的一家全食店 10:18:04
三星在元宇宙平臺推出游戲 玩家可收集原材料制作三星產(chǎn)品 09:57:29
特斯拉加州San Mateo裁減229名員工 永久關(guān)閉該地區分公司 09:53:13