發(fā)力語(yǔ)料建設(shè) 讓人工智能健康成長(zhǎng)
2024-07-17 10:03:22? ?來(lái)源:光明日?qǐng)?bào) 責(zé)任編輯:蔡秀明 我來(lái)說(shuō)兩句 |
作者:陳強(qiáng)《光明日?qǐng)?bào)》( 2024年07月17日 03版) 【光明時(shí)評(píng)】 日前,在2024世界人工智能大會(huì)上,一場(chǎng)關(guān)于人工智能語(yǔ)料的論壇在上海首次舉辦。一年前,2023世界人工智能大會(huì)上,上海人工智能實(shí)驗(yàn)室、人民網(wǎng)、國(guó)家氣象中心等單位聯(lián)合發(fā)起的中國(guó)第一個(gè)大模型語(yǔ)料數(shù)據(jù)聯(lián)盟正式成立。人工智能大模型取決于三大要素:算力、算法、語(yǔ)料。中國(guó)是世界上數(shù)字化應(yīng)用場(chǎng)景最豐富的國(guó)家,各種場(chǎng)景提供了極為豐富的語(yǔ)料。中國(guó)是語(yǔ)料大國(guó),但各種語(yǔ)料仍存在參差不齊的情況,需進(jìn)一步加以規(guī)范。通過(guò)人工智能大模型,特定的輸入往往會(huì)生成特定的輸出,存在“種瓜得瓜,種豆得豆”的規(guī)律。從輸入端著手,強(qiáng)化語(yǔ)料建設(shè),可以推動(dòng)人工智能健康成長(zhǎng)。 在人工智能發(fā)展中,語(yǔ)料具有“賦能”和“教化”的雙重功能,前者通過(guò)全方位的知識(shí)轉(zhuǎn)移和訓(xùn)練,使得人工智能博聞強(qiáng)識(shí),融會(huì)貫通,進(jìn)而技藝超群;后者通過(guò)多維度的情感嵌入和價(jià)值對(duì)齊,讓人工智能“通情達(dá)理”,并且“善解人意”。例如,伴隨我國(guó)老齡化程度的加深,具有健康護(hù)理功能的養(yǎng)老護(hù)理機(jī)器人開(kāi)始走進(jìn)人們的生活。越來(lái)越多的老年人希望在享受各種專(zhuān)業(yè)化養(yǎng)老服務(wù)的同時(shí),也能感受到親人照料般的溫暖。這就需要發(fā)揮語(yǔ)料的教化作用,結(jié)合特定的激勵(lì)算法,讓機(jī)器人以和藹可親的姿態(tài)、體貼入微的服務(wù),響應(yīng)并滿(mǎn)足老年人的養(yǎng)老需求。由此可見(jiàn),在人工智能相關(guān)技術(shù)快速密集突破的過(guò)程中,要達(dá)到“強(qiáng)健其體魄、文明其精神”的目的,語(yǔ)料建設(shè)是關(guān)鍵,需要著重做好拓源、提質(zhì)、鑄魂三項(xiàng)工作。 首先是拓源。對(duì)于語(yǔ)料,人工智能大模型有異乎尋常的“好胃口”,當(dāng)前存在語(yǔ)料資源的較低水平供給與大模型高強(qiáng)度訓(xùn)練需求之間的矛盾。語(yǔ)料建設(shè)是一項(xiàng)復(fù)雜的系統(tǒng)工程,具有多源、高維、異構(gòu)、跨界、超限等典型特征,需要廣泛動(dòng)員和組織政府部門(mén)、行業(yè)組織、企業(yè)等各方力量,建立語(yǔ)料建設(shè)的統(tǒng)一戰(zhàn)線。全國(guó)各地紛紛行動(dòng),2023年,上海人工智能實(shí)驗(yàn)室宣布聯(lián)合語(yǔ)料數(shù)據(jù)聯(lián)盟成員單位,共同開(kāi)源發(fā)布“書(shū)生·萬(wàn)卷”1.0多模態(tài)預(yù)訓(xùn)練語(yǔ)料。深圳數(shù)交所則聯(lián)合近50家單位成立“開(kāi)放算料聯(lián)盟”,多家A股公司加盟。這在一定程度上緩解了語(yǔ)料資源供給不足的問(wèn)題。未來(lái)仍然需要加快拓展來(lái)源渠道,將沉淀在行業(yè)壁壘間、藏身于隱秘空間里的各種語(yǔ)料資源發(fā)掘出來(lái),為人工智能大模型的迭代升級(jí)提供動(dòng)力。 其次是提質(zhì)。語(yǔ)料涉及海量的數(shù)據(jù)、文本、圖片、語(yǔ)音、視頻等資源,既有“原材料”,也有“半成品”,要讓大模型能夠“吃”得下去,要靠數(shù)據(jù)庫(kù)技術(shù)解決“消化”問(wèn)題。大模型不僅要吃得飽,還要吃得好,面向行業(yè)應(yīng)用的專(zhuān)業(yè)數(shù)據(jù)庫(kù)可以給AI大模型“開(kāi)小灶”。 最后是鑄魂。語(yǔ)料對(duì)于人工智能的“思維方式”和“行為模式”具有潛移默化的影響。在語(yǔ)料建設(shè)中,既要開(kāi)放包容,博采世界各國(guó)文化之所長(zhǎng);也要汲取中華優(yōu)秀傳統(tǒng)文化的精髓,為大模型準(zhǔn)備“中餐”。中文語(yǔ)料尤其是中式價(jià)值觀語(yǔ)料的缺位,輕則會(huì)影響面向國(guó)內(nèi)特定應(yīng)用場(chǎng)景的垂類(lèi)大模型開(kāi)發(fā)進(jìn)程,重則可能失去以我國(guó)的文化與價(jià)值觀賦能人工智能發(fā)展的機(jī)會(huì)。對(duì)此,應(yīng)未雨綢繆,加快高質(zhì)量中文語(yǔ)料資源建設(shè)的提速擴(kuò)容,并將中國(guó)特色社會(huì)主義文化的價(jià)值取向融入其中。讓功能日益強(qiáng)大的人工智能成為言端行正、德才兼?zhèn)涞摹昂煤⒆印薄?/p> (作者:陳強(qiáng),系同濟(jì)大學(xué)經(jīng)濟(jì)與管理學(xué)院教授、上海市習(xí)近平新時(shí)代中國(guó)特色社會(huì)主義思想研究中心研究員) |
相關(guān)閱讀:
打印 | 收藏 | 發(fā)給好友 【字號(hào) 大 中 小】 |
信息網(wǎng)絡(luò)傳播視聽(tīng)節(jié)目許可(互聯(lián)網(wǎng)視聽(tīng)節(jié)目服務(wù)/移動(dòng)互聯(lián)網(wǎng)視聽(tīng)節(jié)目服務(wù))證號(hào):1310572 廣播電視節(jié)目制作經(jīng)營(yíng)許可證(閩)字第085號(hào)
網(wǎng)絡(luò)出版服務(wù)許可證 (署)網(wǎng)出證(閩)字第018號(hào) 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 閩B2-20100029 互聯(lián)網(wǎng)藥品信息服務(wù)(閩)-經(jīng)營(yíng)性-2015-0001
福建日?qǐng)?bào)報(bào)業(yè)集團(tuán)擁有東南網(wǎng)采編人員所創(chuàng)作作品之版權(quán),未經(jīng)報(bào)業(yè)集團(tuán)書(shū)面授權(quán),不得轉(zhuǎn)載、摘編或以其他方式使用和傳播
職業(yè)道德監(jiān)督、違法和不良信息舉報(bào)電話:0591-87095403(工作日9:00-12:00、15:00-18:00) 舉報(bào)郵箱:jubao@fjsen.com 福建省新聞道德委舉報(bào)電話:0591-87275327