首頁 / 資訊中心 / 趨勢研究/微軟沈向洋:技術(shù)也有偏見,如何打造負(fù)責(zé)任的人工智能

微軟沈向洋:技術(shù)也有偏見,如何打造負(fù)責(zé)任的人工智能

發(fā)布時(shí)間:2019-09-03 分類:趨勢研究 來源:澎湃新聞


微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋

“大部分人都高估了自己在一年里能做到的事情,同時(shí)卻低估了自己能在10年里取得的成就?!痹?019世界人工智能大會(huì),AI FOR ALL“二十一世紀(jì)的計(jì)算”學(xué)術(shù)研討會(huì)上,微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋用這句話表明微軟在人工智能領(lǐng)域里的投入和專注。

在當(dāng)天的演講中,沈向洋介紹了在過去的一年時(shí)間里,全球各地的微軟研究院取得的成就。例如,微軟開發(fā)出了第一個(gè)能將數(shù)據(jù)編碼存儲(chǔ)到DNA中的方法,能夠?qū)⒁蛔鶄}庫那么大的數(shù)據(jù)中心,壓縮到只有幾個(gè)骰子大小;微軟的Project Natick項(xiàng)目,在大洋深處的海底,建成了一座數(shù)據(jù)中心;微軟還開發(fā)了一套能夠解釋機(jī)器學(xué)習(xí)的開源方案,幫助人們開啟人工智能的黑箱;同時(shí),微軟還創(chuàng)造了一套叫做Code Jumper的工具,利用不同形狀的模塊,幫助視力障礙的孩子們,學(xué)會(huì)如何編程。

當(dāng)下,以人工智能為代表的一系列技術(shù)正在讓很多不可思議的事情成為現(xiàn)實(shí)。但在推動(dòng)技術(shù)進(jìn)步的同時(shí),如何解決技術(shù)帶來的社會(huì)影響,以及人類將要共同面對的前瞻挑戰(zhàn)?如何避免人工智能技術(shù)發(fā)展帶來的偏見和歧視?也應(yīng)該是科技公司需要關(guān)注的問題。

在當(dāng)天的演講中,沈向洋就舉了一個(gè)例子。微軟的研究團(tuán)隊(duì),利用稱為“單詞嵌入”的自然語言處理工具,解決了文本搜索中的性別偏見的問題。

所謂單詞嵌入,是一種用來將單詞轉(zhuǎn)換為向量數(shù)字的算法,它能夠以來自新聞數(shù)據(jù)或者網(wǎng)頁數(shù)據(jù)的海量文本數(shù)據(jù)為依據(jù),為每個(gè)單詞賦予一個(gè)對應(yīng)的向量數(shù)字。通過在向量坐標(biāo)系中,比對常見詞匯與“他”、“她”這兩個(gè)性別代詞之間的關(guān)聯(lián)度,研究人員發(fā)現(xiàn)了一些明顯的特征,例如“sassy(刁蠻)”、“knitting(編織)”這樣的詞更靠近女性,而“hero(英雄)”、“genius(天才)”更靠近男性。算法之所以會(huì)為這些詞匯賦予性別特征,原因在于訓(xùn)練算法用的基準(zhǔn)數(shù)據(jù)集——通常是來自新聞和網(wǎng)頁的數(shù)據(jù)——本身,就存在著由語言習(xí)慣造成的“性別偏見”,算法也自然“繼承”了人類對這些詞匯理解的性別差異。

其結(jié)果就是,當(dāng)微軟用試驗(yàn)算法,根據(jù)梅林達(dá)·蓋茨的 LinkedIn 信息推測其職業(yè)時(shí),得到了“教師”的判斷,但只要將人稱代詞換成“他”,蓋茨夫人的職業(yè)就會(huì)變?yōu)椤奥蓭煛薄?

為了解決這個(gè)問題,微軟的研究員提出了一個(gè)簡單易行的方案:在單詞嵌入中,刪除區(qū)分“他”和“她”的判斷維度。

除此之外,據(jù)沈向洋介紹,微軟早在2016年就開始關(guān)注技術(shù)帶來的道德倫理問題。2016 年,微軟 CEO 薩提亞·納德拉發(fā)表了一篇關(guān)于人工智能共同責(zé)任的專欄文章,幾個(gè)月后,第一次公開提出了微軟的人工智能準(zhǔn)則:公平、可靠和安全、隱私和保障、包容、透明、責(zé)任。

2017年,微軟出版了《計(jì)算未來》一書,對人工智能發(fā)展過程中可能引發(fā)的道德、法律思考和社會(huì)影響,進(jìn)行了全面詳實(shí)的探討。此外,微軟成立了AETHER(“工程與科研中的人工智能道德”的縮寫)人工智能倫理道德委員會(huì),這個(gè)委員會(huì)由微軟公司領(lǐng)導(dǎo)、工程師、科研人員、律師等組成,負(fù)責(zé)對微軟內(nèi)部與人工智能倫理道德相關(guān)的事宜,進(jìn)行探討和評估。