關(guān)于我們
書單推薦
新書推薦
|
大數(shù)據(jù)和我們
《大數(shù)據(jù)和我們》告訴我們,每當(dāng)我們?cè)诠雀枭纤阉髂硞(gè)問題,在臉譜網(wǎng)上跟某人互動(dòng),用優(yōu)步打車去某處,甚至打開一盞燈時(shí),我們都在產(chǎn)生和分享社交數(shù)據(jù)。無論是被動(dòng)還是主動(dòng)分享的數(shù)據(jù)、強(qiáng)制還是自愿分享的數(shù)據(jù)、精確還是粗略的數(shù)據(jù),社交數(shù)據(jù)的總量呈指數(shù)增長(zhǎng)趨勢(shì)。
在此背景下,數(shù)據(jù)科學(xué)家化身為偵探與藝術(shù)家,通過人們留下的電子蹤跡為他們繪制出越發(fā)清晰的行為素描畫,發(fā)現(xiàn)人們的偏好或傾向,以及預(yù)測(cè)人們可能會(huì)購(gòu)買何種商品。 銀行通過數(shù)據(jù)來評(píng)定我們的信用等級(jí),保險(xiǎn)公司通過數(shù)據(jù)來評(píng)估我們的風(fēng)險(xiǎn)水平,雇主通過數(shù)據(jù)來決定是否雇用我們,但作為個(gè)體,我們卻并未充分受益于數(shù)據(jù)財(cái)富。 我們每天都會(huì)做出很多決定,我們今天的行為方式可能會(huì)影響我們今后幾十年的選擇,但很少有人能在短期或長(zhǎng)期內(nèi)觀察到自己的所有行為或分析出這些行為將產(chǎn)生何種影響。隨著我們逐漸認(rèn)識(shí)到社交數(shù)據(jù)的價(jià)值,《大數(shù)據(jù)和我們》的作者認(rèn)為,我們的生活不應(yīng)由數(shù)據(jù)來驅(qū)動(dòng),而應(yīng)讓數(shù)據(jù)為我們的生活服務(wù)。 在這個(gè)時(shí)代的轉(zhuǎn)折點(diǎn)上,人們正在定義創(chuàng)建數(shù)據(jù)的人與把數(shù)據(jù)轉(zhuǎn)化成產(chǎn)品和服務(wù)的組織之間的關(guān)系。不僅游戲規(guī)則發(fā)生了改變,這個(gè)新游戲還要求我們重新界定客戶與零售商、投資者與銀行、雇主與雇員、患者與醫(yī)生、學(xué)生與老師、公民與政府之間的關(guān)系。在《大數(shù)據(jù)和我們》中,作者總結(jié)了自己多年來在商業(yè)、教育、醫(yī)療、旅游和金融領(lǐng)域做咨詢的經(jīng)驗(yàn),并在此基礎(chǔ)上提煉出大數(shù)據(jù)如何更好地服務(wù)于普通大眾的觀點(diǎn)。
數(shù)據(jù)是未來的新石油
風(fēng)靡斯坦福大學(xué)的社交數(shù)據(jù)革命課 首席科學(xué)家、大數(shù)據(jù)專家心血力作 簡(jiǎn)體中文版全球同步上市 阿里巴巴、谷歌、臉譜網(wǎng)、沃爾瑪、橋水基金正在應(yīng)用的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù) 后隱私經(jīng)濟(jì)時(shí)代的全新游戲規(guī)則 社交數(shù)據(jù)的革命使之前從未量化或無法量化的一切事物都能被量化。當(dāng)我們有能力對(duì)世界上一切事物的數(shù)據(jù)進(jìn)行挖掘,在透明性與主動(dòng)性方面行使我們的權(quán)利時(shí),我們的數(shù)據(jù)將服務(wù)于我們。
社交數(shù)據(jù)革命
如何確保數(shù)據(jù)會(huì)為我們服務(wù)? 每一場(chǎng)革命最初都是一個(gè)人頭腦中的一種思想,一旦同一種思想在另一個(gè)人的頭腦中出現(xiàn),它對(duì)于這個(gè)時(shí)代就變得至關(guān)重要了。 ——拉爾夫·沃爾多·愛默生(Ralph Waldo Emerson) 早晨6點(diǎn)45分,手機(jī)鬧鐘將我叫醒。于是,我拿起手機(jī),一邊瀏覽電子郵件與臉譜網(wǎng)信息,一邊走進(jìn)廚房,我美好的一天就此開始。手機(jī)上的全球定位系統(tǒng)應(yīng)用軟件會(huì)記錄我的位置變化,并顯示出我向東、向北移動(dòng)了幾米。我給自己倒了一杯咖啡,然后走出廚房。這時(shí),手機(jī)上的加速計(jì)會(huì)給出我的行走速度,氣壓計(jì)會(huì)記錄我何時(shí)上樓。由于我在手機(jī)上安裝了谷歌的應(yīng)用程序,因此谷歌公司擁有我的這些數(shù)據(jù)的記錄。 吃完早飯后,我要去斯坦福大學(xué)上班。在我關(guān)燈并拔下移動(dòng)設(shè)備的電源插頭后,電力公司安裝的“智能”電表就會(huì)知道我的用電量開始下降了。當(dāng)我打開車庫(kù)門時(shí),電表會(huì)探測(cè)到與之相匹配的使用簽名。當(dāng)我開車上路時(shí),電力公司已擁有足夠的數(shù)據(jù)斷定我已不在家中。當(dāng)我的手機(jī)從另一個(gè)基站接收信號(hào)時(shí),通信公司也知道我出門了。 駕車行駛在路上時(shí),如果我闖了紅燈,安裝在街道拐角處的攝像頭就會(huì)拍下我的車牌號(hào)。謝天謝地,我今天遵紀(jì)守法,不會(huì)收到交通罰單。但在行駛過程中,我的車牌會(huì)多次被拍攝。有些攝像頭屬于當(dāng)?shù)卣,有些則屬于私營(yíng)公司,它們通過分析數(shù)據(jù)了解人們的駕駛習(xí)慣,并將此作為產(chǎn)品出售給警方、開發(fā)商及其他利益群體。 我到達(dá)斯坦福大學(xué)時(shí),會(huì)使用手機(jī)上的“無憂停車”應(yīng)用支付停車費(fèi)。停車費(fèi)自動(dòng)記入我的銀行賬戶,同時(shí)學(xué)校的停車管理小組會(huì)收到我的付款通知,這樣一來,校方與我的開戶銀行都知道我在上午9點(diǎn)03分到達(dá)校園。由于我的手機(jī)不再以汽車的行駛速度移動(dòng),谷歌公司會(huì)推斷出我已停車并記錄下我的位置,以便我日后查詢當(dāng)時(shí)的位置記錄。我也可以通過美國(guó)車險(xiǎn)服務(wù)商Metromile公司的保險(xiǎn)應(yīng)用查詢我當(dāng)時(shí)所在的位置,這款應(yīng)用通過我的車載診斷系統(tǒng)實(shí)時(shí)記錄我的駕駛數(shù)據(jù)。這讓我可以立刻發(fā)現(xiàn)今天的汽車燃油效率較低——每加侖汽油行駛了19英里,我此次通勤花了2.05美元。 上完課后,我打算和舊金山的新朋友見個(gè)面。我們?cè)凇疤摂M世界”中見過面,當(dāng)時(shí)我們共同的朋友在臉譜網(wǎng)上發(fā)了帖子,我們都對(duì)它進(jìn)行了評(píng)論,也很贊賞對(duì)方的看法。之后,又發(fā)現(xiàn)我們?cè)谀樧V網(wǎng)上有30多個(gè)共同好友,所以我們確實(shí)應(yīng)該見一面。 谷歌地圖預(yù)計(jì)我將在晚上7點(diǎn)12分到達(dá)目的地。與往常一樣,它的預(yù)測(cè)誤差只有幾分鐘。這位朋友居住公寓的一層是一家銷售煙草產(chǎn)品和吸食大麻器具的商店,而我的智能手機(jī)上的全球定位系統(tǒng)應(yīng)用軟件無法區(qū)分公寓和商鋪。我的車載導(dǎo)航與谷歌導(dǎo)航都告訴我,我今天晚上去了一趟毒品商店——這是我上床前查閱第二天的天氣預(yù)報(bào)時(shí),谷歌廣告推送告訴我的。 這不只是一場(chǎng)社交數(shù)據(jù)革命。 將欲取之,必先予之 每天都有10多億人像我這樣產(chǎn)生和分享社交數(shù)據(jù)。社交數(shù)據(jù)是有關(guān)你本人的信息,例如你的運(yùn)動(dòng)、行為、興趣,以及你和其他人、地點(diǎn)、產(chǎn)品,甚至意識(shí)形態(tài)之間的關(guān)系。其中有些數(shù)據(jù)是在你本人知情的前提下自愿分享的,例如在使用谷歌地圖時(shí)登錄并鍵入目的地;其他數(shù)據(jù)則并非如此,你經(jīng)常會(huì)在不經(jīng)意間就分享了自己的數(shù)據(jù),這是享受互聯(lián)網(wǎng)與移動(dòng)設(shè)備所帶來的便捷性過程的重要部分。顯然,在某些情況下,分享數(shù)據(jù)是你獲取服務(wù)的必要條件:如果你不向應(yīng)用軟件提供你當(dāng)前所在的位置和目的地,谷歌公司就無法為你找出最佳的行車路線。在某些情況下,你可能很樂意提供信息,例如你給某個(gè)朋友在臉譜網(wǎng)上的發(fā)帖點(diǎn)贊或在領(lǐng)英網(wǎng)上對(duì)同事的工作表示肯定,以表明你愿意以某種方式鼓勵(lì)和支持他。 社交數(shù)據(jù)有時(shí)可以做到比較精準(zhǔn),能將你的位置精確到1米之內(nèi)。但是,在通常情況下,社交數(shù)據(jù)都很粗略,有時(shí)也不夠完整。例如,除非我登錄可以顯示家中智能電表讀數(shù)的某個(gè)應(yīng)用(比如,為了查看我在去機(jī)場(chǎng)之前是否將家中所有的燈都關(guān)上了),電力公司才能知道我何時(shí)離家,但也僅限于此。這種數(shù)據(jù)過于粗略,也許對(duì)我沒有太大的幫助。與此相似,我在拜訪舊金山的那位新朋友時(shí),雖然社交數(shù)據(jù)可以準(zhǔn)確地顯示出我所在位置的經(jīng)度和緯度,但對(duì)我當(dāng)晚活動(dòng)的推測(cè)卻是完全錯(cuò)誤的。有時(shí)候,雖然數(shù)據(jù)看似十分精確,但在很大程度上這是數(shù)據(jù)解讀的結(jié)果。實(shí)際上,社交數(shù)據(jù)本身是非常粗略的。粗略的數(shù)據(jù)很可能不完整、易出錯(cuò),有時(shí)其中還會(huì)摻雜欺詐數(shù)據(jù)。 無論是被動(dòng)還是主動(dòng)分享的數(shù)據(jù)、強(qiáng)制還是自愿分享的數(shù)據(jù)、精確還是粗略的數(shù)據(jù),社交數(shù)據(jù)的總量呈指數(shù)增長(zhǎng)趨勢(shì)。如今,社交數(shù)據(jù)總量翻一番所需的時(shí)間只有18個(gè)月。在未來5年內(nèi),社交數(shù)據(jù)總量將增長(zhǎng)約10倍,或者說增長(zhǎng)一個(gè)數(shù)量級(jí);在未來10年內(nèi),社交數(shù)據(jù)總量將增長(zhǎng)約100倍。換言之,2000年全年產(chǎn)生的數(shù)據(jù)總量目前只需要1天即可完成。以這樣的增長(zhǎng)速度計(jì)算,預(yù)計(jì)到2020年,不到1個(gè)小時(shí)就能產(chǎn)生等量的數(shù)據(jù)。 要知道,“社交數(shù)據(jù)”并非僅適用于社交媒體的流行詞匯,這一點(diǎn)很關(guān)鍵。許多社交媒體平臺(tái)的設(shè)計(jì)旨在進(jìn)行播報(bào),以推特為例,溝通幾乎總是單向進(jìn)行的,由名人、權(quán)威人士或營(yíng)銷人士向公眾傳播信息。社交數(shù)據(jù)更加民主化,你可以通過推特或臉譜網(wǎng)分享你的信息、所在公司的信息、你的成果、你的看法,但你的電子蹤跡比這些更深遠(yuǎn)。根據(jù)你在谷歌網(wǎng)站上的搜索記錄、你在亞馬遜網(wǎng)站上的購(gòu)買記錄、你在訊佳普(Skype)上的通話記錄、你手機(jī)的實(shí)時(shí)定位,再將這些信息與其他多種渠道相結(jié)合,就能得出有關(guān)某個(gè)人的一幅獨(dú)特的“肖像畫”。 此外,社交數(shù)據(jù)不會(huì)止于你本人。在你展示自己通過與親朋好友、工作同事的溝通建立起的親密關(guān)系時(shí),你便創(chuàng)建并分享了數(shù)據(jù)。你所創(chuàng)建的社交數(shù)據(jù)不僅涉及友人,也會(huì)涉及陌生人,例如你在評(píng)價(jià)某件商品或在照片墻(Instagram)上傳照片時(shí)。空中食宿(Airbnb)是一個(gè)租用房間或套房的應(yīng)用平臺(tái),你若要注冊(cè)賬戶就需要驗(yàn)證身份——不僅要使用政府核發(fā)的身份證,還要使用你的臉譜網(wǎng)賬戶。社交數(shù)據(jù)正在嵌入你家中的智能溫度計(jì)、汽車的導(dǎo)航系統(tǒng)以及職場(chǎng)的辦公軟件,并開始成為教室與醫(yī)院診療室中的亮點(diǎn)。隨著手機(jī)配備了越來越多的傳感器和應(yīng)用,它們可在我們的家中、商場(chǎng)或單位里跟蹤我們的一舉一動(dòng)。你將越來越難以掌控有關(guān)你日;顒(dòng)的數(shù)據(jù),甚至包括你內(nèi)心中最隱秘的愿望。數(shù)據(jù)科學(xué)家將化身為偵探與藝術(shù)家,通過人們留下的電子蹤跡為他們繪制出越發(fā)清晰的行為素描畫。 通過檢查并提煉這些電子蹤跡,可以發(fā)現(xiàn)人們的偏好或傾向,還能做出預(yù)測(cè),例如人們可能會(huì)購(gòu)買何種商品。在我擔(dān)任亞馬遜公司首席科學(xué)家期間,我與杰夫·貝索斯共同制定了該公司的數(shù)據(jù)戰(zhàn)略和以客戶為中心的文化。我們開展了一系列實(shí)驗(yàn),比較網(wǎng)站編輯或消費(fèi)者所寫的商品評(píng)論中哪一種會(huì)讓客戶更開心,并觀察依據(jù)傳統(tǒng)的人口統(tǒng)計(jì)信息或個(gè)人點(diǎn)擊情況為客戶做推薦是否成功率更高。在舉辦廠商贊助的促銷活動(dòng)時(shí),我們發(fā)現(xiàn)真正的溝通可以爆發(fā)出巨大的力量。我們?yōu)閬嗰R遜開發(fā)個(gè)性化工具,使人們做出購(gòu)買決定的過程及所購(gòu)買的商品都產(chǎn)生了根本性改變,并且成為電子商務(wù)的標(biāo)準(zhǔn)。 離開亞馬遜之后,我在斯坦福大學(xué)和加利福尼亞大學(xué)伯克利分校為成千上萬的本科生和研究生開設(shè)了社交數(shù)據(jù)革命課程,還在中國(guó)上海的復(fù)旦大學(xué)與中歐國(guó)際商學(xué)院、北京的清華大學(xué)教授這門課程。我同時(shí)繼續(xù)經(jīng)營(yíng)社交數(shù)據(jù)實(shí)驗(yàn)室,成員是我在2011年結(jié)識(shí)的一群數(shù)據(jù)科研人員與思想領(lǐng)袖。在過去10年里,與我合作的公司包括阿里巴巴、美國(guó)電話電報(bào)公司、沃爾瑪、美國(guó)聯(lián)合健康保險(xiǎn)集團(tuán),以及一些大型航空公司、金融服務(wù)公司、交友網(wǎng)站。我積極倡導(dǎo)把數(shù)據(jù)的決策權(quán)與客戶或用戶分享,他們是與你我一樣的普通人。 沒有人能夠獨(dú)自處理當(dāng)下的所有數(shù)據(jù)并做出明智的決定。但在讓數(shù)據(jù)服務(wù)于我們的需要和解決問題的過程中,誰能夠獲得必要的工具呢?從這些數(shù)據(jù)中分析得出人們的偏好、傾向和做出預(yù)測(cè)后,是將其提供給少數(shù)強(qiáng)大的組織,還是提供給所有人使用呢?使用社交數(shù)據(jù)所需支付的費(fèi)用是多少呢? 隨著我們逐漸認(rèn)識(shí)到社交數(shù)據(jù)的價(jià)值,我相信我們的重點(diǎn)不僅是獲取數(shù)據(jù),還必須采取某些行動(dòng)。我們每天都會(huì)做出很多決定,而有些決定一生中只會(huì)做一次。但是,這并不意味著今天產(chǎn)生的社交數(shù)據(jù)的壽命很短。我們今天的行為方式可能會(huì)影響我們今后幾十年的選擇,很少有人能在短期或長(zhǎng)期內(nèi)觀察到自己的所有行為或分析出這些行為將如何影響自己。社交數(shù)據(jù)分析有助于我們找出各種可能性,但必須經(jīng)過深思熟慮方可做出最終選擇。 畢竟,這些科技無法了解我們每個(gè)人乃至整個(gè)社會(huì)對(duì)未來生活的憧憬。許多國(guó)家都出臺(tái)了法律,保護(hù)個(gè)人在就業(yè)或醫(yī)療方面不受歧視。未來某一天,這些法律或許將不復(fù)存在(在某些國(guó)家,直到現(xiàn)在也沒有這樣的法律)。假設(shè)你希望獲得有關(guān)減肥和鍛煉的建議,于是你決定在醫(yī)療應(yīng)用或網(wǎng)站上表達(dá)自己對(duì)膽固醇過高的擔(dān)心。這樣做會(huì)不會(huì)對(duì)你不利呢?如果法律規(guī)定,在醫(yī)生向你告知健康風(fēng)險(xiǎn)并推薦健康的生活方式之后,你仍然不愿意放棄吃油炸食品,依舊喜歡癱坐在沙發(fā)上,就可以依法對(duì)你收取更高的醫(yī)療費(fèi)用,你怎么辦?如果你的主管利用某種服務(wù)軟件在網(wǎng)上查找有關(guān)你的信息,他可能認(rèn)定你的生活方式不適合在他的公司任職,從而拒絕考慮你的求職申請(qǐng),你怎么辦?這些都是實(shí)實(shí)在在的風(fēng)險(xiǎn)。 如果這些數(shù)據(jù)是你獨(dú)立創(chuàng)建并透露出去的,那么,一旦察覺到風(fēng)險(xiǎn),你或許可以停止這種行為。這會(huì)給你帶來許多不便,卻是可行的。但是,人們對(duì)有關(guān)自己的許多數(shù)據(jù)并沒有掌控力。由于社交數(shù)據(jù)被公司和政府用于改善結(jié)果、提高效率,因此我們更不可能掌控這些數(shù)據(jù)。 社交數(shù)據(jù)關(guān)乎社會(huì)大眾,我們每個(gè)人都需要考慮怎樣做才是最好的數(shù)據(jù)利用方式?萍颊陲w速發(fā)展,收集和分析數(shù)據(jù)的公司主要從事信息的產(chǎn)出與編碼,并不負(fù)責(zé)制定原則。即使它們考慮那些原則性問題,也僅僅是因?yàn)闃I(yè)務(wù)需要而臨時(shí)為之。對(duì)人類未來會(huì)產(chǎn)生重大影響的原則性問題的決定權(quán),絕不應(yīng)該交到數(shù)據(jù)公司手中。 我們可以允許對(duì)所有這些數(shù)據(jù)進(jìn)行收集、合并、匯聚、分析,以便能在決策過程中更好地做出取舍。取舍是任何重要決策的必要組成部分,在做取舍時(shí),人的判斷十分關(guān)鍵。我們的生活不應(yīng)由數(shù)據(jù)來驅(qū)動(dòng),而應(yīng)讓數(shù)據(jù)為我們的生活服務(wù)。 后隱私時(shí)代的原則 我們已經(jīng)認(rèn)識(shí)到數(shù)據(jù)在生活中發(fā)揮著越來越重要的作用,也已經(jīng)采取了許多措施保護(hù)自身的利益。20世紀(jì)70年代,美國(guó)與歐洲針對(duì)信息的公平使用采取了大體相似的原則。人們有權(quán)知道誰在收集自己的數(shù)據(jù)以及這些數(shù)據(jù)的使用情況,當(dāng)發(fā)現(xiàn)數(shù)據(jù)不準(zhǔn)確時(shí),還可以要求修正數(shù)據(jù)。然而,對(duì)于今天的新型數(shù)據(jù)來源與分析方法,這些保護(hù)措施要么過于嚴(yán)厲,要么過于無力。 之所以說它們過于嚴(yán)厲,是因?yàn)檫@些措施都想當(dāng)然地認(rèn)為可以對(duì)收集到的所有數(shù)據(jù)添加標(biāo)簽。亞馬遜公司可能會(huì)以淺顯易懂的術(shù)語(yǔ),準(zhǔn)確地解釋它是如何使用收集到的個(gè)人信息的,它甚至能用這些信息幫助人們做出更明智的決定。但是,對(duì)這些信息進(jìn)行審查需要大量的時(shí)間。我們中有多少人會(huì)花時(shí)間對(duì)所有的相關(guān)數(shù)據(jù)進(jìn)行核查呢?查閱亞馬遜公司怎樣對(duì)每個(gè)數(shù)據(jù)點(diǎn)分配權(quán)重,會(huì)給你帶來什么好處,還是說你寧愿亞馬遜交給你一份數(shù)據(jù)使用簡(jiǎn)報(bào)呢? 之所以說這些保護(hù)措施過于無力,是因?yàn)榧幢隳隳軌蚝瞬槟銊?chuàng)建和分享的所有數(shù)據(jù),你也無法全盤掌握你的所有相關(guān)數(shù)據(jù),因?yàn)檫@其中包括其他人創(chuàng)建和分享的關(guān)于你的數(shù)據(jù),包括你的親朋好友、同事、老板。你在網(wǎng)上訪問的公司和你在實(shí)體世界中訪問的大部分公司也會(huì)產(chǎn)生(有時(shí)也會(huì)分享)關(guān)于你的數(shù)據(jù)。你在街上遇到的陌生人以及和你打交道的其他許多公共組織和私營(yíng)組織,同樣如此。誰來判定這些數(shù)據(jù)的準(zhǔn)確性呢?今天的數(shù)據(jù)來自諸多層面,人們無法擁有充分的權(quán)利來修正關(guān)于自己的數(shù)據(jù)。此外,即便是準(zhǔn)確的數(shù)據(jù)也可能對(duì)你不利。 數(shù)據(jù)的產(chǎn)生、溝通、處理過程中會(huì)發(fā)生巨大的定量變化和定性變化,僅有知情權(quán)與修正數(shù)據(jù)權(quán)顯然是不夠的。迄今為止,試圖修改這些指導(dǎo)原則的努力幾乎全都集中于個(gè)人掌控權(quán)與隱私權(quán)這兩個(gè)方面。不幸的是,其理念與實(shí)踐從技術(shù)上看已經(jīng)落后達(dá)一個(gè)世紀(jì)之久。而且,控制與隱私權(quán)的標(biāo)準(zhǔn)迫使人們與數(shù)據(jù)公司簽下不平等合約。如果你希望用數(shù)據(jù)改善你的決策過程,你就必須同意按照數(shù)據(jù)采集者的條款收集自己的數(shù)據(jù)。一旦你這樣做,就說明數(shù)據(jù)公司已經(jīng)按照法律規(guī)定為你賦予了個(gè)人數(shù)據(jù)的“控制權(quán)”,而無須考慮你是否真正擁有選擇權(quán)或你的個(gè)人隱私權(quán)是否會(huì)受到影響。如果你希望保護(hù)個(gè)人隱私,就不應(yīng)該同意數(shù)據(jù)公司收集你的數(shù)據(jù),但這會(huì)犧牲你對(duì)相關(guān)數(shù)據(jù)產(chǎn)品與服務(wù)的使用權(quán),降低你從自己的數(shù)據(jù)中所能獲得的價(jià)值。只有這樣,你才能對(duì)你的數(shù)據(jù)保持掌控權(quán)。 如今,我們需要做的是制定一套標(biāo)準(zhǔn),幫助我們?cè)u(píng)估因分享和收集數(shù)據(jù)所產(chǎn)生的風(fēng)險(xiǎn)與回報(bào),同時(shí)擁有對(duì)數(shù)據(jù)公司進(jìn)行問責(zé)的權(quán)利;20年來與數(shù)據(jù)公司的合作經(jīng)驗(yàn),我認(rèn)為透明性與主動(dòng)性原則最有可能保護(hù)我們免遭社交數(shù)據(jù)濫用的傷害,并能提高我們從中得到的價(jià)值。 透明性涵蓋了個(gè)人對(duì)自己數(shù)據(jù)的知情權(quán):內(nèi)容是什么?用途是什么?對(duì)用戶的好處是什么?數(shù)據(jù)公司是躲在單向鏡的另一面暗中窺探你的隱私,還是也給你打開一扇窗戶,讓你看到它們?nèi)绾问褂媚愕臄?shù)據(jù),從而判斷該公司的利益是否(以及何時(shí))與你的自身利益一致?你需要分享多少數(shù)據(jù),方能獲得你想要的數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務(wù)呢?從歷史上看,機(jī)構(gòu)與個(gè)人之間存在巨大的信息不對(duì)稱的情況,這使機(jī)構(gòu)占據(jù)巨大的優(yōu)勢(shì)。機(jī)構(gòu)不僅有強(qiáng)大的能力收集個(gè)人數(shù)據(jù),還能將你的數(shù)據(jù)與他人的數(shù)據(jù)做比較。你需要了解你提供的數(shù)據(jù)與你得到的數(shù)據(jù)產(chǎn)品與服務(wù)是否對(duì)等。 相對(duì)于客戶與零售商之間的傳統(tǒng)關(guān)系,亞馬遜是如何讓購(gòu)物體驗(yàn)具備透明性的呢?當(dāng)你打算購(gòu)買一件商品時(shí),零售商會(huì)提醒你之前購(gòu)買過這件商品嗎?這樣做會(huì)讓他損失一單生意。在亞馬遜網(wǎng)站上,如果你點(diǎn)擊購(gòu)買已在這家網(wǎng)站上買過的書籍,就會(huì)看到網(wǎng)站的提示:“你確定要買這本書嗎?你在2013年12月17日買過這本書!比绻阗I過某張音樂專輯中的一首歌曲,之后決定購(gòu)買該專輯的其他所有歌曲時(shí),亞馬遜在“完成購(gòu)買”環(huán)節(jié)會(huì)自動(dòng)從這張專輯的價(jià)格中減去你之前所購(gòu)歌曲的金額。亞馬遜對(duì)人們的購(gòu)買數(shù)據(jù)采取這種使用方式,是為了最大限度地減少客戶的不滿。與此相似,大多數(shù)航空公司的常飛旅客計(jì)劃都會(huì)給客戶發(fā)送信息,提醒其即將過期的里程數(shù),而不是放任其作廢。 不幸的是,透明性遠(yuǎn)未成為通行的標(biāo)準(zhǔn)。以給客戶服務(wù)中心打電話這種典型的體驗(yàn)為例,撥通電話后,你肯定會(huì)聽到一番警告:“為保證服務(wù)質(zhì)量,本次通話可能會(huì)被錄音!蹦銊e無選擇,如果你想與客服代表通話,就必須接受這樣的條款。就算要錄音,為什么只有公司有權(quán)獲得此次通話的錄音呢?如果只有通話的一方擁有獲取此次通話錄音的權(quán)利,那么“為保證服務(wù)質(zhì)量”又意味著什么呢?數(shù)據(jù)對(duì)等原則意味著付款的客戶同樣可以獲得錄音。 無論何時(shí),只要我聽到客戶服務(wù)代表說通話可能會(huì)被錄音時(shí),我就會(huì)對(duì)他說,我也可能會(huì)對(duì)此次通話錄音,以保證我所獲得的服務(wù)質(zhì)量。在大多數(shù)情況下,客服代表都會(huì)選擇與我合作,但偶爾也會(huì)直接掛斷電話。當(dāng)然,我也會(huì)在不征求客服代表同意的情況下自行對(duì)通話進(jìn)行錄音,但我要說明一點(diǎn),這種做法在某些地方是違法的。如果我沒有獲得客服代表對(duì)我承諾的服務(wù)時(shí),我就會(huì)利用手頭的證據(jù)向他的主管投訴。如果這樣做仍然無效,我就會(huì)將音頻文件上傳到網(wǎng)上,希望通過音頻文件的傳播催促該公司迅速解決我的問題。就像康卡斯特公司曾經(jīng)遇到的情況一樣,當(dāng)時(shí)客戶想取消服務(wù),但是反復(fù)遭到該公司的拒絕,最終客戶將通話錄音發(fā)布在推特上才如愿以償。 通過這種方式,你不必違反法律就可以擺脫不平等的對(duì)待。為了讓透明性成為新的默認(rèn)原則,數(shù)據(jù)公司需要向公眾提供更多的信息而不是更少的信息。 但僅有透明性是不夠的,你還需要主動(dòng)性,主動(dòng)性包含個(gè)人根據(jù)自己的數(shù)據(jù)采取行動(dòng)的權(quán)利。數(shù)據(jù)公司的“默認(rèn)”設(shè)置一目了然嗎?你能夠出于種種原因修改你的數(shù)據(jù)嗎?你能隨心所欲地使用公司產(chǎn)生的數(shù)據(jù)嗎?你是被誘導(dǎo)(或被迫)從有限的幾個(gè)選項(xiàng)中做出選擇(這些選項(xiàng)幾乎都更有利于數(shù)據(jù)公司)嗎?你能修改參數(shù)并探索不同的情景,以發(fā)現(xiàn)種種可能性嗎?主動(dòng)性是個(gè)人根據(jù)數(shù)據(jù)公司所發(fā)現(xiàn)的關(guān)于他的偏好與行為模式進(jìn)行選擇的權(quán)利,包括要求數(shù)據(jù)公司按照他提出的條件向他提供信息的權(quán)利。 在基本層面上,主動(dòng)性關(guān)乎人們有能力創(chuàng)造出有利于自己的數(shù)據(jù)。亞馬遜公司一直堅(jiān)持原原本本地在網(wǎng)頁(yè)上呈現(xiàn)客戶的評(píng)論,無論評(píng)論是好是壞,是五星還是一星,是為了獲得他人的認(rèn)同還是為了實(shí)現(xiàn)成為圖書評(píng)論家這一人生理想,都沒有關(guān)系。亞馬遜更看重的是,這些評(píng)論與其他想購(gòu)買圖書的客戶之間的關(guān)系。比如,通過評(píng)論發(fā)現(xiàn),雖然客戶沒有選擇退貨,但對(duì)此次購(gòu)買的商品不太滿意。這些數(shù)據(jù)有助于客戶判斷某件推薦商品是不是自己的最佳選擇,由此亞馬遜公司給了客戶更大的主動(dòng)性。 許多營(yíng)銷人士津津樂道于市場(chǎng)定位、市場(chǎng)細(xì)分與轉(zhuǎn)化。我不了解你們的想法,但我不想被定位、細(xì)分、轉(zhuǎn)化,也不想被剖析,這些不是主動(dòng)性的表達(dá)方式。我們不能想當(dāng)然地認(rèn)為每個(gè)公司都會(huì)主動(dòng)遵循透明性與主動(dòng)性原則。我們還必須超越這些原則:我們需要擁有明確的權(quán)利,這有助于我們表達(dá)自己的愿望,將透明性與主動(dòng)性轉(zhuǎn)化為實(shí)實(shí)在在的工具。 如果我們能促使數(shù)據(jù)公司同意提供一系列有意義的權(quán)利與工具,就能產(chǎn)生我所說的“關(guān)系反轉(zhuǎn)”,即對(duì)個(gè)人與機(jī)構(gòu)之間的傳統(tǒng)關(guān)系予以逆轉(zhuǎn)。亞馬遜公司決定由客戶撰寫大部分商品評(píng)論,這也屬于關(guān)系反轉(zhuǎn),社交數(shù)據(jù)革命將會(huì)提供更多這樣的機(jī)會(huì)。隨著人們擁有越來越多的工具去幫助自己做出更好的決定,過去公司常用的市場(chǎng)營(yíng)銷手段的效果將會(huì)越來越差。由公司告訴處于弱勢(shì)地位的客戶應(yīng)該購(gòu)買何種商品,這個(gè)時(shí)代已經(jīng)一去不復(fù)返了。而且很快,就會(huì)由你來告訴公司應(yīng)該為你做些什么。在某些地方,人們已經(jīng)體會(huì)到這種變化了。 關(guān)系反轉(zhuǎn)是物理學(xué)家觀察世界的重要方式。關(guān)系反轉(zhuǎn)經(jīng)常與相變聯(lián)系在一起,后者指的是外部條件導(dǎo)致物質(zhì)屬性發(fā)生突變——當(dāng)加熱到沸騰狀態(tài)時(shí),水就會(huì)從液態(tài)變?yōu)闅鈶B(tài)。日益增加的數(shù)據(jù)量對(duì)社會(huì)所產(chǎn)生的影響就相當(dāng)于物理系統(tǒng)中熱量的增加。在某些條件下——當(dāng)數(shù)據(jù)公司遵循透明性與主動(dòng)性原則時(shí),就會(huì)產(chǎn)生關(guān)系反轉(zhuǎn),也就是說,這更有利于個(gè)人而非公司或公司的首席市場(chǎng)官。 我們所有人的利益都與此次社交數(shù)據(jù)革命息息相關(guān)。如果你希望從社交數(shù)據(jù)中獲益,就必須分享自己的信息。你從社交數(shù)據(jù)中獲得的價(jià)值通常在于你擁有了更強(qiáng)的決策能力,即在促成交易的談判中、購(gòu)買產(chǎn)品與服務(wù)時(shí)、申請(qǐng)貸款的過程中、尋找工作時(shí)、獲取教育與醫(yī)療時(shí)、改善你所在社區(qū)的硬件時(shí),你可以做出更明智的決定。你在分享數(shù)據(jù)時(shí)所付出的代價(jià)與承擔(dān)的風(fēng)險(xiǎn)不應(yīng)大于你所獲得的收益。數(shù)據(jù)公司收集的數(shù)據(jù)及其采取的行動(dòng)應(yīng)具有透明性,這一點(diǎn)至關(guān)重要。另外,你還需要對(duì)數(shù)據(jù)產(chǎn)品與服務(wù)擁有一定的掌控力。否則,人們?nèi)绾闻袛嘧约核@得的收益是否大于付出的代價(jià)呢? 新的游戲規(guī)則 信息是權(quán)力的中心。如果你擁有的信息比別人多,那么你很可能從中獲利,這就像二手車銷售員將劣質(zhì)車推銷給不明真相的客戶一樣。隨著溝通與處理過程變得越來越便宜和普及,巨大的信息不對(duì)稱風(fēng)險(xiǎn)發(fā)生的可能性將越來越大,因?yàn)闆]有人能夠掌握所有數(shù)據(jù)。 在這些產(chǎn)生和分享的數(shù)據(jù)中,有許多是關(guān)于我們的個(gè)人生活的:居住的地點(diǎn)、工作的地點(diǎn)、前往的地點(diǎn),喜歡的人、不喜歡的人、陪伴的人、共進(jìn)午餐的人,運(yùn)動(dòng)量、服用的藥物、家用電器、觸動(dòng)心靈的雜志。我們的生活在數(shù)據(jù)公司面前是透明的,這些公司收集并分析我們的數(shù)據(jù),有時(shí)它們還會(huì)私自銷售我們的數(shù)據(jù),或者擅自保存我們的數(shù)據(jù)。在個(gè)人數(shù)據(jù)被修改、交換、銷售的過程中,我們需要擁有一定的發(fā)言權(quán),此外我們還要對(duì)個(gè)人數(shù)據(jù)的使用制定更多的條款。雙方(數(shù)據(jù)創(chuàng)建者與數(shù)據(jù)公司)都必須遵循透明性與主動(dòng)性原則。 這需要我們從根本性上改變對(duì)數(shù)據(jù)和自我的看法。在第1章中,我會(huì)介紹數(shù)據(jù)公司分析數(shù)據(jù)的幾種方式,并以提煉過程做類比,說明公司如何將原始數(shù)據(jù)轉(zhuǎn)化為產(chǎn)品與服務(wù)。我將在第2章中討論個(gè)人及其特點(diǎn),并論述我們?cè)谏钪辛粝碌碾娮盂欅E是如何破壞我們的隱私性幻覺的(搜索、點(diǎn)擊、評(píng)論、使用與刷卡),并在此過程中產(chǎn)生了新的身份概念。無論我們是否愿意,都發(fā)出了自己興趣的真實(shí)信號(hào)。在第3章中,我將論述重點(diǎn)從個(gè)人轉(zhuǎn)移到人與人之間的關(guān)系,以及社交網(wǎng)絡(luò)怎樣展示并影響數(shù)字化時(shí)代的信任。在第4章中,隨著各種傳感器(不只是攝像頭)的聯(lián)網(wǎng),我將介紹人們?nèi)绾卫镁_度越來越高的手段記錄我們所在的環(huán)境,以及數(shù)據(jù)公司如何分析這些傳感器收集的數(shù)據(jù),并推斷出人們的位置、情緒狀態(tài)與興趣。 在此基礎(chǔ)上,我提出了6項(xiàng)權(quán)利。為了確保未來我們的數(shù)據(jù)能夠真正為我們服務(wù),我認(rèn)為這些權(quán)利十分關(guān)鍵。其中有兩項(xiàng)權(quán)利是訪問數(shù)據(jù)的權(quán)利與核實(shí)數(shù)據(jù)的權(quán)利,它們旨在提高透明性。其余4項(xiàng)權(quán)利主要通過主動(dòng)性原則使人們對(duì)自身數(shù)據(jù)具有更強(qiáng)的掌控力,包括修正數(shù)據(jù)的權(quán)利、對(duì)數(shù)據(jù)進(jìn)行模糊處理的權(quán)利、利用數(shù)據(jù)開展實(shí)驗(yàn)的權(quán)利、將數(shù)據(jù)導(dǎo)出給其他公司的權(quán)利。通過對(duì)個(gè)人數(shù)據(jù)行使上述權(quán)利,就能對(duì)我們的購(gòu)物方式、支付與投資方式、工作方式、生活方式、學(xué)習(xí)方式、使用公共資源的方式等產(chǎn)生影響。在最后一章中,我將論述如何實(shí)現(xiàn)這6項(xiàng)權(quán)利。 在這個(gè)時(shí)代的轉(zhuǎn)折點(diǎn)上,人們正在界定創(chuàng)建數(shù)據(jù)的人與把數(shù)據(jù)轉(zhuǎn)化成產(chǎn)品和服務(wù)的組織之間的關(guān)系。不僅游戲規(guī)則正在改變,從性質(zhì)上看,我們正在玩的這個(gè)新游戲還要求我們重新界定客戶與零售商、投資者與銀行、雇主與雇員、患者與醫(yī)生、學(xué)生與老師、公民與政府之間的關(guān)系。此時(shí),我們應(yīng)當(dāng)表明立場(chǎng)并真正了解數(shù)據(jù)的用途,以便能夠獲得利益并清楚由此產(chǎn)生的結(jié)果。只有這樣,我們才能評(píng)估我們的利益是否與數(shù)據(jù)公司的利益一致。對(duì)于大多數(shù)新科技而言,并非機(jī)器決定一切。只要人們使用機(jī)器,調(diào)整自己的期望,并在此過程中修訂社會(huì)規(guī)范,社交數(shù)據(jù)革命就會(huì)悄然而至。 如果我們迎接這場(chǎng)挑戰(zhàn),數(shù)據(jù)就有可能由取之于民、歸之于民演變?yōu)橛弥诿。讓我們一起投身于這場(chǎng)革命吧!
安德雷斯·韋思岸(Andreas Weigend),世界上杰出的大數(shù)據(jù)、移動(dòng)社交技術(shù)和消費(fèi)者行為專家之一,美國(guó)首席科學(xué)家。
他在美國(guó)斯坦福大學(xué)、加州大學(xué)伯克利分校和中國(guó)復(fù)旦大學(xué)任教,還是社交數(shù)據(jù)實(shí)驗(yàn)室(Social Data Lab)的創(chuàng)始人和負(fù)責(zé)人。 他住在加利福尼亞舊金山。
序 言 當(dāng)你的一切都被記錄在案時(shí) // VII
引 言 社交數(shù)據(jù)革命 // 001 第1 章 培養(yǎng)數(shù)據(jù)素養(yǎng) 數(shù)據(jù)挖掘的力量 // 020 你的數(shù)據(jù)有什么價(jià)值? // 024 老虎機(jī)與挑剔的相親者 // 031 通過機(jī)器學(xué)習(xí)發(fā)現(xiàn)錯(cuò)誤 // 034 用數(shù)據(jù)模型輔助決策 // 038 實(shí)驗(yàn)!實(shí)驗(yàn)!實(shí)驗(yàn)! // 043 第2 章 數(shù)字身份與真實(shí)身份 隱私權(quán)簡(jiǎn)史 // 053 從密不透風(fēng)到公之于眾 // 057 在互聯(lián)網(wǎng)上,所有人都知道你是誰 // 061 使用假名的利與弊 // 067 真實(shí)的信號(hào) // 074 隱私權(quán)和責(zé)任心不可兼得 // 078 第3 章 社交圖譜與信任系數(shù) 大數(shù)據(jù)時(shí)代的人際關(guān)系 // 090 “動(dòng)態(tài)信息”功能與“分享所愛”計(jì)劃 // 097 為擁有數(shù)據(jù)的人提供服務(wù) // 101 社交數(shù)據(jù)的影響力有多大 // 111 信任的價(jià)值 // 119 建設(shè)積極的決策環(huán)境 // 127 第4 章 傳感器數(shù)據(jù)大爆炸的時(shí)代 如何充分挖掘傳感器數(shù)據(jù)的價(jià)值 // 138 雇用私家偵探的做法過時(shí)了! // 143 人工智能時(shí)代的讀心術(shù) // 155 特克斯勒消逝效應(yīng)與專注力 // 162 一次杜撰出來的“度假之旅” // 171 第5 章 計(jì)算隱私效率與數(shù)據(jù)回報(bào) 用戶訪問自己數(shù)據(jù)的權(quán)利 // 180 用戶檢查數(shù)據(jù)挖掘過程的權(quán)利 // 186 用自己的數(shù)據(jù)投票 // 205 第6 章 讓數(shù)據(jù)為你服務(wù) 擁有修正數(shù)據(jù)的權(quán)利 // 213 擁有對(duì)數(shù)據(jù)進(jìn)行模糊處理的權(quán)利 // 219 擁有用數(shù)據(jù)開展實(shí)驗(yàn)的權(quán)利 // 224 擁有自主導(dǎo)入和導(dǎo)出數(shù)據(jù)的權(quán)利 // 229 人類擅長(zhǎng)的事和機(jī)器擅長(zhǎng)的事 // 234 第7 章 把未來創(chuàng)造出來 按照你自己的需求購(gòu)買產(chǎn)品與服務(wù) // 240 金融的未來 // 245 公平的職場(chǎng) // 250 在數(shù)字課堂上學(xué)習(xí) // 258 精確地界定我們對(duì)數(shù)據(jù)的需求 // 262 決策的量化 // 271 后 記 走出洞穴,沐浴陽(yáng)光 // 277 致 謝 // 281
人工智能時(shí)代的讀心術(shù)
加利福尼亞大學(xué)舊金山分校的心理學(xué)榮譽(yù)退休教授保羅·艾克曼(Paul Ekman)一直在研究6種基本情感的生理效應(yīng)。這6種情感分別是生氣、傷心、害怕、蔑視、驚訝和愉快。艾克曼讓來自5個(gè)不同國(guó)家(智利、阿根廷、巴西、日本和美國(guó))的人看這6種情感狀態(tài)的照片,并觀察他們有何反應(yīng)。他預(yù)測(cè)文化環(huán)境的不同會(huì)導(dǎo)致人們的反應(yīng)各異,但結(jié)果證明他錯(cuò)了。這個(gè)實(shí)驗(yàn)重復(fù)了許多次,他發(fā)現(xiàn)人們?cè)诳凑掌瑫r(shí)都會(huì)產(chǎn)生相同的表情:與生氣相關(guān)的是眉頭緊鎖,眉毛和嘴角下垂表示看到的是傷心的照片,皺鼻子表示蔑視,與真誠(chéng)笑容相關(guān)的是眼角紋。(禮節(jié)性假笑——因?yàn)榉好篮娇展镜某藙?wù)人員總是面帶這種笑容,因此又被稱作“泛美式微笑”——往往只有嘴部有變化。)1978年,艾克曼與他的同事華萊士·弗里森(Wallace V. Friesen)通過總結(jié)他們觀察到的所有表情,建立“面部表情編碼系統(tǒng)”(FACS)。根據(jù)FACS,幾名機(jī)器學(xué)習(xí)研究人員開發(fā)出了人臉識(shí)別軟件。 圖4–1·真誠(chéng)微笑(左)與禮節(jié)性微笑(右)的對(duì)比。人在真正高興時(shí), 他的眼角與嘴角的肌肉都會(huì)運(yùn)動(dòng),導(dǎo)致皮膚產(chǎn)生皺紋 資料來源:由保羅·艾克曼博士和保羅·艾克曼有限責(zé)任公司提供。 艾克曼假設(shè),情感具有普遍性,因?yàn)榍楦惺欠从澄覀兊男睦頎顩r和彼此關(guān)系的真實(shí)信號(hào)。隨著實(shí)地研究與實(shí)驗(yàn)的進(jìn)行,他發(fā)現(xiàn)每種基本情感還與其他生理指標(biāo)有關(guān),例如心率、呼吸率、血流量和肌張力等。有時(shí),人們的情感變化非?欤绻蛔⒁,甚至難以捕捉到情感變化的過程。這些“微表情”常常意味著這個(gè)人不想表露自己的情感,或者他沒有意識(shí)到自己的這種情感。由于這些表情稍縱即逝(持續(xù)時(shí)間大約只有1/5秒),沒有經(jīng)過專業(yè)訓(xùn)練的話,是很難發(fā)現(xiàn)的,需要借助回放視頻才能看到。 艾克曼曾經(jīng)在圣迭戈一家名叫Emotient的公司擔(dān)任顧問,該公司開發(fā)出了可以從攝像頭記錄的原始數(shù)據(jù)中實(shí)時(shí)識(shí)別情感的軟件。2007年,Emotient公司推出的第一個(gè)商業(yè)應(yīng)用程序是 “笑臉檢測(cè)程序”,可以安裝到索尼數(shù)碼相機(jī)上。當(dāng)取景框里的人露出笑容時(shí),該程序會(huì)立即搶拍。隨著Emotient公司的算法不斷進(jìn)步,一臺(tái)高清照相機(jī)就可以監(jiān)控同處一室的400人),同時(shí)“讀取”他們臉上的微表情。該公司還打算將這款軟件推廣到醫(yī)學(xué)療域,用于捕捉患兒臉上的痛苦表情。事實(shí)上,研究表明,在捕捉身體不適的真實(shí)信號(hào)這個(gè)方面,計(jì)算機(jī)強(qiáng)于人類。Emotient公司與谷歌早期合作開發(fā)的一種眼鏡應(yīng)用程序被推銷給公司管理者,幫助他們了解員工的精神面貌,以及情感對(duì)顧客購(gòu)買行為(買什么?從誰那兒買?)的影響力。2016年1月,Emotient公司被蘋果公司收購(gòu)。 倫敦的Realeyes公司也引進(jìn)了艾克曼的研究成果,以評(píng)估人們?cè)诳吹綇V告視頻時(shí)的面部表情。廣告顯示屏可能是某個(gè)人的電腦顯示器,也可能是安裝在公共場(chǎng)所的顯示屏。電子產(chǎn)品生產(chǎn)商LG開展的“舞臺(tái)恐懼癥”廣告活動(dòng)就以男廁所為廣告背景。廁所的小便池上方裝有LG顯示器,當(dāng)有男子來小便時(shí),屏幕上就有一名女子把廣告推開,擺出一副能看見男子小便的姿態(tài)。據(jù)Realeyes面部表情分析攝像頭的觀察,這些男子的表情由困惑、害怕變成高興。分析結(jié)果甚至表明,有一部分男子在視頻開始和結(jié)束時(shí)都表現(xiàn)出厭惡的情緒。麻省理工學(xué)院媒體實(shí)驗(yàn)室情感計(jì)算小組找到Affectiva公司,合作研發(fā)可以幫助孤獨(dú)癥患者解讀他人面部表情的情感警報(bào)系統(tǒng),從而與Realeyes公司形成了競(jìng)爭(zhēng)關(guān)系。商業(yè)客戶請(qǐng)Affectiva公司檢測(cè)人們對(duì)廣告視頻的情感反應(yīng),民意調(diào)查公司則用它來統(tǒng)計(jì)電視辯論期間政治候選人的支持率情況。 在收集、分析人的情感數(shù)據(jù)時(shí),除面部表情外還有眾多數(shù)據(jù)來源。人說話的音調(diào)、音量(聲強(qiáng))、語(yǔ)音質(zhì)量、持續(xù)時(shí)間和語(yǔ)速等也能反映人的情感狀況。為了創(chuàng)建情感語(yǔ)音檢測(cè)系統(tǒng),一些研究人員從5個(gè)說英語(yǔ)的國(guó)家(澳大利亞、肯尼亞、印度、新加坡和美國(guó))雇用了100名演員,請(qǐng)他們聲情并茂地把一些簡(jiǎn)單的文本(諸如日期和數(shù)字)表達(dá)出來。 研究人員認(rèn)為,這些語(yǔ)音表達(dá)過于“裝腔作勢(shì)”,不能成功地訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng)實(shí)時(shí)處理真實(shí)的人際對(duì)話。一些近期的研究旨在利用客戶呼叫中心的海量數(shù)據(jù),建立情感圖書館。呼叫中心安排業(yè)務(wù)代表在接聽電話的過程中記錄客戶的情感狀態(tài),在音頻記錄上添加標(biāo)簽,以創(chuàng)建用于機(jī)器學(xué)習(xí)的數(shù)據(jù)。人們已經(jīng)在利用這些添加了惱怒、溫和、激烈、中性等標(biāo)簽的語(yǔ)音(甚至包括“啊”、“哦”、“嗯”、“好的”等非常簡(jiǎn)單的言語(yǔ)),對(duì)語(yǔ)音識(shí)別系統(tǒng)進(jìn)行訓(xùn)練。在某些情況下,語(yǔ)音信號(hào)與用戶滿意度調(diào)查數(shù)據(jù)相結(jié)合,可以驗(yàn)證情感檢測(cè)系統(tǒng)的準(zhǔn)確性。 云聯(lián)絡(luò)中心服務(wù)提供商LiveOps公司、人工智能公司Mattersight等利用語(yǔ)音檢測(cè)軟件為客戶安排服務(wù)代表。如果客戶有很重的地方口音,就為他安排一名家在該地區(qū)的客服代表,讓他們進(jìn)行更有本地特色的交流吧。如果客戶聽到呼叫中心的選擇菜單后立即做出選擇,這可能意味著這名客戶十分生氣。應(yīng)該怎么辦呢?把他的電話轉(zhuǎn)接給善于處理難題、應(yīng)對(duì)挑剔客戶的服務(wù)代表。如果客服代表已經(jīng)竭盡全力,仍沒讓客戶平靜下來,而且客戶的聲音越來越大、越來越尖利,這個(gè)呼叫就會(huì)升級(jí),交由業(yè)務(wù)經(jīng)理處理。除了這些音頻數(shù)據(jù),LiveOps公司還會(huì)針對(duì)客戶投訴搜索社交媒體和其他數(shù)據(jù)源,尋找更多的背景資料。有的客戶很快就和呼叫中心的客服代表建立了融洽的關(guān)系,這次投訴可能就不難處理,而且客服代表還有可能說服這名顧客購(gòu)買產(chǎn)品或服務(wù)。人工智能公司Mattersight宣稱可以根據(jù)客戶的性格類型安排客服代表,為客戶提供更有針對(duì)性的服務(wù)。該公司利用交流記錄分析對(duì)話內(nèi)容與方式,把客戶分為“開朗、尖刻、嚴(yán)肅、內(nèi)向”等類型,并把客戶的電話轉(zhuǎn)接給善于同這種性格類型的客戶打交道的客服代表,以增加顧客的滿意度。這種安排的依據(jù)是性格類型,而不是呼叫本身的特點(diǎn)。該公司的很多客戶都是需要經(jīng)常與客戶交互的企業(yè),例如醫(yī)療保健企業(yè)、保險(xiǎn)公司和電話公司。 算法還給那些缺乏表達(dá)能力的人帶來了福利。人們常說,父母可以分辨嬰兒哭聲傳遞出的情感需求。但總的來說,這種能力不具有科學(xué)性,顯而易見的原因就是可供父母學(xué)習(xí)的樣本太小。在與周圍世界交互的過程中,人和機(jī)器為交互數(shù)據(jù)建立模型的方式存在若干不同之處,樣本大小是一個(gè)明顯的不同點(diǎn)。參與開發(fā)谷歌無人駕駛汽車項(xiàng)目、教育領(lǐng)域初創(chuàng)企業(yè)優(yōu)達(dá)學(xué)城(Udacity)的聯(lián)合創(chuàng)始人塞巴斯蒂安·特隆(Sebastian Thrun)指出,駕駛員憑借個(gè)人經(jīng)驗(yàn)開車,而谷歌無人駕駛汽車可以從所有無人駕駛汽車犯下的錯(cuò)誤中汲取教訓(xùn),提高駕駛技術(shù)。人主要是從自己的成敗經(jīng)歷中吸取經(jīng)驗(yàn),社交圖譜中其他人的成敗僅起到輔助作用。此外,他們還可以征求專家的建議。相比之下,機(jī)器不僅可以直接從它們犯下的錯(cuò)誤中吸取經(jīng)驗(yàn),還可以從其他機(jī)器所犯的錯(cuò)誤中得到教訓(xùn)。 IBM的迪米特里·坎尼夫斯基(Dimitri Kanevsky)和同事開發(fā)的一項(xiàng)專利技術(shù),可以從嬰兒的啼哭聲和大腦、心臟及肺部活動(dòng)中采集數(shù)據(jù),開展學(xué)習(xí)。嬰兒哭鬧的原因有很多,有時(shí)是為了引起注意,有時(shí)是因?yàn)楣陋?dú)。數(shù)據(jù)服務(wù)商可以幫助父母?jìng)兏鼫?zhǔn)確地監(jiān)控孩子的情感狀態(tài),并依此做出決策。 將來,除了面部表情、啼哭聲的音調(diào)和音量以外,應(yīng)用程序還可以根據(jù)其他更微妙的線索探查我們的情感狀況。一些活動(dòng)追蹤系統(tǒng)(例如Fitbit記錄器、Withings Pulse智能手環(huán)、佳明智能手表)可以記錄人們的生命體征,包括靜態(tài)心率和運(yùn)動(dòng)心率,這些生命體征可能與某些情感狀態(tài)有關(guān)。血液流經(jīng)身體時(shí),皮膚上的紅色會(huì)加深,因此利用紅外傳感器(例如,蘋果手表后蓋上的傳感器)就可以測(cè)心率。因?yàn)榕宕髟谏眢w上的設(shè)備在推擠碰撞時(shí)容易松開,所以很多醫(yī)院為了得到更準(zhǔn)確的測(cè)量結(jié)果,改用紅外攝像頭監(jiān)控病人的心跳。Xbox家用電視游戲機(jī)利用紅外線追蹤玩家身體活動(dòng)的幅度,實(shí)時(shí)了解他們興奮或無聊的程度,并據(jù)此推出了一個(gè)又一個(gè)新游戲。 在生物醫(yī)學(xué)層面上,情感更難遁形。驗(yàn)血可以發(fā)現(xiàn)與害怕、緊張、疲勞有關(guān)的生物化學(xué)物質(zhì),驗(yàn)汗也可以實(shí)現(xiàn)相同的目的。在美國(guó)國(guó)防部的資助下,通用電氣公司成功地研發(fā)出Fearbit,它是一種可以吸附到皮膚上的無線傳感器,外形與邦迪創(chuàng)可貼相似。朝向皮膚的那一面是納米結(jié)構(gòu),可以吸附特定的生化物質(zhì)。如果這些生化物質(zhì)的含量升高,它還會(huì)發(fā)出警報(bào)!靶崽健笨諝庵谢衔锏膫鞲衅鞯捏w積非常小,可以安裝到手機(jī)中。用石墨烯制造的傳感器具有非常高的靈敏度,可以檢測(cè)濃度在10億分率量級(jí)的分子。早前的一項(xiàng)研究表明,我們甚至可以通過人的呼吸檢測(cè)他的緊張情緒。 在具體環(huán)境中綜合使用多種情感傳感器,可以產(chǎn)生革命性的效果。例如,麻省理工學(xué)院媒體實(shí)驗(yàn)室情感計(jì)算小組的幾名研究生提議研發(fā)“AutoEmotive”(自動(dòng)電子功能)系統(tǒng),將幾種既有的傳感器嵌入汽車操作系統(tǒng),改善駕駛員的健康與安全狀況。在方向盤上安裝傳感器,可以監(jiān)控與緊張情緒有關(guān)的重要生物指標(biāo),包括掌心出汗、心率、呼吸和手掌抓握力等。利用麥克風(fēng)監(jiān)控所有語(yǔ)音的音調(diào)和音量,可以判斷警報(bào)針對(duì)的是暫時(shí)性情況還是不斷加劇的沮喪情緒。一臺(tái)車載記錄儀可以提供駕駛員微表情的精準(zhǔn)數(shù)據(jù)。如果駕駛員表現(xiàn)得十分緊張,數(shù)據(jù)服務(wù)商就會(huì)給他推薦一條更通暢的路線,或者讓汽車音響播放舒緩的音樂。駕駛員可以從汽車儀表盤背景燈的顏色變化了解自己的情緒狀態(tài),并根據(jù)生物反饋?zhàn)龀龈髦堑臎Q定。AutoEmotive的目標(biāo)是幫助人們?cè)跇O易導(dǎo)致“視野狹窄”的高度緊張的情況下做到應(yīng)對(duì)自如,這與埃里克·霍爾維茨為美國(guó)國(guó)家航空航天局地面控制臺(tái)設(shè)計(jì)數(shù)據(jù)優(yōu)化顯示系統(tǒng)的初衷不謀而合。 在思考如何將情感分析應(yīng)用到?jīng)Q策活動(dòng)中時(shí)我們必須清楚,關(guān)于在特定情感狀態(tài)下身體內(nèi)部有何變化的問題,心理學(xué)家還沒有形成一致意見。分歧最大的問題與情感體驗(yàn)的主觀性有關(guān)。當(dāng)前的局面與個(gè)人的經(jīng)歷對(duì)情感反饋的影響到底有多大?如果表現(xiàn)出害怕的幾個(gè)特征,比如呼吸與心率加速、流汗、血壓升高等,一定是因?yàn)楹ε聠?出現(xiàn)這些狀況,或許是因?yàn)槟憧謶帧⒄痼@,或者感到焦慮不安、心煩氣躁,但也有可能是因?yàn)槟銊偝粤艘活w糖,而且正在鍛煉。 保羅·艾克曼指出,解讀情感時(shí)須防范“奧賽羅的錯(cuò)誤”。在莎士比亞的戲劇《奧賽羅》中,奧賽羅指責(zé)妻子苔絲狄蒙娜與卡西奧有染,并告訴她已經(jīng)派人殺了卡西奧?吹狡拮幽樕虾ε屡c痛苦的神情,奧賽羅認(rèn)為這表明她真的有罪。他想,很顯然,她感到害怕是因?yàn)榧榍楸唤掖┝,她感到痛苦則是因?yàn)樗诎У克廊サ那槿。艾克曼指出,苔絲狄蒙娜在那一刻確實(shí)表現(xiàn)出了害怕與痛苦的情緒,但是原因與奧賽羅猜測(cè)的并不一樣。她感到害怕是因?yàn)檎煞蚨驶鹬袩⑹ダ碇,她感到悲傷是因(yàn)樗裏o法自證清白、自知難逃一死。奧賽羅犯下的令人扼腕的錯(cuò)誤說明了一個(gè)事實(shí):檢測(cè)某種情感的生理指標(biāo)比較容易,而發(fā)現(xiàn)其背后的原因卻難得多。在利用情感數(shù)據(jù)進(jìn)行決策時(shí),無論解讀這些數(shù)據(jù)的是人還是機(jī)器,都必須時(shí)刻牢記奧賽羅的教訓(xùn)。 面部表情、語(yǔ)音線索生理學(xué)數(shù)據(jù)都是真實(shí)的信號(hào),情感識(shí)別系統(tǒng)可以從中發(fā)現(xiàn)我們大多數(shù)人都無法發(fā)現(xiàn)的規(guī)律。如果可以實(shí)時(shí)獲取經(jīng)過挖掘的情感數(shù)據(jù),我們的生活將會(huì)大大改觀,但是,風(fēng)險(xiǎn)也會(huì)因此增加。你是否想了解自己在第一次約會(huì)時(shí)或者面試之前、之中和之后的情感狀態(tài)?檢測(cè)任一階段的情感狀態(tài),都有可能對(duì)接下來的行動(dòng)產(chǎn)生深遠(yuǎn)的影響。在面試時(shí),如果面試官告訴你他正在使用情感檢測(cè)應(yīng)用程序,你的情感狀態(tài)是否會(huì)發(fā)生變化,你會(huì)更加緊張還是更加自信?在這種情況下,你通常會(huì)竭力隱藏自己的情感,但如果應(yīng)用程序利用你臉上的微表情來尋找“蛛絲馬跡”,你的所有情感反應(yīng)肯定會(huì)暴露無遺。 我在前文中指出,交流各方都應(yīng)該有權(quán)查看交流記錄。如果你打給客服代表的電話被錄音,你就有權(quán)得到這份錄音。但是,由于受情感檢測(cè)程序監(jiān)控的交流越來越多,我們無法準(zhǔn)確地判斷僅僅獲取這些原始錄音對(duì)我們是否公平。如果企業(yè)利用語(yǔ)音數(shù)據(jù)探測(cè)你的情緒,并且根據(jù)分析結(jié)果采取不同的方式處理你的來電,那么它們應(yīng)該為你提供哪些信息呢?如果你真實(shí)的情感體驗(yàn)不同于算法的解讀,又會(huì)導(dǎo)致什么樣的結(jié)果呢? 此外,如果我們希望借助情感狀態(tài)的精煉數(shù)據(jù),改進(jìn)我們與親朋好友或同事之間的交流,僅憑戴在手腕上的傳感器或者對(duì)準(zhǔn)臉部的攝像頭是無法實(shí)現(xiàn)這個(gè)愿望的。我們還需要想辦法充實(shí)傳感器數(shù)據(jù),比如,詳細(xì)描述并公開分享我們的感受,為機(jī)器檢測(cè)的生理指標(biāo)添加個(gè)性化標(biāo)簽。為了深刻了解我們的行為規(guī)律,并幫助我們更好地做出決策,我們可以心甘情愿地公開表露哪些情緒和情感呢? ……
你還可能感興趣
我要評(píng)論
|