如今,在互聯(lián)網(wǎng)誕生近50年后,搜索的意義已經(jīng)遠(yuǎn)遠(yuǎn)不只“關(guān)鍵詞+回車”找出相關(guān)信息。大數(shù)據(jù)、云計算、人工智能賦予了搜索全新的意義,搜索已經(jīng)無處不在:當(dāng)我們在使用百度時,當(dāng)我們拿起iPhone詢問Siri天氣如何,當(dāng)我們將照片放入搜索框……搜索已經(jīng)融入我們的生活,查詢變成了我們?nèi)粘5囊徊糠帧?/span>
搜索現(xiàn)在已經(jīng)發(fā)展到什么階段了?
搜索未來會變成什么樣子?
搜索還能帶給我們什么……
作者斯特凡·韋茨身為必應(yīng)搜索的高級總監(jiān),多年在微軟致力于搜索的研究和推廣。在這本書中,斯特凡為我們展示了智能時代未來搜索的全景圖。未來的搜索是當(dāng)你搜索一部電影名稱時,你的訂票系統(tǒng)已經(jīng)根據(jù)你的日程表開始為你推薦今天的觀影時間和地點;當(dāng)你查詢路況,電子地圖軟件自動為你推薦出回家的躲避擁堵方案;當(dāng)你和朋友對話時提到晚上一起吃飯,你的手機助手立刻在結(jié)束通話時為你列選出最符合你口味的就餐地點……
讀完這本書,你會被搜索的強大力量所震撼,也會意識到目前我們使用到的搜索功能只是搜索的冰山一角。當(dāng)搜索遇到人工智能,當(dāng)搜索與物聯(lián)網(wǎng)結(jié)合,當(dāng)搜索和機器學(xué)習(xí)碰撞……搜索的潛能將被激發(fā)出巨大的能量為人類生活、生產(chǎn)的便利帶來質(zhì)的飛躍。同時,也會給我們帶來前所未有的挑戰(zhàn)。
準(zhǔn)備好了嗎?讓作者帶你走進(jìn)未來5年、10年、20年后的搜索!
搜索在今天的意義遠(yuǎn)遠(yuǎn)不只文字搜索,它變得更加智能和強大,作者用通俗的語言為我們描繪了未來搜索的方向,以及我們需要小心和需要反思的地方;
作者為微軟搜索總監(jiān),他站在互聯(lián)網(wǎng)時代背景下用專業(yè)的眼光結(jié)合多年的一線工作經(jīng)驗講述搜索的本質(zhì)、搜索的意義、搜索的未來以及搜索對商業(yè)的意義;
著名大數(shù)據(jù)專家涂子沛,XPRICE創(chuàng)始人、奇點大學(xué)執(zhí)行主席,《富足》合著者彼得·赫曼迪斯, Siri合創(chuàng)人亞當(dāng)·奇耶等IT界大咖鼎力推薦。
前言(節(jié)選):
未來將會怎樣?
我的日常工作是微軟必應(yīng)(Bing)的高級搜索總監(jiān)。有很多員工致力于推廣并提升我們的搜索引擎技術(shù),我只是其中一員。我從一開始就在必應(yīng)工作,也很幸運一直參與在我想象中最繁復(fù)的啟動工作中。2013年12月,有人打電話問我是不是愿意寫一本關(guān)于搜索的書。我的反應(yīng)是當(dāng)然可以,為什么不呢?當(dāng)時我正計劃環(huán)球旅行,到14個城市去進(jìn)行已經(jīng)安排好的談話和會議。我正在微軟啟動若干新的產(chǎn)品,也剛剛戒除咖啡因。很顯然,我有點兒失衡。
每個設(shè)備、我們周圍的每個物體、每個人都互相連接,我們也開發(fā)出從噪聲中識別出模式的系統(tǒng)。面臨這樣的現(xiàn)實,寫下我對此的觀點很重要。搜索的力量在于提醒我們那些自己都不知道但其實應(yīng)該知道的東西,也能在廣義上讓我們變得更好。我看到數(shù)字化的黃金時代正在來臨,每個人、每個地方、每樣?xùn)|西都可以用數(shù)字的形式描述。一旦那個時代降臨,而系統(tǒng)從我們復(fù)雜的思想中過濾掉那些知識殘渣,那么人類的能力將得以增強,我們就可以做出更好的決定,還能在一念之間就操縱物理世界,而最終也會更加幸福。我在晚宴或者講座上描述我的工作以及我對搜索未來的愿景時,人們無一例外地對這些可能性感到興奮不已。
當(dāng)我談到科技帶來的超級鏈接、超級分析、超級指引到底意味著什么等深入內(nèi)容時,更多的人才開始深思。
技術(shù)產(chǎn)業(yè)的圈子其實很小,我就有很多朋友在谷歌工作。而谷歌通常被認(rèn)為是微軟的主要競爭對手。雖然我對工作在山景城的同胞在做什么沒有明確的信息,但在用晚餐的時候我會聽到他們在思考什么,以及必應(yīng)和谷歌都在試圖解決的問題。
這本書接下來所講述的并不是必應(yīng)、微軟或者任何其他公司建立這樣的未來搜索產(chǎn)品的計劃。事實上,書中很多概念是矛盾的,也涉及監(jiān)管方面的擦邊球。在某些情形中,社會就是不能接受一個超級互聯(lián)的世界以及由此帶來的透明度。我們這本書說的是未來的形勢。而我每天深度生活在互聯(lián)網(wǎng)之中,一年要和數(shù)百家公司的工程師和技術(shù)專家以及那些推進(jìn)著技術(shù)發(fā)展的學(xué)者交流?傮w來說,我相信技術(shù)的力量能建立起一個更自由也更幸福的社會。
當(dāng)人類與機器融合我們?nèi)祟惪偸窍雽ふ曳椒ú蹲轿覀冊诂F(xiàn)實世界中看到的東西,從而將其保存、傳承并從中學(xué)習(xí)。巖畫、日記、散文、照片、錄音、錄像……所有這些蹤跡使我們能織出一張生動又不朽的掛毯,其描繪的世界超越了我們個體生命的短暫本質(zhì),而且我們越來越多地用機械來保存、分析、解釋這些蹤跡。
與此同時,我們一直在嘗試通過一些架構(gòu)連接人機之間不兼容的界面,從而將兩者結(jié)合。比如紐約中央火車站是一個匯聚了人類和機器的移動的中心。我們通過結(jié)合人類和機器的兩個獨 一 無 二的特性—人類精細(xì)、自主但是緩慢的移動結(jié)合機器利用引
擎和軌道進(jìn)行的粗放、限定但快速的移動—讓人們走得更快,走得更遠(yuǎn)。融合了人類和機器各自的能力后會發(fā)生什么?如果我們用機器可以利用的方式捕獲現(xiàn)實世界,然后利用機器的能力來大幅提升人類的能力會怎樣?這就是搜索的未來,其獨 一 無 二的能力是對現(xiàn)實世界進(jìn)行有意義的索引,并同時作為這些知識的通用接口。搜索就是我們一直想要的“鉸鏈”。
我重申一次,這不是我們今天所認(rèn)為的搜索,那只是一個信息獲取系統(tǒng),我們輸入一個名詞并希望得到一個包含那個名詞的結(jié)果頁面。我們必須要把搜索看作空中的一位無所不知的觀察者。它知曉蒼穹之下、大地之上發(fā)生的一切。要想這一切變?yōu)楝F(xiàn)實,搜索本身必須被解構(gòu),還原成各個元任務(wù):對這個世界及其中的一切進(jìn)行索引并理解;讀懂感受,于是搜索系統(tǒng)可以看、可以聽(最終能聞、能摸。能和我們以更自然的方式交互;和我們?nèi)祟惖慕涣鞣绞揭c情景匹配—不論這樣的情景是文字、對話,還是代表我們和其他機器通信并在真實世界中讓事件發(fā)生。
在下面幾章中,我們會探討將搜索轉(zhuǎn)變?yōu)檫B接人機獨特能力的“鉸鏈”的進(jìn)展。我們會先審視這一新的網(wǎng)絡(luò)以及搜索引擎面臨的挑戰(zhàn),接著我們會分析在新的職能下搜索引擎能做些什么,還會介紹搜索引擎的新規(guī)則。等到我們對未來搜索的潛力有了切實的理解,我們會討論新一代的搜索會怎樣在更大程度上包容人性,提升人類的能力,真正成為我們在真實世界和虛擬世界中的代理人。
雖說我們這些技術(shù)人員設(shè)想了那么光明的前景,搜索的未來如何卻還沒有確定。我們會審視那些當(dāng)前阻礙我們迎來搜索黃金年代的障礙。這些障礙包括技術(shù)挑戰(zhàn),也有更寬泛意義上的社會問題,比如我們是否想要這種洞察我們的世界以及其中一切的看似無所不在的能力。最后,我們要討論的是在將人類的潛力和機器層面的能力結(jié)合而形成共生關(guān)系,并顛覆了諸如商業(yè)、隱私以及日常生活等現(xiàn)有概念后,搜索到底還有怎樣的意義。
微軟必應(yīng)搜索的高級總監(jiān)。他在微軟時的主要工作就是和其他同行以及行業(yè)內(nèi)的組織一起,推廣并改進(jìn)搜索技術(shù)。他不僅關(guān)注微軟的產(chǎn)品線,同時,也在其工作覆蓋的整個行業(yè)深入研究以更好地理解搜索行為、學(xué)術(shù)發(fā)展以及各方面的創(chuàng)新。他就像是搜索的“傳道者”,搜集并整理各方面的反饋,以此促進(jìn)搜索技術(shù)的進(jìn)步。
作為一名在微軟工作了17年的老員工,他在諸多項目小組(Windows系統(tǒng)、硬件、信息安全以及全球商業(yè)戰(zhàn)略)中負(fù)責(zé)技術(shù)開發(fā)、項目管理、業(yè)務(wù)拓展開發(fā)以及市場營銷等不同環(huán)節(jié)并獲得不少專利。他也經(jīng)常為企業(yè)和學(xué)術(shù)團體就信息存儲、獲取和使用的未來發(fā)表演講。
目前居住在華盛頓州西雅圖市。
第1章 搜索將看到什么?
搜索走到了哪里?
文字的局限
更有能力的網(wǎng)絡(luò)
社交網(wǎng)絡(luò)
個人信息
互聯(lián)現(xiàn)實
設(shè)備
“事物”
事件
地點
混合系統(tǒng)
支付系統(tǒng)
大數(shù)據(jù),大影響
設(shè)備推動了“能力網(wǎng)絡(luò)”
無所不在的通信為“能力網(wǎng)絡(luò)”加油
用“能力網(wǎng)絡(luò)”去理解物理世界
將現(xiàn)實編織在一起
第2章 搜索將如何應(yīng)對?
沒有萬靈丹
由此及彼
下一代搜索查詢
更好的聽眾:從妄語中發(fā)現(xiàn)真知
更認(rèn)真地聽
更智能地聆聽
理解現(xiàn)實世界
幫助搜索引擎去理解人們
設(shè)備驅(qū)動了對理解的需求
構(gòu)建一張世界知識地圖
第3章 搜索將做什么?
搜索將具有洞見并給出預(yù)測
挑戰(zhàn):好奇心帶來的洞見
只是夠用就足矣?
從查找到行動
超越應(yīng)用末日
讓一切變得更智能
設(shè)備交朋友,相互有影響
把一切整合起來
下一代搜索能提升我們的幸福感嗎
第4章 搜索將會如何?
提升我們這個世界的精度
機器學(xué)習(xí)和智能
消耗更少,做得更多
另一個途徑:模仿人類大腦
人就是搜索引擎
慢速搜索
人可以彌補“小數(shù)據(jù)”造成的錯誤嗎
是快是慢,它就在那里
第5章 搜索能給我們帶來什么?
搜索將增強現(xiàn)實
搜索將增強我們的自然能力
搜索將帶來實時決策
超人類的搜索
第6章 誰拖了搜索的后腿—技術(shù)
信息孤島
你的檔案
硬件孤島
安全或不安全
淹沒在數(shù)據(jù)海洋
平衡的訣竅
大數(shù)據(jù):數(shù)量真的很重要嗎
大數(shù)據(jù)及其帶來的意外結(jié)果
決策的無能和一致性
反擊:當(dāng)大數(shù)據(jù)遇上大計算
希望的微光
第7章 誰拖了搜索的后腿—商業(yè)
系統(tǒng)中遍地黃金
未來搜索的商業(yè)模式
另一種搜索付費方式
廣告的再思考
其他贏利模式
隱私
技術(shù)、社交、個人及社會維度
我的隱私值多少錢
數(shù)據(jù):你的、我的和我們的
個人云
是服務(wù)條款,還是奴役
一流的網(wǎng)絡(luò)
解決之道:陽光普照
第8章 信仰時刻
數(shù)字化的你:真正得以量化的自我
一個更數(shù)字化的世界
控制循環(huán)
對生活、宇宙和一切的影響
社會影響
商務(wù)影響
結(jié)語搜索的未來
致謝
搜索走到了哪里?
由于網(wǎng)絡(luò)是基于文本文檔構(gòu)建的,所以我們最初將其分類的嘗試很像是一種原始的杜威十進(jìn)制圖書分類法。雅虎就是一個由工程師維護(hù)的層級索引。對于某一個詞語,有一系列的頁面和網(wǎng)站與這個詞語相關(guān)。這樣的層級索引過去是、現(xiàn)在也仍然是通往廣袤信息領(lǐng)域卓有成效的路標(biāo)。如果你對阿根廷的旅館感興趣,層級索引可以帶你訪問一個網(wǎng)站,而那里列出了很多阿根廷旅館的信息。
網(wǎng)絡(luò)不斷擴展,從成百上千個頁面到數(shù)百萬乃至數(shù)億個頁面。這些頁面上使用的詞語也擴展到了百萬億計,單純的層級索引不再適用,于是就誕生了搜索。
但糾結(jié)之處在于,索引本身不再有任何意義。索引主要用來在一本書中找到對應(yīng)于一個詞語或者詞組的頁面。顯然,如果一個索引包含了圖書館里所有書的話,它的用處就不大。比如我們查找“大象”這個詞語,那就不得不瀏覽圖書館收藏的數(shù)百本書中的數(shù)千個結(jié)果。意識到這一點后,一場革命就不可避免了。
搜索工程師意識到,根據(jù)一本書和大象的相關(guān)性,可以對這些書加以排序。顯而易見的是,有些書(比如一位和大象生活了20年的非洲作者寫的書)相比另外一些書(比如說迪士尼的《小飛象》)包含更多有關(guān)大象的信息。但即便是在數(shù)字時代,創(chuàng)建這樣一個排序的索引也會面臨挑戰(zhàn)。你怎么知道正給你做講演的人是馴馬專家?你怎能確信巖畫向你展示了刺殺野牛的正確方式?在過去的很多情形中,權(quán)威性排序由人們對該來源的評述決定,而這樣的評述通;谶@些來源是否能給予人們良好的信息,或者幫助他們成功地完成某項任務(wù)。隨著搜索引擎所包含的人類知識越來越龐大,工程師開始尋找在數(shù)字系統(tǒng)中重現(xiàn)這一現(xiàn)實世界的方法。
謝爾蓋·布林和拉里·佩奇設(shè)計了BackRub(返回觸摸)算法,成立了谷歌公司。他們衡量的是每個查詢返回結(jié)果的權(quán)重,該權(quán)重對應(yīng)著每個結(jié)果與該查詢的相關(guān)程度。通過找到一個頁面中鏈接到另外一個網(wǎng)頁的文本可以得到權(quán)重。A頁面上的這些鏈接文本(稱為“錨文本”)為搜索引擎提供了目標(biāo)頁面(B頁面)可能的內(nèi)容描述。如果足夠多的、具有相似詞源的詞語都指向同一個頁面——比如,有10 000個頁面都包含“大象”這個錨文本,且都指向另外一個網(wǎng)頁(B頁面)——那么引擎可以假定B頁面很可能說的就是大象。我們結(jié)合實際生活來思考一下這個過程。如果有足夠多的人告訴你洗手間在旅館的二樓,你很可能會相信他們。而如果這些人中的大部分還是在該旅館工作的人員,你對這個答案的信心會更強,因為這些人在這個話題上有更高的權(quán)威性。搜索的情形也是如此:不僅僅是有10 000個頁面告訴引擎B頁面是關(guān)于大象的,這10 000個頁面的質(zhì)量(或者說可信度)更是一個重要的衡量因素。
這些年來,工程師研究出了數(shù)百個其他變量,讓搜索可以適應(yīng)不斷增長的網(wǎng)絡(luò)。隨著頁面和鏈接數(shù)量的增加,我們的算法越來越擅長識別鏈接的含義和網(wǎng)頁的其他特征,并確定當(dāng)用戶使用某一特定查詢時他可能想要查找什么。
不管怎樣,搜索這個領(lǐng)域還是相對簡單的,因為我們以相對簡單的方式去搜索東西。頁面上的文字——偶爾加上圖片——成為現(xiàn)實世界里各種思想的一個低精度的替代品。
文字的局限
隨著互聯(lián)網(wǎng)的成長,它漸漸地能以更復(fù)雜的形式來表征這個世界。網(wǎng)絡(luò)不再是一系列頁面和鏈接,偶爾夾雜一些有趣的貓咪視頻。網(wǎng)絡(luò)更是一種方式,使得世上的一切得以重現(xiàn)、互聯(lián)、有意義。有了這個目標(biāo),我們不斷拓展了傳統(tǒng)搜索系統(tǒng)的極限。也就是說,傳統(tǒng)搜索更依賴于語言作為與日漸電子化的物理世界進(jìn)行交互的主要方式。
P6-8