1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 大數(shù)據(jù)
  4. 正文

搜索大數(shù)據(jù):商業(yè)世界的“上帝視角”

 2020-02-25 10:38  來源:A5專欄  我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

電影《末日重啟》中有這樣一句臺詞:“你有沒有想過,世界上還存在一個鏡像世界,那里的一切都和你的生活一樣,就像我們熟知的平行時空那樣。”

在這樣一個特殊的時間點,或許已經(jīng)有不少人開始思索這個問題,如果我們可以從“鏡像世界”看到自己,如果我們可以在兩個多月前叫停那些吃“野味”的人群,社會就不會停擺,我們的生活也不會被外力打亂。

然而現(xiàn)實世界中可能并不缺少這樣的“平行時空”。

兩個多禮拜前,華南農(nóng)業(yè)大學(xué)公布了最新的研究成果,穿山甲正是新型冠狀病毒的潛在中間宿主。但在更早前的一個禮拜,百度發(fā)布的搜索大數(shù)據(jù)報告顯示,穿山甲雄踞過去十年中“野味搜索”的第一位,類如“野味的做法”和“野味館”的百度搜索大數(shù)據(jù)同樣呈現(xiàn)出較為明顯的季節(jié)性波動,這說明即使經(jīng)歷非典之后,依然有人對吃野味這件事情有獨鐘。

從中不難梳理出潛在的因果關(guān)系:搜索作為用戶主動獲取信息的方式,所產(chǎn)生的搜索大數(shù)據(jù)直觀地暴露了民眾對于“野味”的熱情,隱藏在這些數(shù)據(jù)背后的用戶行為,正是為疫情爆發(fā)而種下的“因“。

拋卻疫情這般沉重的話題,保留一些“私心”將目光看向商業(yè)世界,看到的卻是企業(yè)家、創(chuàng)業(yè)者們的“訴苦”,諸如“現(xiàn)金流只能維持三個月”“給員工發(fā)不出工資”之類的聲音比比皆是,而非嘗試從現(xiàn)實世界的“鏡像”里尋找活下去的答案,思索“黑天鵝”可能帶來的新機會。

本文想要討論的正是這樣一個話題。

01 “搜索直接連接大腦”

“搜索直接連接大腦”,谷歌聯(lián)合創(chuàng)始人謝爾蓋·布林提出的概念被不少人解讀,甚至有人猜測谷歌一開始就想打造連接人與世界的“腦機”。

或許無須這般深奧的猜測,谷歌不止一次對外宣稱:“搜索的最終目標(biāo)是理解人的意思”,沒準(zhǔn)這就是謝爾蓋·布林的題中之意。厘清了搜索引擎的價值,也就不難理解搜索數(shù)據(jù)由少變多,再到大數(shù)據(jù)的現(xiàn)實意義。

首先,谷歌和百度的主頁大概是互聯(lián)網(wǎng)世界中最簡單的UI,有人給出的解釋是“偶然性”的產(chǎn)物,搜索引擎誕生的時間還是撥號上網(wǎng)的年代,為了保證網(wǎng)頁加載的速度,以及節(jié)省服務(wù)的流量成本,最簡單的選擇無疑是最好的選擇。

暫且不去論證此類說法的正確性,簡單到極致的搜索框恰恰是破解“搜索直接連接大腦”的關(guān)鍵所在。當(dāng)用戶面對這樣的搜索框時,看不到太多的干擾因素,由此養(yǎng)成的習(xí)慣就是:在搜索框里輸出自己想要答案的關(guān)鍵詞,一種最原始也最純粹的“主動尋找信息”的場景。何況人們并不缺少雅虎這樣包括搜索框的門戶或?qū)Ш骄W(wǎng)站,為用戶提供了這樣或那樣的選擇,最終卻和PC時代一起走向了衰落。

其次,人們的每一次請求,搜索引擎都知道人們在尋找什么,正如人們的所有行為都會在互聯(lián)網(wǎng)上留下痕跡,而搜索引擎占領(lǐng)了捕捉和分析這一行為的最佳路徑,針對這些用戶行為的抓取、存儲和分析,甚至可以揣摩用戶搜索之前的動機來洞察新的趨勢,指引下一階段的走向。

即便到了移動互聯(lián)網(wǎng)時代,超級APP逐漸崛起,數(shù)據(jù)孤島逐漸形成,“投喂”模式的內(nèi)容分發(fā)已經(jīng)成為新潮流,可搜索仍然是最高頻的用戶行為之一。谷歌在全球范圍內(nèi)的月活用戶超過了10億人次,國內(nèi)每天也有10 億人次通過百度搜索了解疫情,同時移動互聯(lián)網(wǎng)又進(jìn)一步擴展了搜索引擎的能力邊界,除了搜索的關(guān)鍵詞,還有搜索的地點、設(shè)備、方式,數(shù)據(jù)不僅在增“大”,也在變“深”。

之所以用如此長的篇幅來闡述搜索的意義,無非是想要回答這樣一個問題:記憶和聯(lián)想是大腦最重要的兩種思維方式,記憶是互聯(lián)網(wǎng)的優(yōu)勢所在,聯(lián)想的路徑是什么?這也就引出了搜索大數(shù)據(jù)的價值,即洞察、預(yù)測、研判……

畢竟搜索作為網(wǎng)民的“意圖數(shù)據(jù)庫”,當(dāng)然可以根據(jù)某一專題搜索大數(shù)據(jù)的的漲跌,預(yù)測下一步的市場走勢。

02 “像上帝一樣俯視”

搜索大數(shù)據(jù)的“一戰(zhàn)成名”,還要從谷歌的GFT說起。

2008年谷歌推出了一個名為Google Flu Trends的應(yīng)用,翻譯成中文就是“谷歌流感趨勢”,通過匯總分析用戶的搜索數(shù)據(jù),對全球的流感疫情進(jìn)行估測。2009年美國H1N1流感爆發(fā)的幾周前,谷歌的工程師們在《Nature》上發(fā)表了一篇論文,預(yù)測了H1N1在美國的傳播,并且具體到了特定的地區(qū),事后證明與美國疾病控制和預(yù)防中心(CDC)的官方數(shù)據(jù)相關(guān)性高達(dá)97%,時間上卻提前了整整兩周。

只是谷歌的GFT也有“玩砸”的時候。

2014年有研究人員在《Science》上發(fā)表文章指責(zé)GFT的糟糕表現(xiàn),文章的標(biāo)題相當(dāng)直接——“谷歌流感的寓言:大數(shù)據(jù)分析的陷阱”。原因在于,2011年8月到2013年8月之間的108周里,GFT有100周的流感發(fā)病率預(yù)測高過CDC,2012年到2013年的預(yù)測發(fā)病率已是CDC報告值的2倍多。

不過這并不是唱衰搜索大數(shù)據(jù)的理由。

打這樣一個比方:在一個交通流量密集的十字路口,實時記錄行駛過的車輛和發(fā)生的交通事故,如果上禮拜一的車流量是1萬輛,不難在下個禮拜一記錄到大致相同的數(shù)字;可如果上禮拜一發(fā)生了兩起交通事故,很難說下個禮拜一定會發(fā)生交通事故,因為交通事故是不確定性事件。

簡而言之,搜索大數(shù)據(jù)在不確定性、隨機性事件中的預(yù)測可能會出現(xiàn)不小的偏差,但對確定性、趨勢性的事件,幾乎可以用“研判”一詞來形容。

直接的例子就是有人用Google趨勢多次成功預(yù)測了比特幣的價格走勢,畢竟加密貨幣的價格變化直接取決于外界的關(guān)注度,當(dāng)用戶搜索比特幣正面關(guān)鍵詞的標(biāo)準(zhǔn)差增加時,預(yù)示著比特幣的價格將有所上升,而負(fù)面關(guān)鍵詞的標(biāo)準(zhǔn)差增加時,往往會在一段時間后出現(xiàn)價格下降的情況。

國內(nèi)也不乏這樣的例子。

比如在線教育的百度搜索大數(shù)據(jù)在今年春節(jié)后不久就開始猛漲,這比在線教育概念股的瘋漲足足提前了兩個禮拜左右。可以給出的合理解釋是:1月23日武漢封城的消息曝出后,一些家長就開始焦慮孩子開學(xué)的問題,在線教育相關(guān)關(guān)鍵詞的搜索量開始迅速增長。

此外,疫情的消息傳出后,新型冠狀病毒肺炎癥狀之一“咽喉痛”的關(guān)鍵詞搜索開始呈現(xiàn)出上升趨勢,折射了人們對于自身情況的擔(dān)憂,可能會引發(fā)焦慮情緒和心理健康問題。對于內(nèi)容生產(chǎn)者和平臺方,及時辟謠并加大權(quán)威信息、科普信息的權(quán)重,可以說是防疫過程中必要的一個環(huán)節(jié)......

假如人們可以在黑天鵝出現(xiàn)之前,對市場的走向做出準(zhǔn)確的洞察,或許可以像上帝一樣俯視亂象中的危與機,而非無奈的“訴苦”。

03 不應(yīng)被忽略的金礦

關(guān)于大數(shù)據(jù)價值的“警示”,幾乎成了老調(diào)常談的話題。

早在1980年,著名未來學(xué)家阿爾文·托夫勒就在《第三次浪潮》中,將“大數(shù)據(jù)”描繪為“第三次浪潮的華彩樂章”。

2012年,IBM CEO羅睿蘭的觀點更為直接:“大數(shù)據(jù)不亞于一種新的自然資源。數(shù)據(jù)在我們當(dāng)今時代的角色就像是蒸汽、電磁和化石燃料對之前時代的角色一樣。它有潛力推動更高一層的社會進(jìn)步和繁榮。”

也正是在2012年,美國、歐洲、日本、韓國等先后啟動了政府帶頭的大數(shù)據(jù)研究與開發(fā)計劃,國內(nèi)也在當(dāng)年的“十二五”規(guī)劃中明確提出要支持海量數(shù)據(jù)存儲、處理技術(shù)的研發(fā)和產(chǎn)業(yè)化。

只是大數(shù)據(jù)在國內(nèi)的用戶基礎(chǔ)似乎還很貧瘠:微信每年都會放出一份大數(shù)據(jù)報告,告訴我們什么是最受歡迎的年度表情;支付寶每年都會公布一份年度賬單,用數(shù)據(jù)詮釋過去一年中花了多少錢,花在了什么地方;至于百度搜索大數(shù)據(jù)的應(yīng)用,可能是不少營銷人的必備工具,更廣闊的B端市場對其的關(guān)注度還有不小的增長空間。

比如手機廠商已經(jīng)習(xí)慣于從搜索大數(shù)據(jù)中追蹤輿情,然后根據(jù)用戶的喜好制定相應(yīng)的市場營銷計劃,卻沒有耐心從億萬用戶的搜索大數(shù)據(jù)中挖掘產(chǎn)品痛點在哪里,反而喜歡從幾千人規(guī)模的調(diào)研數(shù)據(jù)里找答案。

再比如提到經(jīng)典的數(shù)據(jù)應(yīng)用案例時,很多人想到的還是沃爾瑪“啤酒與尿布”,也折射了當(dāng)下零售商的窘境:執(zhí)著于在自家的倉庫數(shù)據(jù)中找到可能的商品關(guān)聯(lián),如果進(jìn)一步分析搜索啤酒的用戶背后的動機是什么、還會搜索哪些商品,是否會制造更多的可能?

另一個現(xiàn)實而迫切的問題是,疫情期間每天有超過10億人次在用百度搜索獲取信息,沉淀了海量的用戶數(shù)據(jù),這些用戶們出于什么樣的需求,基于什么樣的訴求?幸運的是,已經(jīng)有不少人嘗試從野味、口罩等數(shù)據(jù)中給出了一些洞察,可這些疫情期間的搜索數(shù)據(jù)如何優(yōu)化社會治理體系,如何預(yù)防下一次疫情的出現(xiàn),還需要進(jìn)一步下功夫挖掘。

就像疫情期間同時發(fā)生的生鮮搶購和農(nóng)產(chǎn)品滯銷,對這些數(shù)據(jù)進(jìn)一步挖掘整理,是否可以對供應(yīng)鏈的調(diào)整給出科學(xué)的指導(dǎo);不同地區(qū)的醫(yī)學(xué)關(guān)鍵詞搜索情況和當(dāng)?shù)氐尼t(yī)療體系進(jìn)行關(guān)聯(lián)分析,或許可以以遠(yuǎn)程診療的形式彌補醫(yī)療資源分配不均衡的問題;以及不同地區(qū)“口罩”、“消毒水”等防疫用品的搜索情況,大致可以洞察出當(dāng)?shù)氐男枨髲娙?,引?dǎo)政府調(diào)整醫(yī)療物資的分配......

至少對站在產(chǎn)業(yè)轉(zhuǎn)折點上的中小企業(yè)而言,在現(xiàn)金流遠(yuǎn)不能和巨頭匹敵的局限下,搜索大數(shù)據(jù)這座金礦可能是拉平差距的唯一籌碼,誰能掌握挖掘大數(shù)據(jù)的“黑魔法”,無疑將在競爭中多一些勝算。

04 寫在最后

“鏡像世界”并不是科幻電影的專屬,而是耶魯大學(xué)計算機科學(xué)家David Gelernter在1991年提出的概念。

彼時給“鏡像世界”下的定義是:鏡像世界是將一些巨大的結(jié)構(gòu)性的運動的真實生活,像鏡像圖景一樣嵌入到電腦中,通過它你能看到和理解這個世界的全貌。長達(dá)30年時間的科技演進(jìn),現(xiàn)實世界正在1:1映射變成數(shù)字社會,特別是在物聯(lián)網(wǎng)的推進(jìn)下,整個世界都在“可讀化”,“鏡像世界”已然從概念成了現(xiàn)實。

其中搜索大數(shù)據(jù)正是“鏡像世界”的組成部分之一,或許我們還不能從人類的尺度觀察世界,但從商業(yè)的尺度來洞察潛在的機會點,并不缺少一定的可行性。正如那句有些雞湯性質(zhì)但不失哲理的話:當(dāng)你改變了看世界的方式,你就改變了你所看到的世界。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)文章

  • 百望云獲評“中國大數(shù)據(jù)獨角獸” 數(shù)實相融 算啟未來

    隨著數(shù)字中國戰(zhàn)略的步步落實,大數(shù)據(jù)已經(jīng)成為錨定戰(zhàn)略定位、搶得市場先機的重要基礎(chǔ)元素。為彰顯行業(yè)發(fā)展現(xiàn)狀,遴選、推薦優(yōu)秀企業(yè),長城戰(zhàn)略咨詢近日在2023中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會期間,重磅發(fā)布《中國大數(shù)據(jù)獨角獸企業(yè)榜單》,根據(jù)獨角獸企業(yè)國家推薦性標(biāo)準(zhǔn),篩選出259家2022年中國大數(shù)據(jù)(潛在)獨角獸企業(yè)

    標(biāo)簽:
    大數(shù)據(jù)
  • 學(xué)術(shù)引領(lǐng) 數(shù)智健康:2023北京健康醫(yī)療大數(shù)據(jù)論壇六月北京盛大開啟

    2023年6月15日至18日,2023北京健康醫(yī)療大數(shù)據(jù)論壇、醫(yī)促會華夏健康數(shù)據(jù)與數(shù)字醫(yī)學(xué)高峰論壇、第三屆中華預(yù)防醫(yī)學(xué)會腎臟病預(yù)防與控制專業(yè)委員會學(xué)術(shù)會議將同期于北京舉行。論壇以“學(xué)術(shù)引領(lǐng)數(shù)智健康”為主題,著眼國家戰(zhàn)略需求,聚焦前沿科技在健康醫(yī)療領(lǐng)域的發(fā)展與實踐,薈萃全球頂尖學(xué)術(shù)觀點,促進(jìn)多方跨界融

    標(biāo)簽:
    大數(shù)據(jù)
  • 擎起科技自強旗幟,引領(lǐng)產(chǎn)業(yè)智造未來——谷器數(shù)據(jù)入庫北京市科技型中小企業(yè)

    近日,北京市科學(xué)技術(shù)委員會、中關(guān)村科技園區(qū)管理委員會公示了北京市2023年第2批科技型中小企業(yè)名單,谷器數(shù)據(jù)借助優(yōu)秀的科技自主創(chuàng)新能力成功入選。此次評價指標(biāo)圍繞科研人員、研發(fā)投入、科技成果等三個維度,成功入選科技型中小企業(yè)是對谷器數(shù)據(jù)專業(yè)化發(fā)展、自主創(chuàng)新能力、產(chǎn)品技術(shù)實力的激勵與肯定??萍夹椭行∑髽I(yè)

    標(biāo)簽:
    大數(shù)據(jù)
  • 獲中國科學(xué)院褒獎 | 谷器數(shù)據(jù)產(chǎn)品榮膺2022年度最佳!

    評審寄語面向車間現(xiàn)場生產(chǎn)制造過程的數(shù)字化管理,谷器數(shù)據(jù)SupplyX·MES通過推動更有效的工廠運行和現(xiàn)場效率,提供從接收生產(chǎn)計劃到制成最終產(chǎn)品全過程的生產(chǎn)活動實現(xiàn)優(yōu)化的信息,成為新型工業(yè)化的標(biāo)桿力量!近日,由中國科學(xué)院《互聯(lián)網(wǎng)周刊》、中國社會科學(xué)院信息化研究中心等機構(gòu)聯(lián)合主辦的“2023(第八屆)

    標(biāo)簽:
    大數(shù)據(jù)
  • 四方偉業(yè)優(yōu)秀的大數(shù)據(jù)產(chǎn)品和服務(wù)獲得了行業(yè)榮譽

    在如今這個數(shù)字化轉(zhuǎn)型時代,大數(shù)據(jù)在企業(yè)發(fā)展的過程中發(fā)揮了至關(guān)重要的作用,大數(shù)據(jù)技術(shù)以更高效和有效的方式提供最好的服務(wù),同時還可以提高生產(chǎn)力、提高客戶滿意度和更高效的智慧化運營。其中,成都四方偉業(yè)軟件股份有限公司(以下簡稱“四方偉業(yè)”)以優(yōu)秀的大數(shù)據(jù)產(chǎn)品和服務(wù)獲得了多項行業(yè)榮譽。去年,2022數(shù)博會數(shù)