當前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

輸入法競逐AI“新賽道”,舊有認知被顛覆后行業(yè)走向何方?

 2019-01-17 17:58  來源: A5專欄   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

文|曾響鈴

來源|科技向令說

大多數(shù)人看來已經(jīng)十分成熟的互聯(lián)網(wǎng)產(chǎn)品——輸入法,躁動還在繼續(xù)。

1月16日,百度輸入法搞了一場名為“AI·新輸入 全感官輸入2.0”的發(fā)布會,發(fā)布了其宣稱為“國內(nèi)首款真正意義上的AI輸入法”的百度輸入法AI探索版,百度高級副總裁王海峰表示,“百度輸入法將扮演好溝通橋梁的重要角色,讓人機交互進入一個全新的階段”。

該輸入法是一款默認輸入方式為全語音輸入,并支持表情、肢體等進行所謂“全感官”輸入的輸入產(chǎn)品??雌饋?,百度想要憑借一貫的AI技術(shù)優(yōu)勢來獲得輸入法市場的突破,而用“溝通橋梁”來定義,也說明百度嘗試在“輸入”二字上進行新的玩法探索。

事實上,AI與輸入法的結(jié)合并非什么新鮮事,鬧出過“6億用戶”笑話(吹牛被識破)的科大訊飛就經(jīng)常把AI技術(shù)掛在嘴邊,去年12月還推出了由所謂“訊飛超腦計劃”加持的訊飛輸入法。

被外界認為優(yōu)化空間越來越小的輸入法產(chǎn)品,開始從AI上找突破的機會,也惹得各路豪強爭相競逐。而AI的介入改變的可能不只有“輸入”,或還有整個“輸入法”的固有認知。

成熟的輸入法市場,用戶需求帶來革新動力

AI被深度應用到輸入法,與市場需求劇烈變化而目前多數(shù)產(chǎn)品形態(tài)仍然老舊有直接關系。

首先,是主體移動互聯(lián)網(wǎng)人群在語言輸入上有典型“混合化”需求:

不同漢語語系的基本的語法不斷融合,如北方語系“你先走”,到了廣東、香港南方語系,就變成“你走先”,如果是華人,則還有“你先走先”這樣的混合用法;

與此同時,包括四川話、長沙話、東北話等特色地區(qū)方言逐漸得到大眾認可,jio(腳)之類的語音開始混用;

部分走向精英化,或者出于特定社交目的的人群,中英夾雜成為常態(tài),“我不care”、 “Emma,我覺得的這個idea真的很amazing”,諸如此類在輸入情境中出現(xiàn)得越來越多。

其次,是移動互聯(lián)網(wǎng)人群進一步下沉,讓產(chǎn)生輸入的“需求錯配”。

張小龍說55歲以上的中老年人在微信用戶中占據(jù)了可觀的比例,事實上,包括微信在內(nèi)的需要大量使用輸入法的移動互聯(lián)網(wǎng)產(chǎn)品向低線城市、農(nóng)村的中老年滲透是不爭的事實,這些用戶一方面不懂常規(guī)輸入操作,另一方面作為“新網(wǎng)民”又對輸入需求更為迫切,需求產(chǎn)生了錯配。不巧的是,這些人當中,方言習慣又占了絕大多數(shù)。

最后,就是所有互聯(lián)網(wǎng)產(chǎn)品都在津津樂道的95后、00后新新人類,他們隨著時間的推進逐漸占據(jù)移動互聯(lián)網(wǎng)主舞臺,不喜歡陳舊的事物、總是在追求新奇體驗。

不是說“老產(chǎn)品”輸入法就一定不得他們喜歡,只不過,抓住這些新新人類需求容易形成新的競爭優(yōu)勢。

帶來多樣性與創(chuàng)新性,AI技術(shù)成輸入法“香餑餑”

總的來看,變化了的“輸入”需求并不一定都需要AI來解決,但AI無疑最具備多樣性與創(chuàng)新性可能。

如開篇所言,靠技術(shù)發(fā)家的科大訊飛對輸入法AI應用最為積極,2018年6月其推出的輸入法版本號稱可針對嘈雜環(huán)境進行智能降噪,在主動轉(zhuǎn)換后能支持多種方言輸入,且可以中英混合識別。此外,還推出所謂“同音字詞智能分辨”,可以判斷“他”、”她“、”他“等。

作為輸入法領域占據(jù)先發(fā)優(yōu)勢的玩家,搜狗也不忘在AI上下功夫。CEO王小川2018年開年強調(diào)AI賦能輸入法與搜索,要“通過AI技術(shù)大力發(fā)展語音、對話、翻譯”,隨后,搜狗AI技術(shù)的重心放到了可以直接帶來營收的翻譯機硬件上,翻譯寶Pro的42種語言實時互譯,在輸入端加入了語音識別支持。

而以AI技術(shù)立身的百度自然也不會放棄用AI獲取輸入法競爭優(yōu)勢的機會。只不過,百度的玩法有些不同,這次發(fā)布的“AI探索版”干脆把默認輸入方式改成了語音輸入,表情、肢體的全感官輸入很明顯是要把AI當做“主業(yè)”來搞,而不只是提升準確性的輔助技術(shù)。

百度的做法,與AI技術(shù)的屬性密切相關。原本AI就是要讀懂人類的語言、識別人類的命令并做出相應的反饋,而AI獲得信息的方式有很多種,它們都可以看作是“輸入”,用戶原本也有很多對移動終端的“輸入”需求,而不只是文字信息。

例如,早期的輸入法以字符輸入為主(用戶敲鍵盤,如同碼代碼),到后來語音輸入大行其道(用戶只需要用口說),現(xiàn)在,百度推出的輸入情境下的拍立活(讓用戶通過自己的動作“驅(qū)動”對方做出相同表情)、AR表情(為用戶自拍添加背景場景)、凌空手寫等AI功能,其實就是沿襲AI技術(shù)本身的特性,在輸入的方式上進行了某種“維度”提升,用戶可以照照自己、照照某些東西就可以進行“輸入”。

全感官輸入的意義,無非是讓用戶通過“輸入法”輸入的信息,在文字之外還有更多選擇,從這個意義上說,AI既是輸入法們提升產(chǎn)品多樣性和創(chuàng)新性的技術(shù)手段,反過來它本身的屬性也給出了輸入法打破舊有“文字信息”桎梏的路徑。

也由此,百度輸入法這個所謂“AI探索版”,先不論實質(zhì)內(nèi)容是否有價值,至少在模式上給出了AI輸入法樣板。

除了創(chuàng)新,輸入法AI競爭還需要抓住用戶需求的“細節(jié)”

輸入法是不太起眼卻又讓用戶離不開的“小產(chǎn)品”,由此,應用AI技術(shù)進行競爭除了理念與方向,在具體操作上對細節(jié)的關注可能更能俘獲用戶。

1、準確性提升是永恒的主題

如同手機跑分一樣,準確性不論何時都是檢驗輸入法能力的硬指標。時至今日,輸入法的準確性提升已經(jīng)是“高位榨取”的過程,變得越來越極致也越來越難。

例如,訊飛喜好宣傳其語音輸入的準確率,據(jù)稱已經(jīng)提高到98%,并且1分鐘可以輸入400字,搜狗也有類似的準確性宣傳。而百度此次之所以敢推出全語音輸入,除了用戶需求,更在于其所說的“領先業(yè)界的語音技術(shù)”。

百度輸入法發(fā)布了在線語音的“流式截斷多層注意力建模”(SMLTA)技術(shù),按其說法,是“世界上首次實現(xiàn)了局部注意力建模識別精度超過全局注意力模型”,以及“世界上第一次大規(guī)模部署在線語音交互注意力模型”。該技術(shù)可以解決傳統(tǒng)模型存在的“時延性”問題,百度方面宣稱其“將在線語音識別精度提升了15%,超越行業(yè)最高水平15%”。

2、一邊是5G時代到來,一邊更應關注“沒網(wǎng)”的需求

刷短視頻、聊微信、打游戲、購物……這些地鐵族的標配,其實隱含了輸入法的另一個需求:如何解決旺盛的離線識別需求。

5G時代的腳步越來越近,但列車、電梯、隧道、高密度人群(例如春運的火車站)環(huán)境下,網(wǎng)慢、無網(wǎng)給語音輸入提出了更嚴峻的挑戰(zhàn)。而越是斷網(wǎng)的場景,用戶對輸入法的需求其實越高,在寫字樓網(wǎng)絡好的場景其使用頻率反而降低(工作等原因)。

由此,AI語音離線識別近來成為輸入法產(chǎn)品爭相打造的技術(shù)。搜狗就宣稱其可以實現(xiàn)4國語言離線翻譯,而百度則盯住Deep Peak 2系統(tǒng)進行優(yōu)化嘗試解決用戶多元輸入場景的需求。目前,在地鐵、電梯、隧道或人流密集等離線場景中,百度輸入法仍然可實現(xiàn)精準的語音輸入,官方稱“高于行業(yè)平均水平35%”,從這次發(fā)布會的一段各輸入法即興離線語音識別PK來看,百度輸入法的確占優(yōu)。

3、只有一個產(chǎn)品,卻必須滿足極端多樣化的需求

誠如前文所言,在中文環(huán)境下,輸入法不得不面臨多樣化的輸入需求,方言、英文、不同語法……而輸入法不可能為各地、各用戶群分別開發(fā),由此,如何更好地同時兼容各語言,成為輸入法“體驗”的重要環(huán)節(jié)。

例如,方言識別已經(jīng)是多數(shù)輸入法的“標配”,然而,由于技術(shù)的限制,用戶往往還需要一個“進入”方言的切換動作,一方面這與互聯(lián)網(wǎng)盡量簡潔的產(chǎn)品思維相悖,另一方面對很多對電子產(chǎn)品不熟的下沉用戶而言形成了天然阻隔。

這給了百度輸入法機會,其“方言與方言、方言與普通話的混合語音輸入”技術(shù),目前實現(xiàn)了無縫切換,用戶可實現(xiàn)“自由說”。與此類似地,中英文夾雜亦可來回切換。目前為止,百度輸入法應當是市面上唯一實現(xiàn)了高精度中英文混合語音輸入、方言免切換語音輸入的輸入法產(chǎn)品。

AI技術(shù)PK后,輸入法還有你想象不到的“新機會”

客觀地說,在AI技術(shù)浪潮下,上述技術(shù)革新帶來的細節(jié)體驗,相信各大輸入法一定會盡快補齊,畢竟產(chǎn)品目標擺在那里,去實現(xiàn)就行了。

然而,從這次發(fā)布會來看,百度輸入法或還“留了一手”,AI輸入法樣板的聚焦點可能不只有AI,百度還意圖顛覆關于輸入法的舊有認知,為輸入法應用打開新的應用場景與商業(yè)可能。

從百度輸入法AI探索版新交互、新表達、新探索三大產(chǎn)品主題來看,其試圖結(jié)合用戶需求、互聯(lián)網(wǎng)產(chǎn)品理念、AI技術(shù)趨勢等大環(huán)境,顛覆輸入法三個固有認知:

1、"輸入法只是C端產(chǎn)品“

輸入法當然是給普通用戶使用的,它是最成功、最普及的C端產(chǎn)品之一。不過,視頻維度的信息輸入可能為輸入法打開了新的商業(yè)空間大門。

百度輸入法AI探索版的拍立活、秀場,需要平臺提供特定的元素配合。百度海外輸入法曾經(jīng)與超級IP《變形金剛》系列首部獨立電影《大黃蜂》聯(lián)手推出“大黃蜂”系列主題貼圖和AR表情,此外,還與Hello Kitty、小黃鴨、小王子、格林奇等全球100余個知名IP達成合作,推出IP皮膚和表情。

在此基礎上,百度輸入法針對海外用戶還設計了本地網(wǎng)紅合作推廣等定制化傳播,而這,可能就是搜狗輸入法等產(chǎn)品一直夢寐以求的變現(xiàn)路徑,有了B端合作的可能。

2、"輸入法是工具產(chǎn)品“

用完就扔,召之即來揮之即去,輸入法做個最普及的“工具產(chǎn)品”倒也沒什么,但是偏偏全感官輸入給輸入法撕開了一個貼合當前移動互聯(lián)網(wǎng)內(nèi)容需求的口子。

不久前,微信力推朋友圈的小視頻功能,用戶可即時拍攝視頻分享。很明顯,社交+泛娛樂(尤其是短視頻)成為各家都在爭搶的潛力領域,頭條系、微信都試圖往對方領域滲透。

而“全感官輸入”一個討巧的地方就在于,類似AR這種應用,讓一對一聊天和群聊環(huán)境下,用戶可以直接發(fā)出類似小視頻的內(nèi)容進行共享,實現(xiàn)小視頻社交的目的,這就是大佬們都在追求的社交與視頻融合。

不過,目前來看,AR應用只處在增強輸入體驗階段,社交泛娛樂產(chǎn)品只是未來的想象空間。

3、"輸入法只能用來PC、手機輸入“

最早的漢字輸入還需要專門的“漢卡”硬件,到后來PC時代開始進入軟件化,移動互聯(lián)網(wǎng)時代更是帶來多種便捷輸入體驗。

現(xiàn)在,這一進程還在繼續(xù),輸入法或?qū)⒂忻撾x于PC、手機的可能。

百度輸入法AI探索版的“新探索”推出了凌空手寫,用手指在攝像頭取景范圍內(nèi)的空中手寫,輸入法即可識別并生成文字。乍看這是利用手機攝像頭和AI技術(shù)的一種新奇玩法,而事實上,這意味著輸入法有了脫離PC和手機的機會,比如,在目前已有的案例中,百度輸入法凌空手寫技術(shù)已經(jīng)在小尋手表、小天才電話手表上得到應用。

這意味著,凌空手寫或類似的AI技術(shù),有可能將輸入法可導入到更多智能終端當中,為輸入法打開完全不一樣的場景新天地,同時推動智能硬件的體驗更新。

拭目以待吧。

*以上圖片來源于網(wǎng)絡。

【完】

曾響鈴

1鈦媒體、品途商業(yè)評論等2016年度十大作者;

2虎嘯獎評委;

3作家:【移動互聯(lián)網(wǎng)+ 新常態(tài)下的商業(yè)機會】等暢銷書作者;

4《商界》《商界評論》《銷售與市場》等近十家雜志撰稿人;

5鈦媒體、界面、虎嗅等近80家專欄作者;

6“腦藝人”(腦力手藝人)概念提出者,現(xiàn)演變?yōu)?ldquo;自媒體”,成為一個行業(yè)。

7現(xiàn)為“今日頭條問答簽約作者”、多家科技智能公司傳播顧問。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

  • 盤古大模型,不一樣的「煙火氣」

    文/八真出品/節(jié)點商業(yè)組2023年已過半,但AI大模型依舊熱的發(fā)燙??萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心的《中國人工智能大模型地圖研究報告》顯示,迄今為止,中國已發(fā)布79個10億參數(shù)規(guī)模以上的大模型。與此同時,伴隨著越來越多的選手謀局落子和下場奪舍,把這場摧枯拉朽的科技盛典推向高潮,更多人開始思考,AI

    標簽:
    ai技術(shù)
  • PRINS.AI榮獲2023SAIL之星

    PRINS平臺被世界人工智能大會授予2023年人工智能行業(yè)著名的SAIL之星。這證明了公司在AI人工智能方面所做的努力。PRINS(PRINSAITechnologyLtd)是一家專注于虛擬體驗技術(shù)解決方案的技術(shù)公司,由人工智能研究人員和技術(shù)專家組成的核心團隊創(chuàng)立。目前已獲得多家知名投資機構(gòu)的投資,

    標簽:
    ai技術(shù)
  • AI+軟件,為什么可以看多用友?

    文/七公出品/節(jié)點商業(yè)組2023年,“ChatGPT”的問世讓人工智能(AI)空前興奮和繁盛。有人高呼這是“iPhone時刻”,有人振臂這是第四次工業(yè)革命,也有人驚嘆這是新一代的“火”和“電”??偠灾?,這場史無前例的大變革,正在復刻2015年前后的“互聯(lián)網(wǎng)+”行情,推動“AI+”成為未來十幾年的發(fā)

    標簽:
    ai技術(shù)
  • 匯聚中國AI頂尖力量 云天勵飛參與華為AI大模型聯(lián)合創(chuàng)新

    2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運營商、科研院所等優(yōu)秀團隊

    標簽:
    ai技術(shù)
  • 用友大易:邁入AI招聘2.0時代,讓人力資源回歸本質(zhì)

    這幾個月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個名詞重回C位。過去在AI1.0時代,主要通過訓練模型來實現(xiàn)圖像識別、聲音識別、語言處理等特

    標簽:
    ai技術(shù)

熱門排行

信息推薦