當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

厲害了!優(yōu)圖OCR技術(shù)支持的“圖片文字提取”功能逆天了

 2017-08-16 17:21  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

最近,手機(jī)QQ最新版本升級(jí)了“圖片文字提取”功能,可以將圖片中的文字提取出來(lái)并可以隨意編輯,用起來(lái)簡(jiǎn)直方便到逆天。

只要打開(kāi)手機(jī)QQ,長(zhǎng)按對(duì)話框中的圖片選擇“提取圖中文字”,或是點(diǎn)擊“掃一掃”中的“文字提取”,在超有科幻感的“正在識(shí)別中”完成之后,用戶就可以得到圖片中轉(zhuǎn)化出的文字。提取出的文字還可以隨意編輯,復(fù)制粘貼修改都沒(méi)問(wèn)題。

手機(jī)QQ的這一新大招,正是基于騰訊優(yōu)圖實(shí)驗(yàn)室提供的OCR文字識(shí)別技術(shù)。

復(fù)雜場(chǎng)景也不怕 OCR技術(shù)帶來(lái)的讀圖識(shí)字時(shí)代

優(yōu)圖的OCR文字識(shí)別技術(shù),顧名思義,就是將圖片上的文字內(nèi)容,智能識(shí)別成為可編輯的文本。

無(wú)論是生活中復(fù)雜多變場(chǎng)景,還是不同光照條件,甚至透視變形的情況下,優(yōu)圖OCR技術(shù)都可以在任意版面下識(shí)別出整圖的文字,包括中英文、字母、數(shù)字、標(biāo)點(diǎn)等共1000標(biāo)簽,并覆蓋到數(shù)十種字體,滿足生活中大部分場(chǎng)景的讀圖識(shí)字需求,以解決生活和溝通中的痛點(diǎn)。

背后的黑科技是基于優(yōu)圖實(shí)驗(yàn)室世界領(lǐng)先的深度學(xué)習(xí)技術(shù),識(shí)別準(zhǔn)確率也居于業(yè)界一流水平。近期,優(yōu)圖團(tuán)隊(duì)在國(guó)際權(quán)威的ICDAR2015“Robust Reading Competition”的自然場(chǎng)景文本檢測(cè)項(xiàng)目,以及ICDAR2015“Focused Scene Text”場(chǎng)景文字識(shí)別任務(wù)中,均以優(yōu)越的表現(xiàn)超越眾多競(jìng)爭(zhēng)對(duì)手,取得了排名第一的佳績(jī)。

OCR技術(shù)實(shí)現(xiàn)多場(chǎng)景應(yīng)用落地讓溝通無(wú)障礙

實(shí)際上,在我們的日常生活中,不少細(xì)微之處都有讀圖識(shí)字的需求,優(yōu)圖OCR技術(shù)貼心地填補(bǔ)這些細(xì)節(jié)的需求空缺,從而提高了人們生活的品質(zhì)和工作的效率:

在日常會(huì)議或課堂中,用手機(jī)拍下PPT、演示稿,能立即對(duì)圖片中的文字進(jìn)行編輯,而不再因?yàn)榛庞诔瓕?xiě)而錯(cuò)過(guò)了臺(tái)上的精彩分享;

在超市里,隨手拍下想買(mǎi)的商品分享給家人,即時(shí)從圖片中提取文字而不用拉動(dòng)圖片放大看文字,快速解決“選擇困難癥”;

在編輯室內(nèi),隨手拍海量紙質(zhì)資料進(jìn)行圖片文字提取編輯,以便排版、存檔、檢索,傳統(tǒng)媒體數(shù)字化轉(zhuǎn)型無(wú)需再消耗巨大人力在前期資料歸集上;

在家里,長(zhǎng)輩為拉近與兒孫輩的距離,不用再對(duì)著年輕人發(fā)來(lái)的圖片一籌莫展,通過(guò)圖片文字提取識(shí)別便能夠看清圖上文字;

而對(duì)于存在視覺(jué)障礙的人群而言,OCR技術(shù)還能幫助他們讀圖識(shí)字,甚至結(jié)合語(yǔ)音技術(shù),這些文字能被轉(zhuǎn)化為語(yǔ)音,進(jìn)而避免很多溝通障礙,更具社會(huì)意義。

除此之外,優(yōu)圖的OCR技術(shù)還支持印刷體和手寫(xiě)體識(shí)別,包括身份證、名片等卡證類(lèi),也支持票據(jù)、運(yùn)單等定制化場(chǎng)景的識(shí)別,這些讓信息錄入更加快速高效,而錄入人員再也不用敲鍵盤(pán)到手酸了。同時(shí),OCR通用識(shí)別還可應(yīng)用于互聯(lián)網(wǎng)內(nèi)容審核管理,能夠高效、智能識(shí)別廣告圖片中的所有文字內(nèi)容,準(zhǔn)確過(guò)濾掉廣告中的違規(guī)文字及黑產(chǎn)廣告。

潦草的手寫(xiě)體也能識(shí)別快遞不會(huì)再送錯(cuò)人了

優(yōu)圖的OCR技術(shù)與傳統(tǒng)行業(yè)的結(jié)合,還能對(duì)行業(yè)產(chǎn)生更深遠(yuǎn)的影響。如在物流行業(yè),OCR技術(shù)的應(yīng)用就能夠提高快遞運(yùn)單的識(shí)別效率,從而給消費(fèi)者帶來(lái)更便捷高效的快遞服務(wù)。

現(xiàn)如今,依然有很多快遞單上都是手寫(xiě)的地址信息,潦草的字容易認(rèn)錯(cuò)而加大了物流中的人力、物力和時(shí)間成本。近期,優(yōu)圖的OCR技術(shù)就與順豐技術(shù)團(tuán)隊(duì)合作,實(shí)現(xiàn)快速識(shí)別手寫(xiě)體的快遞單,再潦草的手寫(xiě)寄件收件信息也能夠識(shí)別,并接近人工識(shí)別水平。

優(yōu)圖的OCR技術(shù)也在展開(kāi)積極的內(nèi)外部合作。手機(jī)QQ、順豐之外,優(yōu)圖OCR識(shí)別技術(shù)也與騰訊微云達(dá)成合作,為其用戶提供圖片內(nèi)文字的檢測(cè)和識(shí)別服務(wù)。

在云時(shí)代,通過(guò)技術(shù)的不斷優(yōu)化和廣泛的內(nèi)外部合作,在隨手可及的細(xì)微之處滿足日常生活的圖文轉(zhuǎn)換需求,對(duì)接行業(yè)成為數(shù)字化迭代的源動(dòng)力,優(yōu)圖OCR技術(shù)的意義正在于此。目前優(yōu)圖的OCR技術(shù)已經(jīng)通過(guò)騰訊云對(duì)外開(kāi)放,用科技連接各行各業(yè),帶動(dòng)行業(yè)的智能化變革。在未來(lái),希望每一個(gè)普通人也都將從中受益。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
圖片轉(zhuǎn)文字

相關(guān)文章

熱門(mén)排行

信息推薦