前言
近年來(lái),物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)的迅猛發(fā)展使得數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)增長(zhǎng),智能文字識(shí)別作為文檔數(shù)據(jù)管理的核心技術(shù),迎來(lái)良好發(fā)展機(jī)遇。2022 年我國(guó)智能文字識(shí)別市場(chǎng)規(guī)模已超50億元,預(yù)計(jì)2027年我國(guó)智能文字識(shí)別市場(chǎng)規(guī)模接近170億元,2022-2027年年復(fù)合增長(zhǎng)率達(dá)27.3%。
按照下游客戶類型及交付形式,智能文字識(shí)別服務(wù)可分為 C 端標(biāo)準(zhǔn)化產(chǎn)品、B端標(biāo)準(zhǔn)化產(chǎn)品、B 端基礎(chǔ)技術(shù)服務(wù)、B 端場(chǎng)景化解決方案四種形式。伴隨下游個(gè)人用戶和企業(yè)客戶對(duì)文檔資產(chǎn)數(shù)字化與智能化升級(jí)需求的驅(qū)動(dòng)下,我國(guó)智能文字識(shí)別各類型細(xì)分市場(chǎng)均保持較高增速。從下游領(lǐng)域看,制造業(yè)、金融、物流等對(duì)智能文字識(shí)別技術(shù)需求較大,是智能文字識(shí)別技術(shù)的主要應(yīng)用領(lǐng)域。
從競(jìng)爭(zhēng)情況看,C端競(jìng)爭(zhēng)方面,智能文字識(shí)別類主流APP中掃描全能王先發(fā)優(yōu)勢(shì)優(yōu)勢(shì)明顯,處于行業(yè)領(lǐng)先地位。B端競(jìng)爭(zhēng)方面,智能文字識(shí)別 B 端市場(chǎng)競(jìng)爭(zhēng)參與者主要分為谷歌、百度、騰訊、阿里等綜合型 AI 廠商和合合信息、ABBYY等非綜合型 AI 廠商。非綜合型 AI 廠商和綜合型 AI 廠商有著不同的側(cè)重領(lǐng)域;且細(xì)分市場(chǎng)競(jìng)爭(zhēng)格局存在差別,形成B 端差異化競(jìng)爭(zhēng)。
一、智能文字識(shí)別正確率高于傳統(tǒng)文字識(shí)別,行業(yè)發(fā)展前景廣闊
根據(jù)觀研報(bào)告網(wǎng)發(fā)布的《中國(guó)智能文字識(shí)別行業(yè)發(fā)展趨勢(shì)分析與未來(lái)前景研究報(bào)告(2024-2031年)》顯示,智能文字識(shí)別是從圖像中識(shí)別出文字的技術(shù),利用機(jī)器將圖像中手寫或印刷文本轉(zhuǎn)化為計(jì)算機(jī)可以直接處理的格式。智能文字識(shí)別能夠處理不同場(chǎng)景的圖像,包括拍攝或掃描得到的各種卡證、紙質(zhì)文檔圖像,也包括含有文字的自然場(chǎng)景圖像和疊加了字幕文本的視頻圖像等。相比傳統(tǒng)文字識(shí)別,智能文字識(shí)別具有更強(qiáng)的認(rèn)知能力和判別力,正確率更高,是個(gè)人數(shù)字資產(chǎn)管理及企業(yè)自動(dòng)化辦公提升的重要工具。
資料來(lái)源:觀研天下整理
近年來(lái),物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)的迅猛發(fā)展使得數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)增長(zhǎng),智能文字識(shí)別作為文檔數(shù)據(jù)管理的核心技術(shù),迎來(lái)良好發(fā)展機(jī)遇。根據(jù)數(shù)據(jù),2017年我國(guó)智能文字識(shí)別市場(chǎng)規(guī)模僅為6.1億元,至2022 年我國(guó)智能文字識(shí)別市場(chǎng)規(guī)模已超50億元,預(yù)計(jì)2027年我國(guó)智能文字識(shí)別市場(chǎng)規(guī)模接近170億元,2022-2027年年復(fù)合增長(zhǎng)率達(dá)27.3%。
數(shù)據(jù)來(lái)源:觀研天下數(shù)據(jù)中心整理
二、智能文字識(shí)別服務(wù)內(nèi)容分為四類,預(yù)計(jì)未來(lái)均保持較高增速
按照下游客戶類型及交付形式,智能文字識(shí)別服務(wù)可分為 C 端標(biāo)準(zhǔn)化產(chǎn)品、B端標(biāo)準(zhǔn)化產(chǎn)品、B 端基礎(chǔ)技術(shù)服務(wù)、B 端場(chǎng)景化解決方案四種形式。伴隨下游個(gè)人用戶和企業(yè)客戶對(duì)文檔資產(chǎn)數(shù)字化與智能化升級(jí)需求的驅(qū)動(dòng)下,我國(guó)智能文字識(shí)別各類型細(xì)分市場(chǎng)均保持較高增速。預(yù)計(jì)2022-2027年我國(guó)智能文字識(shí)別中基礎(chǔ)技術(shù)服務(wù)、標(biāo)準(zhǔn)化產(chǎn)品(C端)、標(biāo)準(zhǔn)化產(chǎn)品(B端)、場(chǎng)景化解決方案CAGR分別為16.5%、22.4%、30%、31.6%。
智能文字識(shí)別服務(wù)分類
服務(wù) | 定義 | 產(chǎn)品形態(tài) | 下游客戶 |
基礎(chǔ)技術(shù)服務(wù) | 智能文字識(shí)別所需要基礎(chǔ)性技術(shù)服務(wù),通常服務(wù)于版式相對(duì)標(biāo)準(zhǔn)化的文檔、證件識(shí)別 | 各類證件識(shí)別,如身份證識(shí)別、駕照識(shí)別、銀行卡識(shí)別等技術(shù)授權(quán)預(yù)裝,如手機(jī)授權(quán)預(yù)裝等 | 下游客戶主要為具有一定開發(fā)能力的企業(yè)客戶 |
標(biāo)準(zhǔn)化產(chǎn)品(C端) | 基于智能文字識(shí)別技術(shù)所打造的標(biāo)準(zhǔn)化、可直接使用的產(chǎn)品 | C端產(chǎn)品文檔管理、名片管理APP部分辦公軟件中也提供智能文字識(shí)別功能 | C端產(chǎn)品下游客戶主要為C端個(gè)人消費(fèi)者 |
標(biāo)準(zhǔn)化產(chǎn)品(B端) | 基于智能文字識(shí)別技術(shù)所打造的標(biāo)準(zhǔn)化的SaaS/PaaS產(chǎn)品 | B端產(chǎn)品面向B端的標(biāo)準(zhǔn)化產(chǎn)品,如名片管理企業(yè)版產(chǎn)品;智能文字識(shí)別各類服務(wù)相關(guān)的SaaS/PaaS產(chǎn)品 | B端產(chǎn)品對(duì)標(biāo)準(zhǔn)化SaaS/PaaS產(chǎn)品有需求的企業(yè),主要為中型企業(yè)或大型企業(yè)的部分部門 |
場(chǎng)景化解決方案 | 基于智能文字識(shí)別技術(shù)、產(chǎn)品,根據(jù)客戶場(chǎng)景化需求而開發(fā)的深度服務(wù)解決方案,以幫助B端用戶實(shí)現(xiàn)流程數(shù)字化與智能化升級(jí) | AI機(jī)器人,如財(cái)報(bào)分析比對(duì)、合同內(nèi)容比對(duì)等AI訓(xùn)練平臺(tái),下游客戶可自行進(jìn)行智能文字識(shí)別訓(xùn)練 | 下游客戶主要為B端大型企業(yè)目前NLP等技術(shù)在醫(yī)療領(lǐng)域應(yīng)用(如臨床決策輔助系統(tǒng)、病例質(zhì)控系統(tǒng)等)較為廣泛,所以目前場(chǎng)景化解決方案有較多醫(yī)療企業(yè)客戶 |
資料來(lái)源:觀研天下整理
數(shù)據(jù)來(lái)源:觀研天下數(shù)據(jù)中心整理
三、金融、物流等對(duì)智能文字識(shí)別技術(shù)需求相對(duì)較大,為行業(yè)主要下游應(yīng)用領(lǐng)域
制造業(yè)、政府、房地產(chǎn)、物流、醫(yī)療健康、金融企業(yè)對(duì)業(yè)務(wù)流程方面的基礎(chǔ)信息化建設(shè)程度投入意愿相對(duì)較高,在證照、單據(jù)、表格等文檔的智能錄入、分類、比對(duì)、審核方面進(jìn)行降本增效具有較大需求,是智能文字識(shí)別技術(shù)的主要應(yīng)用領(lǐng)域。預(yù)計(jì)2020-2025年我國(guó)制造業(yè)、政府、房地產(chǎn)、物流、醫(yī)療健康、個(gè)人消費(fèi)者、泛金融、其他領(lǐng)域智能文字識(shí)別市場(chǎng)規(guī)模CAGR分別為54.1%、49.4%、43.1%、36.5%、36.2%、33.8%、29.6%、25.7%。
數(shù)據(jù)來(lái)源:觀研天下數(shù)據(jù)中心整理
四、智能文字識(shí)別 APP 中掃描全能王發(fā)展領(lǐng)先,B端細(xì)分市場(chǎng)格局存在差異
從C端競(jìng)爭(zhēng)看,智能文字識(shí)別類主流APP包括掃描全能王CamScanner、Officelens、GoogleLens、ABBYY FineScanner、AdobeScan、Scannable掃描寶,其中掃描全能王已經(jīng)在用戶規(guī)模、品牌知名度、用戶口碑等方面建立了先發(fā)優(yōu)勢(shì),在文字識(shí)別 APP 領(lǐng)域保持行業(yè)領(lǐng)先地位。
文字識(shí)別類主流APP基本情況
APP | 簡(jiǎn)介 | 上線時(shí)間 | 用戶數(shù)量 | 用戶體驗(yàn) |
掃描全能王CamScanner | 將智能手機(jī)變成便攜式掃描儀,采集、管理各種文檔產(chǎn)品,支持文檔圖片的智能切邊、智能圖像增強(qiáng)、票據(jù)/證照/表格等多種文檔的文字識(shí)別功能 | 2010 年 | 2023 年的平均月活為 14,540.4 萬(wàn) | iOS 中國(guó)區(qū)評(píng)分 4.9,評(píng)分個(gè)數(shù) 450.6 萬(wàn)個(gè)iOS 美國(guó)區(qū)評(píng)分為 4.9,評(píng)分個(gè)數(shù) 126.3 萬(wàn)個(gè) |
Officelens | 微軟集團(tuán)旗下的掃描與文字識(shí)別產(chǎn)品,可將圖像轉(zhuǎn)換為 PDF、Word、PowerPoint 或 Excel 文件,將打印或手寫文本數(shù)字化 | 2015 年 | 2023 年的平均月活為 1,269.6 萬(wàn) | iOS 中國(guó)區(qū)評(píng)分 4.9,評(píng)分個(gè)數(shù) 3.1 萬(wàn)個(gè)iOS 美國(guó)區(qū)評(píng)分為 4.8,評(píng)分個(gè)數(shù) 10.7 萬(wàn)個(gè) |
GoogleLens | 微軟集團(tuán)旗下的掃描與文字識(shí)別產(chǎn)品,可將圖像轉(zhuǎn)換為 PDF、Word、PowerPoint 或 Excel 文件,將打印或手寫文本數(shù)字化 | 2017 年 | 2023 年的平均月活為 2,488.1 萬(wàn) | Googlelens未在 AppStore 上架 |
ABBYY FineScanner | ABBYY 集團(tuán)旗下開發(fā)的產(chǎn)品,可從掃描內(nèi)容中提取文本進(jìn)行進(jìn)一步編輯和共享 | 2012 年 | 2023 年的平均月活為 4.1 萬(wàn) | iOS 中國(guó)區(qū)評(píng)分 4.8,評(píng)分個(gè)數(shù) 0.7 萬(wàn)個(gè)iOS 美國(guó)區(qū)評(píng)分為 4.7,評(píng)分個(gè)數(shù) 1.9 萬(wàn)個(gè) |
AdobeScan | Adobe 集團(tuán)旗下開發(fā)的掃描與文字識(shí)別產(chǎn)品,能夠?qū)⑷魏渭堎|(zhì)文檔轉(zhuǎn)換為AdobePDF,同時(shí)具備 OCR 功能 | 2017 年 | 2023 年的平均月活為 6,623.6 萬(wàn) | iOS 中國(guó)區(qū)未上架iOS 美國(guó)區(qū)評(píng)分為 4.9,評(píng)分個(gè)數(shù) 123.6 萬(wàn)個(gè) |
Scannable掃描寶 | Evernote 印象筆記旗下的掃描與文字識(shí)別產(chǎn)品,可將紙質(zhì)文件掃描成圖片,并支持 OCR 文字識(shí)別,可無(wú)縫對(duì)接至印象筆記 | 2010 年 | 2023 年的平均月活為 48.9 萬(wàn) | iOS 中國(guó)區(qū)評(píng)分 4.9,評(píng)分個(gè)數(shù) 13.0 萬(wàn)個(gè)iOS 美國(guó)區(qū)未上架 |
資料來(lái)源:觀研天下整理
從B端看,智能文字識(shí)別 B 端市場(chǎng)競(jìng)爭(zhēng)參與者主要分為谷歌、百度、騰訊、阿里等綜合型 AI 廠商和合合信息、ABBYY等非綜合型 AI 廠商。
綜合型 AI 廠商旗下云平臺(tái)提供的 B 端服務(wù)范圍廣泛且多元,包含云服務(wù)器、云存儲(chǔ)、云數(shù)據(jù)庫(kù)、人臉識(shí)別、語(yǔ)音識(shí)別、視頻分發(fā)加速等相關(guān)產(chǎn)品,智能文字識(shí)別僅為其中一種產(chǎn)品。綜合型 AI 廠商切入 OCR 領(lǐng)域的主要原因是:基于其成熟的公有云 PaaS 平臺(tái)提供基礎(chǔ)化、標(biāo)準(zhǔn)化的 OCR 識(shí)別服務(wù)的邊際成本較低,拓展 OCR 業(yè)務(wù)的主要目的是進(jìn)一步提升其云平臺(tái)服務(wù)的豐富度。但拓展場(chǎng)景化的解決方案市場(chǎng)需大量人力、研發(fā)投入配合客戶的個(gè)性化需求,項(xiàng)目周期也較長(zhǎng),邊際成本較高。而非綜合型 AI 廠商核心業(yè)務(wù)即為智能文字識(shí)別,但其在智能文字識(shí)別業(yè)務(wù)投入的人員與資金較為有限。
非綜合型 AI 廠商和綜合型 AI 廠商有著不同的側(cè)重領(lǐng)域,形成B 端差異化競(jìng)爭(zhēng)。
智能文字識(shí)別B 端市場(chǎng)競(jìng)爭(zhēng)參與者分類及其基本情況
類別 |
側(cè)重領(lǐng)域差異化 |
公司名稱 |
公司簡(jiǎn)介 |
在智能文字識(shí)別領(lǐng)域的產(chǎn)品/服務(wù) |
綜合型 AI 廠商 |
智能文字識(shí)別不是其主要核心業(yè)務(wù) |
百度云 |
又稱“百度智能云”,是百度集團(tuán)旗下的云服務(wù)平臺(tái),創(chuàng)立于2015年。其專注云計(jì)算、智能大數(shù)據(jù)、人工智能服務(wù),提供云服務(wù)器、云主機(jī)、云存儲(chǔ)、CDN、域名注冊(cè)、物聯(lián)網(wǎng)等云服務(wù)。 |
智能文字識(shí)別是百度云平臺(tái)提供的能力之一,以提供API/SDK標(biāo)準(zhǔn)化PaaS產(chǎn)品為主:近年開始布局場(chǎng)景化解決方案,2020年推出智能文字識(shí)別平臺(tái)TextMind:2021年上線EasyDLOCR智能文字識(shí)別模型自訓(xùn)練平臺(tái)。 |
騰訊云 |
是騰訊集團(tuán)旗下的云服務(wù)平臺(tái),2013年創(chuàng)立。其提供云計(jì)算、大數(shù)據(jù)、人工智能服務(wù),涵蓋云服務(wù)器、云數(shù)據(jù)庫(kù)、云存儲(chǔ)、視頻與CDN、域名注冊(cè)等全方位云服務(wù)和各行業(yè)解決方案。 |
智能文字識(shí)別是騰訊云平臺(tái)提供的能力之一,以提供API/SDK標(biāo)準(zhǔn)化PaaS產(chǎn)品為主。 |
||
阿里云 |
是阿里巴巴集團(tuán)旗下云服務(wù)平臺(tái),創(chuàng)立于2009年。其提供云服務(wù)器、云數(shù)據(jù)庫(kù)、云安全、云企業(yè)應(yīng)用等云計(jì)算服務(wù),以及大數(shù)據(jù)、人工智能服務(wù)、精準(zhǔn)定制基于場(chǎng)景的行業(yè)解決方案。 |
智能文字識(shí)別是阿里云平臺(tái)提供的能力之一,以提供API/SDK標(biāo)準(zhǔn)化PaaS產(chǎn)品為主。 |
||
Google Cloud |
是Google 集團(tuán)旗下的云計(jì)算服務(wù)平臺(tái)。其提供云計(jì)算、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析等一系列國(guó)際化的云服務(wù)。 |
Google Cloud平臺(tái)以提供API/SDK標(biāo)準(zhǔn)化PaaS產(chǎn)品為主,較少提供場(chǎng)景化解決方案。另外Google在C端APP有Google Lens產(chǎn)品。 |
||
非綜合型 AI 廠商 |
智能文字識(shí)別是其主要核心業(yè)務(wù) |
ABBYY |
1989年創(chuàng)立,是一家提供PC和移動(dòng)設(shè)備OCR、文檔識(shí)別軟件和計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)軟件的國(guó)際軟件公司。ABBYY在世界各地通過(guò)區(qū)域和國(guó)際合作伙伴的廣泛網(wǎng)絡(luò),產(chǎn)品已遠(yuǎn)銷130多個(gè)國(guó)家。 |
B端服務(wù)方面包括基礎(chǔ)技術(shù)服務(wù)、標(biāo)準(zhǔn)化服務(wù)、場(chǎng)景化解決方案,客戶以國(guó)外客戶為主,C端產(chǎn)品包括ABBYYFineScanner、ABBYYBusiness Card Reader。 |
合合信息 |
公司成立于 2006 年。2016年公司將深度學(xué)習(xí)算法、自然語(yǔ)言處理技術(shù)與 OCR 技術(shù)相結(jié)合,自主研發(fā)智能文字識(shí)別技術(shù),大幅度提升了智能文字識(shí)別技術(shù)的性能和應(yīng)用場(chǎng)景,并將 AI 技術(shù)落地成為產(chǎn)品級(jí)應(yīng)用。 |
在 B 端業(yè)務(wù)方面,2016 年,公司正式成立企業(yè)級(jí)智能解決方案事業(yè)部,面向行業(yè)頭部客戶,輸出超過(guò) 100 種證照的 OCR 基礎(chǔ)模塊服務(wù),布局文字識(shí)別 B 端企業(yè)服務(wù)領(lǐng)域。2017 年開始,公司針對(duì)不同行業(yè)復(fù)雜場(chǎng)景的文字識(shí)別進(jìn)行更多元化的商業(yè)化探索,加速布局智能文字識(shí)別 AI 機(jī)器人、AI 訓(xùn)練平臺(tái)等場(chǎng)景化解決方案。在 C 端產(chǎn)品方面,公司在 2010 年把握住了移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展機(jī)遇,上線了名片全能王、掃描全能王兩大產(chǎn)品,目前已在用戶數(shù)量、用戶體驗(yàn)、核心技術(shù)等方面獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)。 |
資料來(lái)源:觀研天下整理
智能文字識(shí)別 B 端服務(wù)不同細(xì)分市場(chǎng)的競(jìng)爭(zhēng)格局存在差異。基礎(chǔ)技術(shù)服務(wù)市場(chǎng)參與者較多,包含智能文字識(shí)別廠商、傳統(tǒng)文字識(shí)別廠商、云服務(wù)平臺(tái)廠商等。基礎(chǔ)技術(shù)服務(wù)存在一定程度的同質(zhì)化競(jìng)爭(zhēng)。
標(biāo)準(zhǔn)化B端產(chǎn)品處于發(fā)展早期,由于打造標(biāo)準(zhǔn)化SaaS(軟件即服務(wù))、PaaS(平臺(tái)即服務(wù))產(chǎn)品的技術(shù)門檻較高,目前僅有少數(shù)企業(yè)布局,目前主要參與者為合合信息(提供SaaS產(chǎn)品服務(wù))、少數(shù)云服務(wù)平臺(tái)(如阿里云、百度云、騰訊云等,提供PaaS服務(wù))
由于場(chǎng)景化解決方案通常需要于客戶現(xiàn)場(chǎng)進(jìn)行實(shí)施部署,因此具有區(qū)域性,市場(chǎng)分布較為分散。國(guó)內(nèi)幾大云平臺(tái)服務(wù)廠商及部分AI企業(yè)開始布局場(chǎng)景化解決方案,但是由于行業(yè)理解及業(yè)務(wù)場(chǎng)景落地能力需要長(zhǎng)時(shí)間的經(jīng)驗(yàn)積累,目前商業(yè)化落地案例較為有限。
B 端服務(wù)不同細(xì)分市場(chǎng)的競(jìng)爭(zhēng)格局
B端細(xì)分市場(chǎng) | 競(jìng)爭(zhēng)情況 |
基礎(chǔ)技術(shù)服務(wù) | 基礎(chǔ)技術(shù)服務(wù)市場(chǎng)參與者較多,包含智能文字識(shí)別廠商、傳統(tǒng)文字識(shí)別廠商、云服務(wù)平臺(tái)廠商等?;A(chǔ)技術(shù)服務(wù)存在一定程度的同質(zhì)化競(jìng)爭(zhēng)。 |
標(biāo)準(zhǔn)化B端產(chǎn)品 | 標(biāo)準(zhǔn)化B端產(chǎn)品處于發(fā)展早期,由于打造標(biāo)準(zhǔn)化SaaS(軟件即服務(wù))、PaaS(平臺(tái)即服務(wù))產(chǎn)品的技術(shù)門檻較高,目前僅有少數(shù)企業(yè)布局,目前主要參與者為合合信息(提供SaaS產(chǎn)品服務(wù))、少數(shù)云服務(wù)平臺(tái)(如阿里云、百度云、騰訊云等,提供PaaS服務(wù)) |
場(chǎng)景化解決方案 | 由于場(chǎng)景化解決方案通常需要于客戶現(xiàn)場(chǎng)進(jìn)行實(shí)施部署,因此具有區(qū)域性,市場(chǎng)分布較為分散。國(guó)內(nèi)幾大云平臺(tái)服務(wù)廠商及部分AI企業(yè)開始布局場(chǎng)景化解決方案,但是由于行業(yè)理解及業(yè)務(wù)場(chǎng)景落地能力需要長(zhǎng)時(shí)間的經(jīng)驗(yàn)積累,目前商業(yè)化落地案例較為有限。 |
資料來(lái)源:觀研天下整理(zlj)
【版權(quán)提示】觀研報(bào)告網(wǎng)倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán)。未經(jīng)許可,任何人不得復(fù)制、轉(zhuǎn)載、或以其他方式使用本網(wǎng)站的內(nèi)容。如發(fā)現(xiàn)本站文章存在版權(quán)問題,煩請(qǐng)?zhí)峁┌鏅?quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至kf@chinabaogao.com,我們將及時(shí)溝通與處理。