平板掃描儀在正在逐漸的淡出人們的視野。它們正在被智能手機(jī)和相關(guān)的應(yīng)用程序所取代,這些應(yīng)用程序正在成為桌面設(shè)備的成熟替代品。使用移動(dòng)掃描實(shí)現(xiàn)流程自動(dòng)化對(duì)于各種規(guī)模的企業(yè)來說更具成本效益,即使對(duì)于小企業(yè)來說也是負(fù)擔(dān)得起的。當(dāng)然,您可以簡(jiǎn)單地通過使用智能手機(jī)相機(jī)拍照,但您最終會(huì)得到一張帶有不必要背景和額外偽影的照片。
在這種情況下,理想的解決方案是運(yùn)行在人工智能上的移動(dòng)掃描應(yīng)用程序。為什么質(zhì)量掃描如此重要?即使在最困難的條件下,人工智能也有助于確定文檔邊界并進(jìn)行完美掃描。用戶很少考慮會(huì)影響掃描結(jié)果的因素。透視變形、光照、顏色和背景紋理——我們 可以在神經(jīng)網(wǎng)絡(luò)的幫助下解決所有這些問題。這有助于用戶在 2 秒內(nèi)自動(dòng)進(jìn)行掃描,而不是手動(dòng)選擇文檔,這需要 5-6 秒以上。
應(yīng)用程序中的神經(jīng)網(wǎng)絡(luò) :當(dāng)前的挑戰(zhàn)和對(duì)該領(lǐng)域的期望。在應(yīng)用程序中實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的最大挑戰(zhàn)是資源。最先進(jìn)的算法需要大量的計(jì)算能力,而移動(dòng)設(shè)備有時(shí)甚至無法加載這些算法。這個(gè)問題有兩種解決方案:在云中運(yùn)行網(wǎng)絡(luò)并通過 Internet 向用戶提供結(jié)果。使用適合移動(dòng)設(shè)備的特殊網(wǎng)絡(luò)并在設(shè)備本身上運(yùn)行。
第一個(gè)解決方案更昂貴,因?yàn)樗枰獞?yīng)用程序發(fā)布者租用服務(wù)器。此外,它僅在 Internet 可用時(shí)才有效。但是,它使我們能夠?yàn)橛脩籼峁┳瞵F(xiàn)代且資源消耗最少的算法,而不管硬件如何。
至于第二種解決方案,它要求我們考慮與我們的應(yīng)用程序兼容的最古老的設(shè)備,并開發(fā)可以與它們一起使用的特殊網(wǎng)絡(luò)。
這些解決方案都不是最佳選擇。如果您需要盡可能高的準(zhǔn)確性,或者如果算法過于耗費(fèi)資源,那么第一個(gè)選擇就是要走的路。如果您需要一個(gè)運(yùn)行良好且不需要 Internet 連接的解決方案,請(qǐng)選擇第二個(gè)。您甚至可以通過在設(shè)備上運(yùn)行網(wǎng)絡(luò)的一部分和在云中運(yùn)行另一部分來將這兩者合二為一。
在不久的將來,我們的手機(jī)將變得更加強(qiáng)大,深度學(xué)習(xí)研究人員將開發(fā)更高效的神經(jīng)網(wǎng)絡(luò)架構(gòu),使我們能夠在移動(dòng)設(shè)備上運(yùn)行該領(lǐng)域的一些最佳算法。我們還將能夠使用最好的云 GPU,并通過 5G 將結(jié)果發(fā)送給用戶。所有這些都將使用戶體驗(yàn)完美無缺。
移動(dòng)應(yīng)用對(duì)神經(jīng)網(wǎng)絡(luò)技術(shù)的市場(chǎng)需求是什么?
對(duì)于中小型企業(yè)來說,提高效率和優(yōu)化成本的需求仍然是首要任務(wù)(而且這一趨勢(shì)每年都在增加)??焖賿呙栉臋n、支票和收據(jù)的需求仍然存在,但我們手頭并不總是有平板掃描儀。此外,重要的是進(jìn)行沒有缺陷的高質(zhì)量掃描,這對(duì)于基于訓(xùn)練有素的神經(jīng)網(wǎng)絡(luò)的移動(dòng)掃描儀來說是一項(xiàng)容易的任務(wù)。
現(xiàn)在,當(dāng)人們離開設(shè)備齊全的工作場(chǎng)所時(shí),使用文件進(jìn)行遠(yuǎn)程工作的問題變得相當(dāng)?shù)念l繁。因此,一個(gè)允許企業(yè)家有效組織遠(yuǎn)程工作并在幾次點(diǎn)擊中發(fā)送高質(zhì)量文檔的移動(dòng)應(yīng)用程序?qū)ζ髽I(yè)來說是有價(jià)值的。
人工智能掃描移動(dòng)應(yīng)用程序不僅被企業(yè)家用。此類應(yīng)用程序的目標(biāo)受眾包括來自各個(gè)領(lǐng)域的用戶:在旅途中工作的人(記者、醫(yī)務(wù)人員、推銷員)、學(xué)生(不僅需要掃描,還需要在手機(jī)上快速編輯文檔,然后通過信使發(fā)送給老師)、學(xué)校教師和大學(xué)教授。
神經(jīng)網(wǎng)絡(luò)上運(yùn)行的移動(dòng)應(yīng)用程序有什么獨(dú)特之處?
應(yīng)用程序最困難的任務(wù)是確定用戶究竟想要掃描什么。這一切都始于圖像中文檔的正文和邊框的定義。大多數(shù)掃描應(yīng)用程序無法準(zhǔn)確、自動(dòng)地檢測(cè)邊界,或者在此過程中犯了很多錯(cuò)誤。例如,找出表格的開始位置和文檔的結(jié)束位置并非易事。如果紙張放在白色桌子上,或者通常情況下放在一堆文件上,情況只會(huì)變得更加復(fù)雜。這就是人工智能來拯救的地方。
如今,使用手機(jī)在幾秒鐘內(nèi)獲得高質(zhì)量掃描文檔的需求已成為新世界的現(xiàn)實(shí)。因此,應(yīng)用程序開發(fā)人員不僅應(yīng)該考慮提高掃描質(zhì)量,還應(yīng)該考慮人工智能應(yīng)用程序的附加功能,因?yàn)閷呙钁?yīng)用程序轉(zhuǎn)變?yōu)槎喙δ芷脚_(tái)的趨勢(shì)很明顯。