賽題名稱:基于深度學(xué)習(xí)的銀行卡號識別系統(tǒng)
組類: A 本科及以上
賽題簡介:介紹整個(gè)賽題的思路和整體要求
人類對外界信息的認(rèn)識及感知,最基本的就來自于視覺,因此對視覺信息的搜集與處理,一直是人類認(rèn)識世界、認(rèn)識規(guī)律的重要手段。人工智能技術(shù),通過對視覺信息的采集,對圖形圖像信息做科學(xué)的篩選、比對并分析,然后經(jīng)過算法(深度學(xué)習(xí))、理解和思考之后,將真實(shí)的現(xiàn)實(shí)內(nèi)容呈現(xiàn)在計(jì)算機(jī)中。
隨著人工智能、深度學(xué)習(xí)技術(shù)的發(fā)展,人工智能技術(shù)在視覺領(lǐng)域方面的應(yīng)用日益突出,得到了廣泛的關(guān)注和研究。本題要求同學(xué)們使用基于深度學(xué)習(xí)的視覺識別技術(shù),拓展現(xiàn)有的光學(xué)識別技術(shù)(OCR)來完成一個(gè)識別銀行卡號的系統(tǒng),此系統(tǒng)包括數(shù)據(jù)集處理、銀行卡號定位檢測、銀行卡號識別三部分。本賽題要求使用深度學(xué)習(xí)技術(shù)體系完成,本題的目的不僅在于比試,更重視參賽同學(xué)的個(gè)人提升。
賽題業(yè)務(wù)場景:描述賽題相關(guān)的真實(shí)企業(yè)業(yè)務(wù)背景。從真實(shí)場景中,適當(dāng)簡化或者提煉出適合比賽的賽題場景
由于移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,移動(dòng)支付成為最主流的支付方式之一,同時(shí)在生活中,很多場景會涉及到銀行卡的綁定與識別。例如:
場景一:手機(jī)支付綁定銀行卡
微信支付或支付寶支付,均需提前綁定銀行卡,通過掃一掃功能,掃描銀行卡,自動(dòng)識別卡號,進(jìn)行后續(xù)的驗(yàn)證操作。
場景二:銀行轉(zhuǎn)賬業(yè)務(wù)
銀行進(jìn)行業(yè)務(wù)前,都需要提供銀行卡,掃描銀行卡,進(jìn)行卡號識別操作。
銀行卡的智能識別需求非常廣泛,它不僅可以提高工作效率、減少人工成本,同時(shí)也可以提升用戶體驗(yàn)。
現(xiàn)有的各大科技公司都提供了對應(yīng)的接口來實(shí)現(xiàn)字符識別功能,本題結(jié)合企業(yè)應(yīng)用,同時(shí)考慮到同學(xué)們的資源限制,要求只實(shí)現(xiàn)銀行卡號定位及銀行卡號識別兩個(gè)核心功能。
功能性需求
1.數(shù)據(jù)集處理
根據(jù)本賽題提供的數(shù)據(jù)集(共1084張卡號截圖及標(biāo)簽)實(shí)現(xiàn)數(shù)據(jù)增強(qiáng)模塊,將數(shù)據(jù)集中的每一張圖片使用數(shù)據(jù)增強(qiáng)方式拓展為80張圖片,為之后的圖像識別訓(xùn)練提供充足的數(shù)據(jù)樣本,并且該模塊程序能夠繼續(xù)處理新加入的數(shù)據(jù)樣本。
2、程序定位銀行卡卡號
實(shí)現(xiàn)銀行卡號文本的檢測定位,此模塊能夠?qū)⑴臄z的銀行卡卡號部分檢測出來,并截取相應(yīng)部分供后續(xù)的識別模型使用(銀行卡盡量充滿圖片,橫向放置),能夠讀取放入到文件夾的銀行卡圖片。
3.程序?qū)崿F(xiàn)銀行卡號字符識別
此模塊要求使用數(shù)據(jù)增強(qiáng)后的數(shù)據(jù)集訓(xùn)練字符識別模型,最終模型能夠識別出賽題提供的測試銀行卡卡號以及自拍的銀行卡卡號。
4.采用GUI(圖形用戶界面)
提供良好的用戶交互式界面實(shí)現(xiàn)。
非功能性需求
1.程序源碼要求結(jié)構(gòu)清晰,模塊區(qū)分較為明確,提供便于讀者閱讀的源碼指南,及項(xiàng)目使用文檔。
2.使用人工智能領(lǐng)域深度學(xué)習(xí)技術(shù)進(jìn)行實(shí)現(xiàn),提供文本檢測模型、文本識別模型。
3.使用GPU(圖形處理器)加速計(jì)算。
4.提供模型訓(xùn)練過程截圖,模型測試指標(biāo)信息。
其他限制條件:開發(fā)環(huán)境、實(shí)驗(yàn)平臺、開發(fā)語言、數(shù)據(jù)庫、編譯器等限制條件(請盡量明確)
1.操作系統(tǒng)可選Windows、Linux。
2.開發(fā)語言不限(推薦使用Python3)。
3.推薦使用TensorFlow或Keras實(shí)現(xiàn)模型訓(xùn)練,但不限其它機(jī)器學(xué)習(xí)工具。
4.請標(biāo)注系統(tǒng)中哪些部分使用了開源代碼、模型及出處。
測試數(shù)據(jù)或平臺:提供給參賽者的測試環(huán)境和測試數(shù)據(jù)。(可提供電子檔)
提供源數(shù)據(jù)集1000張左右,原始數(shù)據(jù)集為人工處理銀行卡號截圖,樣例如下(文件名為人工手動(dòng)標(biāo)注號碼):
提供測試銀行卡,樣例如下:
開發(fā)所需設(shè)備及設(shè)備指標(biāo)需求說明
1.推薦數(shù)據(jù)處理部分使用主流配置(i5及以上)電腦即可。
2.圖片拍攝可使用移動(dòng)設(shè)備。
其他要求
1.不能使用市場上各公司在線api接口進(jìn)行功能實(shí)現(xiàn)。
2.鼓勵(lì)使用開源工具、算法。
3.模型在數(shù)據(jù)集中的準(zhǔn)確率要求達(dá)到90%,準(zhǔn)確率較高的需要模型同樣有泛化能力,能夠識別自拍的銀行卡卡號。
4.評分標(biāo)準(zhǔn):
(1)數(shù)據(jù)集處理模塊15分;
(2)程序定位銀行卡卡號模塊15分;
(3)程序?qū)崿F(xiàn)銀行卡號字符識別15分;
(4)采用GUI(圖形用戶界面)15分;
(5)非功能性每一條建議5分,共20分;
(6)綜合20分,系統(tǒng)最終達(dá)到的準(zhǔn)確率、程序運(yùn)行速度、界面友好度、代碼規(guī)范性等。
5.提供完整項(xiàng)目的源代碼。
6.不得作弊抄襲。
7.參賽者需制作項(xiàng)目展示的媒體文件,內(nèi)容包括需求文檔、設(shè)計(jì)文檔、使用說明書等軟件開發(fā)文檔。
資料下載.rar 提取碼:gljp
出題企業(yè):北京課工場教育科技有限公司
答疑方式:劉老師 電話:15101673930 郵箱:pai.pin@kgc.cn 答疑QQ群:529832375