互聯(lián)網(wǎng)時(shí)代,以大數(shù)據(jù)應(yīng)用來提高稅收管理服務(wù)能力已凝聚廣泛共識(shí),尤其是在稅務(wù)機(jī)關(guān)數(shù)據(jù)獲取成本高、數(shù)據(jù)分析方法簡單、數(shù)據(jù)分析力量不足的環(huán)境下。而不同的技術(shù)手段有著特定的使用環(huán)境要求,大數(shù)據(jù)技術(shù)也不例外。因此,若想推動(dòng)稅務(wù)大數(shù)據(jù)應(yīng)用邁向新臺(tái)階,必須從以下5個(gè)方面著手來完善稅務(wù)大數(shù)據(jù)應(yīng)用環(huán)境。
推動(dòng)數(shù)據(jù)標(biāo)準(zhǔn)建設(shè),強(qiáng)化數(shù)據(jù)質(zhì)量管理。數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量是影響大數(shù)據(jù)分析的關(guān)鍵因素。數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一則數(shù)據(jù)分析成本會(huì)增加,數(shù)據(jù)不準(zhǔn)確則數(shù)據(jù)分析結(jié)論不切實(shí)際。應(yīng)建立關(guān)鍵數(shù)據(jù)標(biāo)準(zhǔn),規(guī)范數(shù)據(jù)元管理,保證數(shù)據(jù)分類科學(xué)、含義分明、格式一致。根據(jù)業(yè)務(wù)規(guī)范和指標(biāo)體系建立的需要,強(qiáng)化數(shù)據(jù)傳輸流程改造,增強(qiáng)數(shù)據(jù)傳輸中系統(tǒng)自校能力。對(duì)數(shù)據(jù)質(zhì)量進(jìn)行全程監(jiān)控、閉環(huán)管理,定期通過系統(tǒng)自檢、人工核查等方式開展數(shù)據(jù)質(zhì)量檢查,并建立倒查機(jī)制、強(qiáng)化問責(zé)。
促進(jìn)數(shù)據(jù)全面生成,打造稅務(wù)大數(shù)據(jù)庫。數(shù)據(jù)全面生成是影響大數(shù)據(jù)分析成效的關(guān)鍵要素。唯有不斷輸入全面、及時(shí)的數(shù)據(jù)原材料,大數(shù)據(jù)處理這個(gè)機(jī)器才能產(chǎn)生出更多可觀的產(chǎn)品。應(yīng)加強(qiáng)信息系統(tǒng)整合,探索建立全國性的數(shù)據(jù)資源池,并開放端口供基層稅務(wù)機(jī)關(guān)使用。依托綜合治稅平臺(tái)建設(shè),加強(qiáng)跨部門信息獲取;依托網(wǎng)絡(luò)爬蟲等手段,加強(qiáng)互聯(lián)網(wǎng)涉稅信息獲取。利用任務(wù)日志等手段全程記錄納稅人在履行權(quán)利義務(wù)時(shí)的需求情況和個(gè)人信息,實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)記錄、實(shí)時(shí)傳送。
拓展數(shù)據(jù)分析方法,提高數(shù)據(jù)使用價(jià)值。數(shù)據(jù)分析應(yīng)用是大數(shù)據(jù)分析實(shí)現(xiàn)價(jià)值的關(guān)鍵環(huán)節(jié)。只有不斷拓展分析方法和分析模型,才能更廣范圍、更深層次地使用數(shù)據(jù)、挖掘數(shù)據(jù)。應(yīng)創(chuàng)新理論體系,探索微觀稅收數(shù)據(jù)對(duì)接宏觀經(jīng)濟(jì)指標(biāo)、稅收歷史數(shù)據(jù)對(duì)接未來發(fā)展趨勢、企業(yè)個(gè)體波動(dòng)對(duì)接行業(yè)整體變化的理論方法和分析模型,提高稅收數(shù)據(jù)服務(wù)于宏觀分析、發(fā)展預(yù)測和風(fēng)險(xiǎn)管理的能力。要適應(yīng)大數(shù)據(jù)分析側(cè)重相關(guān)關(guān)系、總體分析的特征,借力決策樹、隨機(jī)森林、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)等面向復(fù)雜數(shù)據(jù)的機(jī)器學(xué)習(xí)方法,提升稅務(wù)大數(shù)據(jù)分析價(jià)值。
優(yōu)化數(shù)據(jù)系統(tǒng)架構(gòu),增強(qiáng)系統(tǒng)處理能力。系統(tǒng)處理能力是構(gòu)成大數(shù)據(jù)技術(shù)使用的關(guān)鍵基礎(chǔ)。以流式處理為主的實(shí)時(shí)處理是大數(shù)據(jù)主要分析形式。唯有創(chuàng)新技術(shù)手段、優(yōu)化系統(tǒng)架構(gòu)才能提高系統(tǒng)實(shí)時(shí)處理能力、提升數(shù)據(jù)使用價(jià)值。應(yīng)利用“高可用”“沙箱”等云計(jì)算手段,整合現(xiàn)有計(jì)算資源,通過科學(xué)的任務(wù)分配來優(yōu)化系統(tǒng)處理模式,減少系統(tǒng)閑置。強(qiáng)化系統(tǒng)架構(gòu)、計(jì)算框架、處理方法和測試基準(zhǔn)的設(shè)計(jì)研究,利用分布式并行處理技術(shù)減小數(shù)據(jù)倉庫的擴(kuò)容壓力,提升數(shù)據(jù)作業(yè)處理速度及系統(tǒng)響應(yīng)速度。
建立數(shù)據(jù)公開體系,發(fā)揮數(shù)據(jù)更大效能。數(shù)據(jù)公開體系是影響大數(shù)據(jù)分析的關(guān)鍵成分。信息交互是雙方的,只有讓稅務(wù)數(shù)據(jù)走出去,才可將更多涉稅數(shù)據(jù)引進(jìn)來,進(jìn)而擴(kuò)大稅收數(shù)據(jù)容量、提高稅務(wù)大數(shù)據(jù)使用效能。要厘清納稅人信息保護(hù)和稅收數(shù)據(jù)公開的邊界,探索對(duì)公開稅收數(shù)據(jù)進(jìn)行立法保障。突破當(dāng)前稅務(wù)數(shù)據(jù)公開層次不一、口徑不同、范圍較窄和數(shù)據(jù)更新不及時(shí)的弊端,借鑒國家統(tǒng)計(jì)局“統(tǒng)計(jì)數(shù)據(jù)”模塊的做法,在國家稅務(wù)總局官網(wǎng)上統(tǒng)一設(shè)立“稅收數(shù)據(jù)”獨(dú)立模塊,拓展信息公開范圍、提高信息公開頻率,為社會(huì)各界提供一個(gè)權(quán)威、快捷、實(shí)用性高的稅收數(shù)據(jù)獲取渠道。