摘要:隨著互聯(lián)網(wǎng)的發(fā)展和普及,違法犯罪活動逐漸向網(wǎng)絡空間滲透,網(wǎng)絡詐騙作為一種典型的網(wǎng)絡犯罪,嚴重威脅社會治安穩(wěn)定。基于裁判文書網(wǎng)數(shù)據(jù)庫的 25 597 份網(wǎng)絡詐騙一審判決書,采用自然語言處理技術提取了 2017—2020 年中國縣域尺度網(wǎng)絡詐騙案件,分析了網(wǎng)絡詐騙的時空分布特征。空間自相關分析結果表明,網(wǎng)絡詐騙案件多集中在東南沿海地區(qū),包括江蘇、浙江、上海、福建以及廣東一帶。隨著時間的變化,2019 年安徽、河南的聚集區(qū)逐漸消失,而湖南、重慶等地形成了明顯的聚集區(qū)。網(wǎng)絡詐騙犯罪者主要來自福建、湖北、河南、廣東、湖南,不同省份的網(wǎng)絡詐騙犯罪者分布模式有顯著差異,江蘇、浙江的網(wǎng)絡詐騙犯罪者來源較為分散,廣東、福建、河南的網(wǎng)絡詐騙犯罪者來源相對集中。
本文源自項金橋;高春東;馬甜;江東;郝蒙蒙;陳帥;, 地理科學 發(fā)表時間:2021-06-07
關鍵詞:網(wǎng)絡詐騙;縣域尺度;空間自相關;莫蘭指數(shù);自然語言處理
隨著互聯(lián)網(wǎng)技術的發(fā)展和普及,網(wǎng)絡空間已經(jīng)成為人類生產(chǎn)生活的“第二類生存空間” [1,2] ,違法犯罪活動也逐漸向網(wǎng)絡空間滲透。網(wǎng)絡詐騙是一種典型的網(wǎng)絡犯罪,犯罪者以計算機網(wǎng)絡為工具,以非法占有為目的,虛構事實,隱瞞真相,騙取公私財物[3,4]。網(wǎng)絡詐騙不僅會使受害者遭受經(jīng)濟財產(chǎn)損失,還會威脅社會治安,造成惡劣的社會影響。目前,網(wǎng)絡詐騙呈現(xiàn)出地域化、智能化、產(chǎn)業(yè)化、規(guī)模化等特點[5]。根據(jù)中國互聯(lián)網(wǎng)絡信息中心發(fā)布的第 47 次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告 》 ,截至 2020 年 12 月 ,中國網(wǎng)民規(guī)模已達到 9.89 億,網(wǎng)絡購物用戶規(guī)模達 7.82 億,網(wǎng)絡支付用戶規(guī)模達 8.54 億,遭遇過各類網(wǎng)絡詐騙的網(wǎng)民比例為 16.5%[6]。2021 年 4 月,習近平同志對打擊治理電信網(wǎng)絡詐騙犯罪工作作出重要指示,強調(diào)全面落實打防管控措施,堅決遏制電信網(wǎng)絡詐騙犯罪多發(fā)高發(fā)態(tài)勢[7]。了解網(wǎng)絡詐騙的時空分布特點,對預防和打擊網(wǎng)絡詐騙犯罪至關重要。
20 世紀 90 年代以來,隨著地理信息系統(tǒng)(GIS)技術的發(fā)展,犯罪制圖、空間分析和時空預測的運用極大地推動了犯罪地理學的形成和發(fā)展[8]。犯罪地理學是運用地理學的理論和方法研究犯罪現(xiàn)象空間發(fā)生、發(fā)展和分布規(guī)律的一門學科[9] ,該學科認為社會和地理環(huán)境因素通過犯罪行為產(chǎn)生機制影響犯罪活動的空間分布[10]。通過研究犯罪事件及其諸要素的空間分布模式和空間作用過程,犯罪地理學被應用于分析各種形式的犯罪行為,包括盜竊[11] 、搶劫[12] 、兒童拐賣[13] 等,在警務部門預防犯罪和輔助決策中起到了重要作用。
區(qū)別于現(xiàn)實空間的傳統(tǒng)犯罪活動,網(wǎng)絡犯罪通常發(fā)生在虛擬的網(wǎng)絡空間,犯罪分子通過代理、匿名等技術手段隱藏真實身份,其行動具有隱蔽性和匿名性[14]。但是網(wǎng)絡犯罪往往具有很強的空間地域規(guī)律,犯罪者對受害者、犯罪地點的選擇不是隨機的,而是遵循一定的邏輯[15]。同時與地理環(huán)境間也存在一定相關性,例如色情網(wǎng)站“境外設站− 境內(nèi)維護”、網(wǎng)絡詐騙“北京建站−福建操控−深圳交易”等模式[16]。犯罪地理學中的日常活動理論認為犯罪的三大核心要素為潛在的犯罪者、合適的目標及有效監(jiān)管的缺失,這三者在時空上匯聚時,犯罪事件就有可能發(fā)生[17]。網(wǎng)絡犯罪的發(fā)生同樣離不開這三者的有效聚合,只是這種聚合發(fā)生在虛擬的網(wǎng)絡空間中,網(wǎng)絡空間的隱蔽性、瞬時性和交互性會使這種聚合變得更加容易且難以監(jiān)管。
一些實證研究分析了日常活動理論對網(wǎng)絡犯罪的適用性[18~20] ,表明傳統(tǒng)犯罪地理學的理論和方法在一定程度上也適用于網(wǎng)絡犯罪,用戶的個體屬性和行為特征會影響其受害風險。當前,城市尺度的研究更加關注個體特征、社會背景、地理環(huán)境等因素對詐騙犯罪的影響[21,22] ,全國尺度的研究一般以省級行政區(qū)為分析單元,側重于網(wǎng)絡詐騙的時空統(tǒng)計規(guī)律[23~25] ,缺乏更精細尺度的研究。此外,由于缺少網(wǎng)絡詐騙犯罪跨地域流動性特點的考慮,對打擊網(wǎng)絡詐騙犯罪的實踐指導作用有限。本文以 2017—2020 年全國范圍內(nèi)縣域尺度的網(wǎng)絡詐騙數(shù)據(jù)為基礎,在分析網(wǎng)絡詐騙時空分布模式的基礎上,挖掘國內(nèi)網(wǎng)絡詐騙犯罪者的來源地分布特征,有助于深入了解中國網(wǎng)絡詐騙的時空分布模式和空間流動特征,從而為預防和打擊網(wǎng)絡詐騙提供借鑒與指導。
1 數(shù)據(jù)與方法
1.1 數(shù)據(jù)
本研究采用的數(shù)據(jù)來源于中國裁判文書網(wǎng)(https://wenshu.court.gov.cn/),該網(wǎng)站公布了全國各級法院已生效的裁判文書,文書總量超過 1 億篇,覆蓋刑事、民事、行政等案件類型。基于裁判文書網(wǎng)數(shù)據(jù)庫,將裁判日期設置為 2017 年 1 月 1 日至 2020 年 12 月 31 日,為防止不同審級的裁判文書對同一案件重復記錄,統(tǒng)一將審級設置為“刑事一審”,案由設為“詐騙罪”,文書等級設為“判決書”。通過全文檢索篩選其中具有網(wǎng)絡詐騙情節(jié)的案件,共獲得 2017—2020 年關于網(wǎng)絡詐騙的一審判決書 25 597 份,其中 2017 年 4461 份,2018 年 4575 份,2019 年 8816 份,2020 年 7745 份。
基于自然語言處理技術[26] ,對裁判文書中的地理位置(案件發(fā)生地)進行提取。通過地理編碼和屬性鏈接,將地方各級人民法院所審理的網(wǎng)絡詐騙案件數(shù)量展布到其對應的縣級行政單元上,以此作為網(wǎng)絡詐騙時空演變分析的基礎。此外,對網(wǎng)絡詐騙案件數(shù)據(jù)進一步細分,提取每一起案件中網(wǎng)絡詐騙犯罪者的居住地和判決法院所在地,作為網(wǎng)絡詐騙犯罪者來源地分析的基礎。由于每起案件可能涉及多個犯罪者,去除無效記錄后,最終共得到 65 729 條網(wǎng)絡詐騙犯罪者來源地記錄 。
1.2 研究方法
1.2.1 自然語言處理技術
自然語言處理技術 ( Natural Language Processing, NLP)是計算機科學、人工智能和語言學等學科的交叉領域,主要研究人類自然語言和計算機之間進行有效通訊的理論和方法[26] ,目前已被廣泛應用于機器翻譯、輿情監(jiān)測、信息抽取、文本分類等方面。其中,信息抽取是從非結構化文本中提取特定信息并將其轉化為結構化數(shù)據(jù)的過程,包括命名實體識別、關系抽取、實體消歧等內(nèi)容[27]。
本文采用的裁判文書超過 2.5 萬篇,如此海量的數(shù)據(jù),無法通過人工逐篇閱讀來完成文書的提取、分類等工作。因此,本文采用自然語言處理技術中的信息抽取技術,對裁判文書進行機器閱讀和解析,經(jīng)過中文分詞、詞性標注、實體識別、關系抽取等步驟,提取網(wǎng)絡詐騙裁判文書中的判決法院所在地、犯罪者居住地、日期等主要屬性信息。
1.2.2 莫蘭指數(shù)
本文采用莫蘭指數(shù)(Moran’s I) [28] 研究中國縣域尺度網(wǎng)絡詐騙是否存在空間自相關,即網(wǎng)絡詐騙的發(fā)生是否存在地理上的空間聚集現(xiàn)象。全局莫蘭指數(shù)(Global Moran’s I)可以評估網(wǎng)絡詐騙現(xiàn)象屬于聚集模式、離散模式還是隨機模式。如果 I 值大于 0,表明網(wǎng)絡詐騙現(xiàn)象在空間上是聚集分布;如果 I 值等于 0,表明該現(xiàn)象在空間上隨機分布;如果 I 值小于 0,表面該現(xiàn)象在空間上離散分布。此外,局部莫蘭指數(shù)(Local Moran’s I)通過揭示某一區(qū)域網(wǎng)絡詐騙發(fā)生數(shù)量與其周圍區(qū)域網(wǎng)絡詐騙的發(fā)生是否存在顯著性差異,從而發(fā)現(xiàn)網(wǎng)絡詐騙在局部上的空間聚集特征。本文采用局部莫蘭指數(shù)分析中國縣域尺度網(wǎng)絡詐騙的空間局部聚集特征 ,以得到國內(nèi)網(wǎng)絡詐騙發(fā)生的熱點區(qū) (高? 高聚集區(qū))。若 I 值大于 0,則表明網(wǎng)絡詐騙存在高?高聚集。
本文利用 ArcGIS10.5 實現(xiàn)空間相關分析,其中,空間權重矩陣采用 QUEEN(即八鄰近)的鄰接方式,從而判斷全國范圍內(nèi)(不含港澳臺)網(wǎng)絡詐騙案件是否存在聚集,并發(fā)現(xiàn)中國網(wǎng)絡詐騙的聚集熱點區(qū)分布情況。
2 結果分析
2.1 網(wǎng)絡詐騙案件總體分布特征
圖 1 為中國 2017—2020 年各省網(wǎng)絡詐騙數(shù)量的變化趨勢,該圖顯示研究時段內(nèi)各省網(wǎng)絡詐騙案件均呈現(xiàn)上升的趨勢,尤其是 2019 年,詐騙案件出現(xiàn)了顯著上升。此外,結合網(wǎng)絡詐騙案件的縣級尺度空間分布(圖 2)可發(fā)現(xiàn),沿海發(fā)達地區(qū)如浙江、江蘇、廣東、福建以及人口大省河南網(wǎng)絡詐騙數(shù)量顯著高于其它省份,詐騙案件集中分布在沿海地區(qū),并零星分布于中西部的河南、湖南和重慶等省(市)。
研究時段內(nèi)中國網(wǎng)絡詐騙數(shù)量最多的 50 個區(qū)縣 75% 以上集中在浙江、江蘇、廣東、福建、河南 5 省,由此,統(tǒng)計在全國網(wǎng)絡詐騙發(fā)生數(shù)量排名前 50 的區(qū)縣中以上 5 省的占比情況(表 1)。結果表明,5 省區(qū)縣占比 2018 年達到了 92.6%;其中,浙江的網(wǎng)絡詐騙案件最為集中,詐騙案件數(shù)量也最多,并增長較快,占比從 2017 年的 21.1% 增長為 2020 年的 47.9%,上漲超過 1 倍;而福建、廣東等地的高詐騙數(shù)占比略有下降。
2.2 網(wǎng)絡詐騙案件時空聚集特征分析
基于 2017—2020 年中國范圍內(nèi)縣域尺度網(wǎng)絡詐騙案件,利用 ArcMap 計算得到全局莫蘭指數(shù)(表 2),可以看出,2017—2020 年的全局莫蘭指數(shù)均大于 0,且 P 值均小于 0.01,表明中國網(wǎng)絡詐騙案件存在明顯的空間聚集特征, 并且聚集特征逐年加強。在此基礎上,利用局部莫蘭指數(shù)分析得到 4 a 間國內(nèi)網(wǎng)絡詐騙案件詳細的空間局部聚集特征,如圖 3 所示。
圖 3 表明,中國網(wǎng)絡詐騙案件主要發(fā)生在“胡煥庸線”(璦琿−騰沖一線)[29] 以南,且網(wǎng)絡詐騙高− 高集聚區(qū)集中在中國東南沿海地區(qū),包括江蘇、上海、浙江、福建以及廣東一帶,驗證了圖 2 的結果;安徽、河南、湖南等中部地區(qū)也存在小規(guī)模的高− 高聚集。其中,江蘇−浙江−上海(江浙滬)地區(qū)、福建地區(qū)以及廣東地區(qū)在 2017—2020 年一直存在網(wǎng)絡詐騙聚集情況。但需要注意的是,福建聚集區(qū)在逐年變小,由 2017 年的 22 個聚集區(qū)縣縮減為 2020 年的 14 個區(qū)縣,而江浙滬聚集區(qū)則逐年擴大, 2017 年的 72 個聚集區(qū)縣于 2020 年擴增到 110 個區(qū)縣 (表 3)。安徽 、河南等地的零散聚集區(qū)在 2019 年開始逐漸消失 ,而湖南 、重慶等地則從 2019 年開始出現(xiàn)了明顯的聚集情況。
2.3 網(wǎng)絡詐騙犯罪者來源分析
基于從 2017—2020 年中國網(wǎng)絡詐騙案件中提取的犯罪者居住地和判決地數(shù)據(jù),分析了全國各省網(wǎng)絡詐騙犯罪者來源地分布特征(圖 4)。結果顯示,中國網(wǎng)絡詐騙犯罪者來源最多的 10 個省(自治區(qū))依次為福建、湖北、河南、廣東、湖南、廣西、江西、四川、安徽和海南,占全國 70% 以上。從省級尺度看,不同地區(qū)的網(wǎng)絡詐騙犯罪者來源地分布模式存在顯著差異。總體上,東部沿海地區(qū)(江、浙)的網(wǎng)絡詐騙以省外流入為主,來源地分散,在“胡煥庸線”以南各省均有分布;南部沿海地區(qū)(粵、閩)及長江中游地區(qū)(湘、鄂、贛、皖)網(wǎng)絡詐騙犯罪者以本省或臨近省份居多。具體而言,浙江、江蘇網(wǎng)絡詐騙犯罪者主要來源于本省及福建、江西、湖南、湖北、河南、廣東、安徽等地;廣東、河南、安徽的網(wǎng)絡詐騙犯罪者來源地相對集中,主要來自本省(自治區(qū)),在鄰近的廣西、福建、湖南、湖北、海南等地也有零星分布。福建、湖北、湖南的網(wǎng)絡詐騙犯罪者大部分來自本省。由此可以看出,福建、湖南、湖北、廣東、河南等地的網(wǎng)絡詐騙犯罪者既在本省活躍,同時也不斷向其他省市外流擴散。
從縣級尺度看,全國范圍內(nèi)網(wǎng)絡詐騙犯罪者來源最多的 10 個區(qū)縣依次為福建安溪縣、廣西賓陽縣、海南儋州市、廣東茂名市電白區(qū)、福建龍巖市新羅區(qū)、湖南雙峰縣、湖北孝昌縣、湖北天門市、江西余干縣和湖北仙桃市,這些地區(qū)的網(wǎng)絡詐騙犯罪者占全國 14% 以上。浙江網(wǎng)絡詐騙犯罪者主要來自福建安溪縣、海南儋州市、湖北孝昌縣、廣東茂名市電白區(qū)、福建龍巖市新羅區(qū)、廣西賓陽縣、江西余干縣等地;江蘇網(wǎng)絡詐騙犯罪者主要來自海南儋州市、廣西賓陽縣、福建安溪縣、湖北天門市及南京市鼓樓區(qū)等地;河南網(wǎng)絡詐騙犯罪者主要來源于河南上蔡縣、修武縣、商水縣、鄭州市金水區(qū)、中原區(qū)、鞏義市,以及福建安溪縣、廣西賓陽縣等地;廣東的網(wǎng)絡詐騙犯罪者主要來廣東茂名市電白區(qū)、饒平縣、普寧市以及廣西賓陽縣、海南儋州市、福建安溪縣等地;福建網(wǎng)絡詐騙犯罪者主要來自福建安溪縣、南安市以及龍巖市新羅區(qū)、永定區(qū)、長汀縣、漳平市、連城縣等地。
3 結論
本研究以 2017—2020 年中國縣域尺度的網(wǎng)絡詐騙案件為研究對象(未含港澳臺),運用 GIS 和空間分析方法分析了網(wǎng)絡詐騙的時空分布特征,并對網(wǎng)絡詐騙犯罪者的來源地進行了分析,主要結論如下:
1)沿海經(jīng)濟發(fā)達地區(qū)如浙江、江蘇、廣東、福建等地網(wǎng)絡詐騙數(shù)量顯著高于其它省份,詐騙案件集中分布于在這些沿海地區(qū),并零星分布于中西部的河南、湖南和重慶等省份。
2)網(wǎng)絡詐騙存在明顯的空間聚集,聚集區(qū)主要為:江蘇−浙江−上海地區(qū)、福建地區(qū)以及廣東地區(qū)。從 2019 年開始,安徽、河南等地的聚集區(qū)逐漸消失,湖南、重慶等地形成了明顯的聚集區(qū)。
3)通過對網(wǎng)絡詐騙犯罪者的來源地進行分析,發(fā)現(xiàn)網(wǎng)絡詐騙犯罪呈現(xiàn)明顯的地域化特點,以福建安溪、廣西賓陽、海南儋州、廣東茂名電白區(qū)、福建龍巖新羅區(qū)、湖南漣源−雙峰−新化、湖北孝昌− 天門−仙桃、江西余干、河南上蔡為中心形成了網(wǎng)絡詐騙犯罪聚集地,這些地方是網(wǎng)絡詐騙作案人員的主要流出地區(qū),也是電信網(wǎng)絡詐騙掛牌整治的重點地區(qū)。
4)不同省份的網(wǎng)絡詐騙犯罪者分布模式有顯著差異,5 個網(wǎng)絡詐騙案件數(shù)量最多的省份中,江蘇、浙江的網(wǎng)絡詐騙犯罪者來源較為分散,主要分布在“胡煥庸線”以南;廣東、福建、河南的網(wǎng)絡詐騙犯罪者來源相對集中,主要分布在本省或鄰近省市。
4 討論
本文基于中國裁判文書網(wǎng)數(shù)據(jù)庫進行研究,結果表明研究時段內(nèi)全國網(wǎng)絡詐騙案件數(shù)量呈現(xiàn)上升的趨勢,分布省份與縣域的發(fā)生數(shù)量均有所增加。沿海發(fā)達地區(qū)網(wǎng)絡詐騙數(shù)量顯著高于其它省份,中部地區(qū)網(wǎng)絡詐騙形勢嚴峻,需要進一步加大打擊力度以遏制網(wǎng)絡詐騙的擴散趨勢。中國網(wǎng)絡詐騙犯罪者的空間流動總體上與人口流動特征相吻合,表現(xiàn)為由經(jīng)濟落后地區(qū)流向經(jīng)濟發(fā)達地區(qū),省域的經(jīng)濟發(fā)展程度對網(wǎng)絡詐騙發(fā)生頻率有著較大的影響,沿海地區(qū)經(jīng)濟富裕、外來人口多、社會治安情況復雜,成為犯罪者的首要選擇。
網(wǎng)絡詐騙犯罪者來源地集中,具有明顯的地域性。來源區(qū)縣大多為國內(nèi)地域性職業(yè)電信網(wǎng)絡詐騙犯罪的重點地區(qū),一些甚至形成了產(chǎn)業(yè)化運作的詐騙鄉(xiāng)、詐騙村,在詐騙手法上具有鮮明的地域特色,如廣西賓陽冒充 QQ 好友詐騙、龍巖新羅區(qū)網(wǎng)絡購物詐騙、茂名電白區(qū)假冒熟人詐騙等典型詐騙模式[30,31]。一般來說,從事網(wǎng)絡詐騙的犯罪行為人大多來自經(jīng)濟相對落后的地區(qū),這些地區(qū)無業(yè)、失業(yè)人數(shù)較多,管理水平滯后,為網(wǎng)絡詐騙提供了潛在犯罪者。對于網(wǎng)絡詐騙犯罪者主要來源地,應加強源頭治理,防止犯罪者外流,同時應加大經(jīng)濟產(chǎn)業(yè)扶植力度,擴大就業(yè),加強反詐騙宣傳。隨著公安機關打擊網(wǎng)絡詐騙的力度加大,網(wǎng)絡詐騙犯罪群體也出現(xiàn)了向周邊及外地轉移的趨勢,分布區(qū)域趨向于更加散落的狀態(tài),這也為打擊網(wǎng)絡詐騙帶來了更大的挑戰(zhàn)。因此,亟需加強各地公安機關的信息共享和區(qū)域協(xié)作,加強對網(wǎng)絡詐騙高危來源地人群的管控。本文的發(fā)現(xiàn)可以為各地方的公安機關打擊和防范網(wǎng)絡詐騙提供有價值的信息,從而實施輕重有別、精準施力的治理策略。
本研究在數(shù)據(jù)方面存在一定的局限性。一方面,裁判文書數(shù)據(jù)僅覆蓋了已經(jīng)審理和公開的網(wǎng)絡詐騙案件,還存在部分已發(fā)生但未立案或已審理但尚未公開的案件,因此數(shù)據(jù)存在一定的偏向性,不能完全代表整體樣本。另一方面,采用自然語言處理技術提取裁判文書中的屬性信息時,由于技術限制無法精確提取案件的實際發(fā)生時間,因此統(tǒng)一采用案件的判決時間作為分析維度,相較于案件發(fā)生時間存在一定程度的滯后。本文僅討論了網(wǎng)絡詐騙的時空特征和來源地分布模式,未來的研究將基于裁判文書數(shù)據(jù)提取更多屬性維度,結合網(wǎng)絡詐騙犯罪者和受害者的個體特征(如年齡、文化程度、職業(yè)等)及其所在地的社會經(jīng)濟背景,研究影響網(wǎng)絡詐騙的主要因素和形成機制。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >