摘 要:近年來電子商務(wù)與互聯(lián)網(wǎng)技術(shù)、物流等行業(yè)不斷融合,網(wǎng)絡(luò)消費快速增長,但也因此滋生了各種利用互聯(lián)網(wǎng)制售假冒偽劣商品的犯罪,嚴重損害了企業(yè)和群眾利益,擾亂了經(jīng)濟秩序。受高額利潤的驅(qū)使,茅臺酒等高端白酒是網(wǎng)絡(luò)制售假犯罪的重點侵害對象之一。與線下實體模式售假行為不同,互聯(lián)網(wǎng)制售假酒行為具有虛擬性和隱蔽性,給公安機關(guān)偵查帶來了不少困難。犯罪分子利用互聯(lián)網(wǎng)制售假冒高端白酒的手段也在不斷推陳出新,除了通過電商平臺、社交網(wǎng)絡(luò)微商銷售外,近幾年又出現(xiàn)了利用線上互聯(lián)網(wǎng)廣告招攬顧客的新模式。本文從貴州省遵義市公安機關(guān)破獲的一起利用互聯(lián)網(wǎng)制售假酒案例出發(fā),介紹了一種較為新型的利用互聯(lián)網(wǎng)制售假酒犯罪的手段和特點,并根據(jù)其特點建立了一個抓取互聯(lián)網(wǎng)制售假酒信息的監(jiān)測模型,用于公安機關(guān)發(fā)現(xiàn)和落地網(wǎng)絡(luò)制售假酒犯罪線索,保護白酒企業(yè)知識產(chǎn)權(quán)。
齊鳳亮; 光曉俐; 鄒積鑫; 林雷祥; 童長毅, 刑事技術(shù) 發(fā)表時間:2021-08-11
關(guān)鍵詞:假酒;互聯(lián)網(wǎng)廣告;知識產(chǎn)權(quán)保護
隨著“互聯(lián)網(wǎng) +”“新零售”等時代的到來,制售假酒犯罪也慢慢地隱藏到互聯(lián)網(wǎng)這張大網(wǎng)下。據(jù)遵義市打假相關(guān)部門的統(tǒng)計,傳統(tǒng)的商超、店鋪、批發(fā)市場公然銷售假酒的現(xiàn)象越來越少,市場監(jiān)督管理部門開展市場檢查查獲的假酒數(shù)量也越來越有限。茅臺等高端白酒由于其品質(zhì)好、銷售緊俏,一直是造假分子的重點侵害對象,高端白酒也成為了利用網(wǎng)絡(luò)制售假酒犯罪的重災(zāi)區(qū)。犯罪分子利用互聯(lián)網(wǎng)、快遞物流銷售假酒不僅成本低、隱蔽性強,而且流通快速、對象虛擬,給公安機關(guān)等部門執(zhí)法和打擊帶來了更多挑戰(zhàn)。近年來犯罪分子利用互聯(lián)網(wǎng)廣告,在門戶網(wǎng)站等平臺發(fā)布虛假白酒促銷信息,大肆銷售假冒茅臺等高端白酒,給大量消費者帶來損失的同時,也極大傷害了茅臺等高端白酒品牌形象。
本文以作者參與辦理的貴州省遵義市公安機關(guān)破獲的一起互聯(lián)網(wǎng)制售假高端白酒案件為例,介紹了此案的犯罪手法特點 ;提出了一種抓取互聯(lián)網(wǎng)售假信息的監(jiān)測模型,用于及時發(fā)現(xiàn)和落地此類案件線索,提交給公安機關(guān)和權(quán)利人企業(yè)進行打擊處理。
1 案件簡介與特點
2018 年 9 月,遵義市公安機關(guān)工作中發(fā)現(xiàn),有人在鳳凰網(wǎng)、新浪網(wǎng)等門戶網(wǎng)站及相關(guān)移動 APP 上發(fā)布搶購茅臺酒活動銷售信息廣告,經(jīng)廠家核查發(fā)現(xiàn)該廣告頁面銷售的為假冒貴州茅臺酒。涉案地公安機關(guān)組成專案組開展工作,成功發(fā)現(xiàn)了一個利用互聯(lián)網(wǎng)制售假茅臺酒的犯罪團伙。該犯罪團伙以馬某 A、馬某 B、楊某某等人為主要成員,涉及廣東、河南、浙江、山東等地。經(jīng)查,廣東假酒經(jīng)銷商馬某 A 負責聯(lián)系互聯(lián)網(wǎng)廣告商,發(fā)布虛假貴州茅臺酒等高端白酒搶購活動廣告 ;山東廣告商楊某某按照馬某 A 的要求,在東方頭條、鳳凰網(wǎng)、新浪網(wǎng)等平臺發(fā)布廣告 ;網(wǎng)民點擊廣告訂購后,馬某 A 將訂單發(fā)給河南假酒生產(chǎn)商馬某 B;最后馬某 B 等人在河南生產(chǎn)假酒,并通過物流發(fā)貨到全國各地。2019 年 6 月,遵義公安機關(guān)一舉打掉該犯罪團伙,抓獲犯罪嫌疑人 11 人,搗毀生產(chǎn)窩點 2 個,繳獲假冒茅臺、五糧液、劍南春等白酒 1800 余瓶以及假酒生產(chǎn)設(shè)備、包裝材料若干,凍結(jié)涉案資金數(shù)百萬元。
與利用電商或社交網(wǎng)絡(luò)微商等平臺銷售假貨 [1] 模式不同,眾多假酒犯罪分子為逃避電商平臺監(jiān)管,在互聯(lián)網(wǎng)網(wǎng)頁、論壇等發(fā)布售假酒信息。特別是在本案中,犯罪團伙通過不良廣告公司直接在互聯(lián)網(wǎng)廣告平臺投放高檔白酒搶購廣告,建立售假網(wǎng)絡(luò),犯罪手法的欺騙性、隱蔽性強,假酒擴散快、危害大。一是假酒廣告欺騙性強。這些廣告并不直接標明銷售的是茅臺酒,而是打出“貴州名酒原價 1499 限時搶購 600”“茅臺鎮(zhèn) 53°酒 750/ 瓶,過時恢復(fù)原價 1499/ 瓶” 等名頭,廣告圖片展示的是印著“茅臺鎮(zhèn)原漿酒”“茅臺原漿酒”等名稱類似茅臺酒的包裝白酒,用以逃避廣告商平臺的監(jiān)管,同時廣告投放會選擇特定的目標用戶和區(qū)域,人工網(wǎng)絡(luò)巡查難以直接發(fā)現(xiàn)。二是人員身份隱蔽性強。銷售商、生產(chǎn)商、廣告商等層級分工明細,互聯(lián)網(wǎng)銷售使交易雙方身份虛擬,廣告商、銷售商、生產(chǎn)商等之間聯(lián)系時,常以昵稱相稱,通過微信等聯(lián)絡(luò),并且常用他人身份信息注冊賬號,各方相互之間不見面、不了解具體身份,交易各方身份的虛擬性,給公安機關(guān)落地人員身份深入調(diào)查造成困難。三是假酒擴散快、危害大。假酒的購買過程非常便捷,互聯(lián)網(wǎng)用戶點擊廣告后,落地網(wǎng)頁就變成了茅臺酒的銷售界面,頁面上有下單功能,瀏覽者只需要選擇所購買的產(chǎn)品,錄入姓名、手機號、地址等信息后,無需提前支付貨款,即可完成下單,后臺有專業(yè)的訂單系統(tǒng),假酒銷售商拿到訂單后聯(lián)系生產(chǎn)商直接發(fā)貨。假酒從下單到發(fā)貨操作簡單,加之互聯(lián)網(wǎng)的覆蓋性,導(dǎo)致假酒的擴散快、危害大。調(diào)查發(fā)現(xiàn)該案犯罪團伙從 2018 年 11 月至 2019 年 5 月發(fā)貨近千次,銷售假冒茅臺酒數(shù)千件,收貨地遍布全國,涉案總價值達數(shù)千萬元。
面對互聯(lián)網(wǎng)上售假酒信息的泛濫和巨大危害,公安機關(guān)和權(quán)利人企業(yè)打假人員也在一直努力發(fā)現(xiàn)和清除網(wǎng)上違法廣告信息,對重點線索進行打擊。但采用傳統(tǒng)的人工方式在互聯(lián)網(wǎng)上搜索和巡查,費時費力效率低下 ;互聯(lián)網(wǎng)的虛擬性,也使得打假人員難以直接通過互聯(lián)網(wǎng)上抓取的有限信息落地嫌疑人員和企業(yè)身份。公安和企業(yè)打假部門亟需一種高效的方法,及時準確地發(fā)現(xiàn)互聯(lián)網(wǎng)上售假信息并形成有效案件線索。因此,我們可以利用互聯(lián)網(wǎng)搜索、數(shù)據(jù)挖掘等技術(shù),建立互聯(lián)網(wǎng)監(jiān)測模型,自動化地發(fā)現(xiàn)和提取互聯(lián)網(wǎng)上制售假酒信息,為打擊互聯(lián)網(wǎng)制售假酒犯罪服務(wù)。
2 互聯(lián)網(wǎng)假酒信息監(jiān)測模型
作者建立了一個針對互聯(lián)網(wǎng)假酒信息的監(jiān)測模型,首先利用歷史案件、工作搜集的數(shù)據(jù)對互聯(lián)網(wǎng)上發(fā)布假酒廣告信息的關(guān)鍵詞進行提取和整理,建立關(guān)鍵詞組,然后采用互聯(lián)網(wǎng)搜索技術(shù),對互聯(lián)網(wǎng)網(wǎng)站、論壇等上面發(fā)布的售假廣告信息進行抓取、整理,獲得涉嫌銷售假酒的廣告頁面信息 ;對抓取的互聯(lián)網(wǎng)廣告信息進行清洗,落地網(wǎng)頁地址,提取手機、微信、 QQ 等號碼信息,將銷售信息推送給酒企鑒別真假,對于明顯低于市場銷售價格、虛假的促銷廣告信息,將提取的號碼等信息與公安、權(quán)利人企業(yè)掌握的歷史數(shù)據(jù)進行碰撞,落地相關(guān)人員和企業(yè)身份,及時形成案件線索,交由公安機關(guān)進行深入調(diào)查 ;對抓取的嫌疑頁面進行關(guān)鍵詞挖掘,發(fā)現(xiàn)和提取新的關(guān)鍵詞,充實搜索關(guān)鍵詞組,流程如圖 1 所示。本文將主要從關(guān)鍵詞組的設(shè)置、涉假互聯(lián)網(wǎng)廣告信息的抓取、抓取數(shù)據(jù)的碰撞與線索生成等方面進行闡述,介紹模型的原理與運行效果。
2.1 關(guān)鍵詞組的設(shè)置
假酒搜索關(guān)鍵詞組的設(shè)置及更新基于兩個直觀的假設(shè) :一是涉假信息通過關(guān)鍵詞表征,即但凡出現(xiàn)關(guān)鍵詞的信息都有極高的概率與售假相關(guān) ;二是關(guān)鍵詞之間具有一定的聯(lián)系,即與關(guān)鍵詞經(jīng)常以特定模式出現(xiàn)的詞也有一定的概率是關(guān)鍵詞。
設(shè)置假酒關(guān)鍵詞組的基本思想如下 :首先,作者根據(jù)辦案工作經(jīng)驗,結(jié)合研究互聯(lián)網(wǎng)上相關(guān)的售假行為,對各類假冒商品設(shè)置初始關(guān)鍵詞組,例如“高仿酒”“高仿茅臺”等,利用這些關(guān)鍵詞組抓取互聯(lián)網(wǎng)上發(fā)布的廣告信息。然后,對抓取的內(nèi)容清洗處理,進行主題分析、關(guān)鍵詞挖掘,及時發(fā)現(xiàn)和加入可能出現(xiàn)的新關(guān)鍵詞,最終實現(xiàn)關(guān)鍵詞組的迭代更新。為解決主題分析關(guān)鍵詞挖掘問題,我們使用了 TextRank和 TF-IDF 兩個成熟的關(guān)鍵詞自動提取算法。
TextRank 算法的基本思想來自于谷歌公司的 PageRank[2] 算法,首先根據(jù)文本構(gòu)造詞之間的連接圖,通過在詞圖上執(zhí)行 PageRank 算法,可以最終得到詞的重要度分數(shù),最后選擇得分最高的 n 個詞作為文檔的關(guān)鍵詞 [3-4]。該算法的詞圖模型可以形式化定義為公式(1)。(1)其中,V 是頂點的集合,即文本中的詞集,E 是這些頂點之間邊的集合,即文本中詞與詞之間的邊集。
對于給定的一個頂點 Vi ,TextRank 的計算見公式(2)。(2)公 式(2) 中 是指向 Vi 頂 點 的 入 鏈 集 合, Out(Vj ) 是出鏈的集合,d 為阻尼系數(shù),一般取值為 0.85。ωji 和 ωjk 分別是指兩個頂點之間的邊權(quán)值,通常設(shè)置為 1,表示無權(quán)圖。
TF-IDF 算法是基于統(tǒng)計的方法來衡量詞或短語在文本信息中的關(guān)鍵性 [5-6],一個詞在目標文本使用的次數(shù)較多,卻在語料庫中使用的次數(shù)較少,那么它就能夠具備良好的文本區(qū)分能力。某個詞在目標文本中的TF值指的是該詞在這個文本中出現(xiàn)的頻率, IDF 值是文本集合中出現(xiàn)包含該詞的文本占比,計算見公式(3)。(3)公式(3)中 TFi,j 為詞 i 在文本 j 中的詞頻,fi,j 為詞 i 在文本 j 中出現(xiàn)的次數(shù),N 是文本集中的文本總數(shù),ni 為包含詞 i 的文本數(shù)量,加常數(shù) 1 是為了處理公式中分母 ni 為 0 的情況。
TextRank 使用文本的結(jié)構(gòu)信息,對詞的表征方式不敏感,算法的結(jié)果只取決于文本的結(jié)構(gòu),而 TFIDF 具備良好的文本區(qū)分能力。為了得到可信度更高的結(jié)果,我們在實際任務(wù)中將兩種算法進行融合,從而得到最終的分數(shù),計算如公式(4)。(4)使用“茅臺酒”作為初始關(guān)鍵詞,對抓取的網(wǎng)頁采用上述三種關(guān)鍵詞自動提取算法,生成的關(guān)鍵詞如表 1 所示。
人工檢查后將關(guān)鍵詞分為有效、無效、待定三類,分別用綠色、紅色、黑色標記。TF-IDF 算法中前 19 關(guān)鍵詞包括 7 個有效詞、7 個無效詞,TextRank 算法中前 19 關(guān)鍵詞包括 6 個有效詞、9 個無效詞,融合算法中前 19 關(guān)鍵詞包括 7 個有效詞、6 個無效詞。可以看出,融合算法可得到更多的有效關(guān)鍵詞,較少的無效關(guān)鍵詞,關(guān)鍵詞獲取效果較好。
2.2 互聯(lián)網(wǎng)假酒信息的抓取
作者設(shè)計了基于 Selenium[7] 的互聯(lián)網(wǎng)搜索引擎信息抓取系統(tǒng),可以根據(jù)指定的關(guān)鍵詞組,自動化抓取搜索結(jié)果中的相關(guān)信息。Selenium 是一種瀏覽器自動化測試框架,常用于網(wǎng)絡(luò)爬蟲的模擬人工操作,可以有效獲取網(wǎng)頁真實地址,同時也可以通過設(shè)定暫停時間,使爬蟲程序行為更接近真實的訪問情況,減少網(wǎng)站反爬蟲措施帶來的影響。我們使用 Python+Selenium+Chrome 組合來解決自動化抓取搜索結(jié)果問題,谷歌瀏覽器(Chrome)負責渲染解析,Selenium 負責驅(qū)動瀏覽器和 Python 程序進行對接,Python 程序負責對網(wǎng)頁數(shù)據(jù)信息進行清洗、提取等后期處理,三者構(gòu)成一個完整的爬蟲結(jié)構(gòu)。
首先,利用谷歌瀏覽器驅(qū)動 ChromeDriver[8] 自動建立瀏覽器進程、登錄搜索引擎、自動輸入預(yù)設(shè)關(guān)鍵字進行搜索,進入了搜索結(jié)果頁面后,解析頁面內(nèi)容實現(xiàn)對搜索結(jié)果的逐條抓取。然后,對頁面地址進行落地,對數(shù)據(jù)進行清洗,設(shè)計基于規(guī)則的無關(guān)數(shù)據(jù)篩選流程剔除無關(guān)數(shù)據(jù),比如,門戶網(wǎng)站和電商對違法信息的審核嚴格,抓取的網(wǎng)頁雖然與售假有一定相關(guān)性,但絕大多數(shù)不是不法分子發(fā)布的售假信息,需要將此類網(wǎng)頁剔除。最后,對搜索結(jié)果頁面進行分析,存儲網(wǎng)頁標題、落地頁等信息,利用正則表達式將網(wǎng)頁中涉及的電子郵件、電話、QQ 號碼等信息提取并保存。圖 2 展示了部分從互聯(lián)網(wǎng)抓取的互聯(lián)網(wǎng)可疑售假網(wǎng)頁信息。
2.3 抓取信息的碰撞與線索生成
可以將抓取的互聯(lián)網(wǎng)可疑售假信息與公安、企業(yè)、互聯(lián)網(wǎng)數(shù)據(jù)等各類數(shù)據(jù)等進行關(guān)聯(lián)比對,落地相關(guān)內(nèi)容,刻畫嫌疑人員和企業(yè),將可疑度高的線索轉(zhuǎn)給相關(guān)公安機關(guān)和企業(yè)打假部門,做進一步研判和處理。為此,本文建立了信息比對碰撞平臺,匯集的公安數(shù)據(jù)包括 2010 年以來遵義市公安機關(guān)辦理的侵犯知識產(chǎn)權(quán)相關(guān)犯罪案件信息 700 余條,犯罪嫌疑人信息 1 000 余條 ;企業(yè)數(shù)據(jù)包括茅臺等酒企掌握的涉嫌制售假酒的黑、灰名單人員信息 5 000 余條,嫌疑企業(yè)信息 2 933 條 ;互聯(lián)網(wǎng)數(shù)據(jù)包括廈門美亞柏科公司網(wǎng)搜平臺搜集的通信、地址、人員、企業(yè)信息等數(shù)據(jù) 10 億余條。我們運用這些數(shù)據(jù)與互聯(lián)網(wǎng)抓取的信息進行碰撞,例如,模型發(fā)現(xiàn)百度 ID“yerutin****” 長期在百度貼吧發(fā)布出售假酒的信息,通過網(wǎng)搜平臺對“yerutin****”貼文中留下的“135****1573”手機號碼進行關(guān)聯(lián),發(fā)現(xiàn)新的手機號碼“134****8255”,通過對“134****8255”再次進行搜索,進而發(fā)現(xiàn)該手機的實名信息李某,并關(guān)聯(lián)出該號碼關(guān)聯(lián)的湖南省婁底市的地址信息,如圖 3 所示。可見,對互聯(lián)網(wǎng)模型抓取的一條信息,通過多次迭代搜索的方式,可挖掘并分析出相關(guān)人員身份、手機、地址等內(nèi)容,最終勾勒出涉嫌人員信息,形成更加有價值的線索。
將監(jiān)測模型抓取的 1 000 余條涉嫌銷售假酒信息推送給貴州遵義公安機關(guān),從應(yīng)用情況看,模型能較好地抓取互聯(lián)網(wǎng)網(wǎng)頁、論壇等發(fā)布的涉嫌銷售假酒信息,通過公安機關(guān)進一步研判,已經(jīng)形成一批有價值的案件線索。研究中還發(fā)現(xiàn),近期有不法分子開始在視頻 App 等手機移動 App 上發(fā)布虛假廣告信息,并使用二維碼作為聯(lián)系方式,下一步我們還將研究如何在移動 App 等平臺上進行廣告線索抓取,建立二維碼信息的自動采集、識別方法,不斷完善監(jiān)測模型,更加高效準確地獲取互聯(lián)網(wǎng)售假線索信息。
3 小結(jié)
本文介紹了一種較為新型的利用網(wǎng)絡(luò)制售假酒案件情況,分析了案件特點,針對互聯(lián)網(wǎng)涉假信息的發(fā)現(xiàn)、提取問題,利用互聯(lián)網(wǎng)搜索、數(shù)據(jù)挖掘技術(shù),提出了一種互聯(lián)網(wǎng)假酒犯罪監(jiān)測模型。從應(yīng)用情況看,模型可及時發(fā)現(xiàn)網(wǎng)上銷售假酒犯罪線索,幫助公安、企業(yè)打假部門及時進行打擊處理。運用技術(shù)對互聯(lián)網(wǎng)制售假酒犯罪進行監(jiān)測,雖能夠獲取線索,但還需要強化綜合治理,加強互聯(lián)網(wǎng)廣告、物流等行業(yè)的管理,匯聚公安、權(quán)利人企業(yè)的數(shù)據(jù)和資源,形成工作合力,才能夠標本兼治,從根本遏制利用互聯(lián)網(wǎng)制售假酒等侵犯知識產(chǎn)權(quán)犯罪。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >