摘要:畜禽養殖場舍內環境復雜,為便于后期使用數據時更具準確性,前期的采集和質量控制尤其重要。為解決這個問題,從數據采集、數據質量管理和數據融合三個方面進行控制,通過多源無線傳感器網絡采集溫度、濕度、不同成分氣體濃度等各個參數的數據,為進一步的分析環境各要素對舍內環境小氣候的影響奠定數據基礎。
關鍵詞:數據清洗;數據融合;自適應加權算法
開放科學(資源服務)標識碼(OSID):
畜禽養殖中,養殖舍的環境數據是動物生長監測的重要內容之一。傳統上,數據采集依靠人工,操作工人根據此信息做出調節養殖舍小氣候的動作。這種方式需要人工值守效率低。現代自動化的方法是利用傳感器與物聯網技術自動采集數據,并根據采集的環境數據自動做出干預環境的動作,如報警、開啟風機通風、開啟溫濕度設備等等。但是由于養殖舍環境監測數據多樣,環境復雜,采集到的數據有可能丟失或者出現錯誤,導致不能進行科學的處理,引起設備的錯誤報警或操作,這背離了自動調整達到適合畜禽生長需要的初衷。本文考量采集設備合理分布和有效采集,從以下幾個方面對數據質量控制進行研究。
1 數據采集
物聯網技術在各行各業中的廣泛應用,也給傳統養殖行業帶來了新技術和新理念。傳感器、嵌入式計算與分布式信息處理等技術的協作,可以實現對畜禽舍內環境的實時監測,感知環境狀態并采集環境數據,進一步傳送給用戶,為用戶實時掌控養殖過程提供技術支持和決策依據。實現智慧養殖的第一步是自動化的數據采集,最常用的技術就是無線傳感器技術。無線傳感器通信技術中,ZigBee通信技術發展最為迅速,廣泛應用于精準農業、智慧牧場等多個系統和領域。ZigBee無線網絡具有如下優點:
(1)自動組網,網絡容量大,ZigBee網絡最多可容納65000個網絡節點,并且任何網絡節點之間都可以進行通信。(2)模塊功耗小,兩節5號干電池可以支撐一個節點使用180-730天的時間,免去有線供電、充電和頻繁更換電池的麻煩。(3)成本低,由于協議簡單,工作在全球免費頻段,僅需先期的模塊費用。 養殖舍內環境參數傳遞時數據量比較小,ZigBee無線網絡在畜禽環境參數監測中非常實用,因此采取基于物聯網的Zig-Bee無線傳感器網絡采集養殖舍里的各個環境參數。
2 數據質量管理
2.1 數據清洗
數據清洗,顧名思義就是對數據進行凈化。通過重新審查和校驗,刪除重復的數據、糾正錯誤數據,保證數據的一致性。需要清洗的數據的主要類型:
(1)缺數據
引起這類問題的主要原因是:缺失了一些應該有的基本信息。這類數據經過過濾后,將缺失的內容補充到文件并提交給客戶,并重新寫人數據庫即可。
(2)誤數據
業務系統不健全和工作人員操作不規范,往往是產生的原因。比如對輸入數據沒有經過判斷和校驗直接寫入數據庫造成的。這一類錯誤數據可以進一步細化,比如全角字符錯用問題、不可見字符問題等等。檢測處理這種錯誤常用的一種方法是在數據庫中運行soL語句。
(3)重復數據
對這一類的數據清理是最復雜的,比如二維表中出現重復記錄或者重復字段。為了避免重要的數據遺失,數據過濾之前,要求客戶進行備份,需要過濾掉的數據,也不是直接丟棄,而是寫入文件存檔。為了保證數據的完整性和數據清洗的效率,負責數據清理的人員要和相關的單位負責人保持密切聯系,及時進行溝通和確認。
數據經過清洗才能保證數據的正確性,去除冗余的數據有利于數據的存儲,節省存儲開銷,提高效益。
2.2 數據修復
針對畜禽舍內環境數據缺失的修復處理,如果數據前后時間間隔不大,采用線性插值法。
式(l)中,xsub>k和xsub>k+j分別為已知k時刻和k+j時刻監測得到的畜禽舍內環境參數值,xsub>k+i為第k+i時刻缺失的畜禽環境參數值。如果丟失數據比較多或者前后間隔的時間比較大,則需要為缺失數據確定替補值,填補到缺失數據的位置上。新數據填補后,要盡可能地減少數據缺損造成的計算量偏差,因此填補值要盡可能地接近缺失的原始數據值。針對畜禽舍內環境缺失環境參數的數據的填補,采用氣象條件相同或者相近時,相鄰的幾天中監測到的同時刻相鄰節點的數據作為填補值。
畜禽舍內養殖環境監測數據具有時序性和連續性的特點,短時間內監測到前后相鄰時段數據,在正常的情況下不可能急劇發生變化。通過前后數據進行比較,如果某一時刻xk時間點監測到的畜禽舍內環境參數變化范圍嚴重偏離了前一時刻Xk-1和后一時刻Xsub>k+1的變化幅度,則認為該數據有錯誤。可采用式(2)均值平滑法進行水平處理。
其中υ1和υ2分別為兩個相鄰數據之間的誤差閾值。
畜禽舍內環境監測的數據具有周期性,在不同日期,在氣象條件狀況相似的,前后幾天應具有相似的參數變化趨勢。相鄰日期的同一時刻監測到的參數值,應該穩定的維持在正常的變化范圍內。如果某一時刻監測到的環境數據,和其氣象條件相似的前一天、前兩天相同時刻監測到的環境數據相差+10%范圍之外,就可以判斷為該數據為異常的數據,可采用式(3)均值法進行垂直處理。
x(d,k)為d天k時刻的環境的數據,υ3為氣象條件相似時同一時刻數據誤差的閾值,Xk為待處理數據在氣象條件相似的近幾天同一時刻環境參數的平均值。
3 數據融合
為了獲得比較精確的環境監測數據,養殖舍內無線傳感器監測時,采用了多傳感器(溫濕度傳感器、氨氣傳感器、二氧化碳傳感器、硫化氫傳感器)進行監測,同時對同類型的數據進行數據融合,以消除二義性并解決數據的缺失及錯誤。如表1所示,對各種數據融合技術進行對比,確定采用加權平均法做同類數據的融合。
假設針對養殖舍環境各個參數監測時各有N個無線傳感器,由于每個傳感器所處舍內位置不同、測量精度不同,對于同一類型的傳感器的不同個體,在總的最小均方誤差達到最優化條件下,求解最優加權因子,使數據融合后的數值達到最優。 假設預估計的真實值是X,相互獨立的N個無線傳感器實際顯示的值分別是X1,X2…Xn,方差分別是σ1,σ2,…σn,加權因子分別是W1,W2,...Wn。進行數據融合后x的值應該滿足式(4)。
計算出最優加權的因子,進一步根據傳感器測出的實際數值就能夠方便地計算出經過數據融合后得到的最優值,如式(9)。運用自適應加權估值算法,普遍能夠取得比平均估值算法更加突出的融合效果。
4 結束語
針對真實復雜的畜禽養殖場環境,通過多源無線傳感器網絡采集各個參數的數據,做數據清洗保證數據的完整性,然后使用自適應加權算法,進行特征級融合,能夠更好地保證測量數據的精度和準確性,從而達到控制環境數據質量的目的。
參考文獻:
[1]王冉,徐本崇,魏瑞成,等.基于無線傳感網絡的畜禽舍環境監控系統的設計與實現[J].江蘇農業學報,2013(3):24-30.
[2]張偉,何勇,劉飛,等.基于物聯網的規模化畜禽養殖環境監控系統[J].農機化研究,2015,2(2):245-248.
[3]王騫.禽畜舍環境多參數監測系統的研究[D].河北農業大學,2012.
[4]王宇英,周興社,梁東方.面向信息物理融合系統的異構模型轉換方法[J].西安電子科技大學學報:自然科學版,2015,42(2):124-131.
推薦閱讀:《當代畜禽養殖業》(月刊)創刊于1980年,是由內蒙古農牧業科學院主辦的畜牧科技普及性刊物。旨在宣傳黨的有關畜牧業生產的方針、政策,普及畜牧業科學技術知識;交流經營和管理生產的經驗,介紹國內外先進的科技知識和發展動態,提供和傳播畜牧業產、供、銷信息。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >