技術論文投稿云計算環境下的大規模圖數據處理技術思考
簡要:目前,大規模圖數據的管理應用中,所應用的數據模型主要為單圖數據模型和超圖數據模型,下面是小編搜集整理的一篇 技術論文: 探究圖數據處理技術應用的論文范文,供大家閱讀參
目前,大規模圖數據的管理應用中,所應用的數據模型主要為單圖數據模型和超圖數據模型,下面是小編搜集整理的一篇技術論文:探究圖數據處理技術應用的論文范文,供大家閱讀參考。
摘要:云計算作為一種新型互聯網相互的應用模式,云計算的應用革新了IT產業,為推動IT產業良好奠定基礎。而近些年迅速崛起的生物信息網絡、Web分析網絡等新型網絡的推出,對大規模圖數據處理功能提出更高的要求。此種情況下,需要在云計算環境下,優化運用大規模圖數據處理技術,提高大規模圖數據處理功能。基于此點,筆者將從概述云計算展開,就云計算環境下大規模圖數據處理技術應用優勢進行分析,從而探究云計算大環境下大規模圖數據處理技術的有效應用。
關鍵詞:云計算環境;大規模圖數據;處理技術;應用優勢
圖是計算機科學中最常用的一類抽象數據結構,在結構和語義方面比線性表更加復雜,更具有一般性表述能力。因此,當前所推出的新型網絡社交網絡分析、語義Web分析、生物信息網絡分析等,對大規模圖數據處理提出更高的要求。要想使新型網絡可以高效、靈活的運用,需要優化運用大規模圖數據處理技術,使其可以對大規模圖進行高效的處理。所以,在云計算環境下,優化運用大規模圖數據處理技術是非常有意義的。
1云計算概述
1.1云計算
云計算是于2007年美國IBM公司在互聯網技術高速發展背景下提出的,將其定義為:可以同時描述一個系統平臺或是一種類型的應用程序,核心為互聯網。由此總結的云計算的技術特點為:
1) 虛擬化。云計算的運用是通過云計算服務器來實現的,它是不具備有形的實體。對于云計算服務器的運用,則是用戶的網絡工具,如計算機、手機等在網絡環境下,與云計算的服務器連接,進而利用云計算完成各種計算任務。
2)通用性和可擴展性。因云計算具有多種功能,使得云計算平臺可以支持不同的應用程序同時運行。而使云計算可以如此應用的原因是云計算集群規模具有動態伸縮性,可以滿足各種應用程序的應用需求,同時也可以擴展應用。所以,云計算具有通用性和可擴展性。
3)經濟性高。因為云計算本身就具有超強的容錯能力,所以利用廉價的云計算集群服務器就可以支撐大規模的云計算集群,促使云計算機集群發揮作用。由此可以說明,云計算占據了低成本優勢。這也是云計算能夠廣泛應用的原因之一[1]。
1.2 云計算的相關技術
為了使云計算可以更加廣泛且有效的應用,利用科學技術研究的云計算相關技術,在云計算應用的過程中起到非常重要的作用。
1.2.1 海量分布式存儲技術
此項技術是云計算存儲數據的主要手段。海量分布是存儲技術具有經濟性高、安全性高、可用性高等特點,利用此項技術并采用冗余存儲的方式,可以提高云計算數據存儲量和數據存儲的安全性。
1.2.2 數據管理技術
云計算在高度運行的過程中需要對大量數據進行提取、分析、比較、存儲等。這一過程中,如若不能有效地管理數據,容易造成云計算數據丟失,給用戶帶來嚴重的損失。所以,云計算數據管理技術的應用是非常有必要的,可以對云計算中大量數據進行高效管理。
1.2.3 并行編程模式
云計算并行編程模式的有效運用,可以對云計算并列運行的各種應用服務予以合理編程,促使云計算可以正確的執行多個并列程序,提高云計算運行質量、效率。所以,云計算并列編程模式有效實施也很有必要[2]。
2 云計算環境下大規模圖數據處理技術應用優勢
基于以上對云計算的了解,筆者將重點分析和了解大規模圖數據處理技術在云計算環境下運用的優勢。
2.1有利于海量圖數據存儲和維護
由于大規模圖數據處理技術可以處理GB級別甚至是PB級別的圖數據量。這遠遠大于傳統的文件系統和數據庫內存,使其無法在傳統文件系統或數據庫中運用。但云計算采用的是分布式存儲模式,可以存儲大規模的圖數據。在云計算環境下利用大規模圖數據處理技術,可以根據實際需要,集中進行海量圖數據的存儲、一致性的圖數據維護、統一的圖數據備份等處理,提高海量圖數據的安全性。
2.2提高大規模圖數據應用性
大規模圖數據處理技術除了具有以上優點之外,還可以在云計算環境下,依據云計算分布平行處理特點,對圖數據進行分割處理,將圖數據分割成若干子圖,以便各個子圖可以有效應用,提高圖數據應用效果。所以,在云計算環境下利用大規模圖數據處理技術來分割圖數據,可以大大提高圖數據應用性。
2.3根據不同情況,合理處理大規模圖數據
從技術角度和經濟角度講,云計算環境具有良好的可伸縮性和靈活性,非常適合處理數據量彈性變化大的大規模圖數據。而大規模圖數據處理技術也具有可伸縮性和靈活性的特點,利用此項技術來處理大規模圖數據,可以根據云中動態添加節點來擴展存儲容量和計算資源,從而有效地處理大規模圖數據[3]。
3云計算環境下大規模圖數據處理技術的應用
圖屬于一種非線性數據結構,具有十分鮮明的多對多結構關系,合理利用大規模圖數據處理技術來對大規模圖數據進行處理,才能使圖數據所表達的語義更加清晰、準確、豐富。
3.1基于云計算的圖數據存儲方式,合理存儲圖數據
目前,大規模圖數據的管理應用中,所應用的數據模型主要為單圖數據模型和超圖數據模型。兩者唯一的區別是存儲格式不同。在云計算分布式存儲系統中,基于以上兩種數據模型進行圖數據存儲,形成分布式文件系統和分布式數據庫。基于云計算圖數據存儲方式,利用大規模圖數據存儲技術來對大規模圖形,則是根據數據模型的特點,對圖數據進行合并、遷移處理,從而提高圖數據的讀取效率[4]。
3.2基于云計算的圖數據分割,對圖數據進行分割處理
由于圖數據具有連通性特點,這使得圖數據計算的耦合性較強。為了能利用大規模圖數據處理技術來有效處理圖數據,應當基于云計算圖數據分割來進行。具體的做法是根據云計算分布式存儲系統各個工作節點,對邏輯結構較強的、相對完整的大圖進行分割處理,并且在分割過程中考慮圖數據的連通性及均衡性,確保所分割的子圖之間可以有效連通,并且各個子圖比較均衡。
3.3 基于云計算圖數據計算模型,對圖數據進行計算處理
目前,云計算環境中,圖數據計算的模型有兩種,即Map Reduce模型和BSP模型。利用大規模圖數據處理技術來進行圖數據計算則是:1)Map Reduce模型。根據大規模圖數據特點及Map Reduce模型特點,利用此模型搭建大規模圖數據的Map Reduce模型,從而將大規模圖數據計算分為Map任務和Reduce任務。在Map任務環境中,對圖數據進行合理計算,輸出key值。在Reduce任務環境中,將每個數據進行計算和處理,獲得輸出結果。2)BSP模型。大規模圖數據處理技術基于BSP模型來進行大規模圖數據計算,則是了解圖數計算可能出現死鎖或數據競爭情況,進而從消息通信的角度出發合理計算大規模圖數據,獲得輸出值[5]。
4 結束語
綜合以上內容,可以充分說明云計算環境下,基于云計算圖數據存儲方式、計算模型、分割方式等來利用大規模圖數據處理技術,可以充分發揮此項技術優點,有效處理大規模圖數據,提高圖數據應用性。所以,云計算環境下,合理運用大規模圖數據處理技術是非常有意義。
參考文獻:
[1]于戈,谷峪,鮑玉斌等.云計算環境下的大規模圖數據處理技術[J].計算機學報,2011,34(10):1753-1767.
[2] 李淵.淺析云計算環境下的大規模圖數據處理技術[J].中國高新技術企業,2014(6):53-54.
[3] 于戈,谷峪,鮑玉斌等.云計算環境下的大規模圖數據處理技術[C].第28屆中國數據庫學術會議論文集,2011:1753-1767.
[4] 趙小換.云計算環境下的大規模圖數據處理技術分析[J].中國外資(下半月),2012(5):275.
[5] 李東升.云計算環境下的大規模圖數據處理技術[J].信息與電腦,2015(8):35-35,40.