在大型網(wǎng)絡(luò)數(shù)據(jù)中心包含了許多多媒體信息資源,對于挖掘資源,提升資源利用率非常有幫助,本文提出一種模糊語義的大型web網(wǎng)絡(luò)數(shù)據(jù)中心資源高效挖掘技術(shù),對資源信息流進行重建,利用泛華學(xué)習(xí)方法進行資源信息流模糊聚類分析,提取有益信息,完成數(shù)據(jù)迭代,實現(xiàn)資源優(yōu)化挖掘。數(shù)據(jù)表明采用該方法進行大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源挖掘的準(zhǔn)確性較好,資源調(diào)度的效率得到提高。
關(guān)鍵詞: Web網(wǎng)絡(luò), 數(shù)據(jù)中心, 資源挖掘,多媒體信息,模糊語義
隨著網(wǎng)絡(luò)多媒體信息技術(shù)的發(fā)展,大量的多媒體資源信息以視頻、聲音和文本等形式存儲在大型Web網(wǎng)絡(luò)數(shù)據(jù)中心,用戶通過數(shù)據(jù)庫訪問和檢索方法,進行多媒體資源調(diào)度使用。對大型Web網(wǎng)絡(luò)數(shù)據(jù)庫的訪問建立在對數(shù)據(jù)中心資源的高效挖掘基礎(chǔ)上,通過挖掘網(wǎng)絡(luò)數(shù)據(jù)中心資源的關(guān)聯(lián)特征信息,結(jié)合數(shù)據(jù)信息融合和聚類方法,實現(xiàn)資源調(diào)度和優(yōu)化分類,提高資源的使用效率。研究大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源高效挖掘技術(shù),同樣在Web網(wǎng)絡(luò)數(shù)據(jù)庫的優(yōu)化設(shè)計中具有重要意義,相關(guān)的數(shù)據(jù)挖掘方法研究受到人們的極大重視[1]。在大型Web網(wǎng)絡(luò)數(shù)據(jù)中心構(gòu)架體系中,由于存儲構(gòu)架體系的差異性以及數(shù)據(jù)之間的擾動,導(dǎo)致對資源的挖掘和調(diào)度的準(zhǔn)確性不好,容易出現(xiàn)數(shù)據(jù)冗余。對此,本文提出基于模糊語義本體映射的大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源高效挖掘技術(shù),并進行了仿真測試,得出有效性結(jié)論。
1 大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源分布結(jié)構(gòu)模型
1.1 大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源的分布式結(jié)構(gòu)構(gòu)架
為了實現(xiàn)對大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源高效挖掘,首先分析數(shù)據(jù)中心資源的分布式結(jié)構(gòu)模型,并進行資源信息流的時間序列擬合和多維信息特征重組。通過資源優(yōu)化挖掘,提高大型Web網(wǎng)絡(luò)數(shù)據(jù)中心的訪問和調(diào)度能力[2]。在大型Web網(wǎng)絡(luò)數(shù)據(jù)中心中,數(shù)據(jù)庫的存儲節(jié)點通過分布式結(jié)構(gòu)構(gòu)建方式將資源存儲在大型Web數(shù)據(jù)庫中,數(shù)據(jù)庫采用云存儲構(gòu)架模型進行數(shù)據(jù)讀取,將大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源數(shù)據(jù)進行二值圖模型構(gòu)建,表示為。在數(shù)據(jù)挖掘中,對采集的資源數(shù)據(jù)進行信息分類,分類集合A,B,融合聚類中心滿足,。假設(shè)大型Web網(wǎng)絡(luò)數(shù)據(jù)中心的數(shù)據(jù)存儲模型為一個分布節(jié)點為,網(wǎng)絡(luò)數(shù)據(jù)中心訪問接口的信息融合中心函數(shù)滿足,令:
為資源信息分布的模糊概念集,在數(shù)據(jù)分塊中選擇k個實例集,建立資源數(shù)據(jù)挖掘的聚類目標(biāo)函數(shù)為:
對聚類目標(biāo)函數(shù)進行極值優(yōu)化求解,得大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源挖掘模糊概念集為:
給定資源分布的4層量化信息結(jié)構(gòu)模型[3],通過分布式結(jié)構(gòu)構(gòu)架,得大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源分布式的信息結(jié)構(gòu)模型用二元擬合為:
在Web網(wǎng)絡(luò)數(shù)據(jù)中心資源的分布式結(jié)構(gòu)構(gòu)架模型中,進行信息融合和數(shù)據(jù)聚類處理,實現(xiàn)資源高效挖掘。
1.2 大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源信息流模型
在大型Web網(wǎng)絡(luò)數(shù)據(jù)中心的查詢向量集中通過查詢接口進行信息特征提取,構(gòu)建大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源信息流模型,采用資源信息的文本塊學(xué)習(xí)器和實例學(xué)習(xí)器構(gòu)建資源信息分布的本體模型為:
采用本體映射方法構(gòu)建一個包含n個特征分類屬性的進行大型Web網(wǎng)絡(luò)數(shù)據(jù)中心數(shù)據(jù)庫語義映射關(guān)系,計算本體內(nèi)元素之間語義相似度[4]。在資源存儲空間中采用決策信息融合方法,資源信息流分布貝葉斯粗糙集可寫為:
式中:是大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源的有限論域;為資源挖掘的客觀推理準(zhǔn)則。構(gòu)建資源信息流分布的信息函數(shù),采用傅里葉變換進行時頻特征分解[5],過程為:
式中:為大型Web網(wǎng)絡(luò)數(shù)據(jù)中心的非平穩(wěn)態(tài)特征值;為邊界域的時頻聯(lián)合分布;為分類特征參數(shù);為置信增益函系數(shù),在語義本體負(fù)域和邊界域內(nèi),得到大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源信息流的二值決策模型為:
在語義本體論域框架中,進行資源信息流模型擬合,為進行信息融合和資源挖掘提供識別框架內(nèi)的冪集特征信息。
2 資源高效挖掘?qū)崿F(xiàn)
在對大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源信息流進行信息流重建后,進行資源高效挖掘算法優(yōu)化設(shè)計,提出基于模糊語義本體映射大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源高效挖掘技術(shù),構(gòu)建大型Web網(wǎng)絡(luò)數(shù)據(jù)中心大數(shù)據(jù)信息流時間序列分析模型[6],得網(wǎng)絡(luò)數(shù)據(jù)中心邊緣性狀態(tài)函數(shù)表示為:
式中:代表大型Web網(wǎng)絡(luò)數(shù)據(jù)中心錐形核分布狀態(tài)矢量;為一個核函數(shù)。采用特征量化分解方法進行資源信息重組,表達(dá)式為:
求得大型Web網(wǎng)絡(luò)數(shù)據(jù)中心多媒體資源流挖掘的最大梯度差[7]為:
式中:是資源信息語義指向性函數(shù);m,n分別是大型Web網(wǎng)絡(luò)數(shù)據(jù)中心多媒體資源的維數(shù)和頻數(shù)。采用泛化學(xué)習(xí)方法進行資源信息流的模糊聚類處理[8],得到聚類中心矢量分布集合描述為:
式中:,表示大型Web網(wǎng)絡(luò)數(shù)據(jù)中心關(guān)聯(lián)規(guī)則分布概率密度函數(shù);X,Y為原始資源信息的負(fù)載量;是關(guān)聯(lián)規(guī)則互信息函數(shù)。采用表示大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源特征分布互信息量,結(jié)合語義本體映射方法實現(xiàn)互信息特征提取,得到資源分布的區(qū)域密度函數(shù)為:
式中:和分別是兩組資源信息列分布的模糊聚類中心;表示資源信息流采樣的長度;表示歸一化區(qū)域分布密度。待挖掘的資源信息的關(guān)聯(lián)屬性為,結(jié)合語義本體映射方法實現(xiàn)互信息特征提取,得到特征提取結(jié)果為:
以提取的特征為訓(xùn)練集,進行數(shù)據(jù)迭代,實現(xiàn)資源挖掘,迭代式為:
式中:為初始聚類參量;為大型Web網(wǎng)絡(luò)數(shù)據(jù)中心數(shù)據(jù)流樣本的特征維數(shù)。
3 仿真實驗與結(jié)果分析
為了測試本文算法在實現(xiàn)大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源挖掘中的性能,進行仿真實驗。實驗中,軟件工具采用Matlab 2010b,網(wǎng)絡(luò)數(shù)據(jù)中心數(shù)據(jù)庫采用Deep Web 200 GB,首先進行資源信息的原始數(shù)據(jù)采樣,資源信息流采集的長度為1 024,數(shù)據(jù)采樣的周期長T為0.04 s,實驗信噪比為-10 dB,信息聚類自適應(yīng)初始步長選為μ0=0.001。根據(jù)仿真環(huán)境和參數(shù)設(shè)定,進行資源仿真分析,進行大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源信息流重建,重建時域波形所示。
對采集的資源信息進行泛化學(xué)習(xí)和模糊聚類,結(jié)合語義本體映射方法實現(xiàn)互信息特征提取,實現(xiàn)資源挖掘,得到挖掘的精度對比結(jié)果所示。分析得知,采用本文方法進行大型Web網(wǎng)絡(luò)數(shù)據(jù)中心的資源挖掘的精度較高,性能更優(yōu)。
4 結(jié) 語
本文研究了大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源高效挖掘問題,提出基于模糊語義本體映射的大型Web網(wǎng)絡(luò)數(shù)據(jù)中心資源高效挖掘技術(shù)。通過實驗分析可知,采用本文方法進行資源挖掘準(zhǔn)確定位性能較好,資源調(diào)度能力較強。
參考文獻:
[1] 何力,丁兆云,賈焰,等.大規(guī)模層次分類中的候選類別搜索[J].計算機學(xué)報,2014,37(1):41?49.
[2] 李永剛,張治中,李龍江.一種WLAN與eHRPD系統(tǒng)間負(fù)載均衡算法[J].微電子學(xué)與計算機,2017,34(1):44?47.
[3] 王亞強,湯銘,曾沁,等.級聯(lián)式低消耗大規(guī)模網(wǎng)頁分類在線獲取方法[J].計算機應(yīng)用,2017,37(4):924?927.
[4] 潘穎,元昌安,李文敬,等.一種支持更新操作的數(shù)據(jù)空間訪問控制方法[J].電子與信息學(xué)報,2016,38(8):1935?1941.
[5] 郭明強,黃穎,謝忠.一種多核環(huán)境下的WebGIS模型優(yōu)化策略[J].計算機工程,2013,39(8):15?19.
[6] 韓國輝,陳黎,梁時木,等.Na?ve Bayes分類器制導(dǎo)的專業(yè)網(wǎng)頁爬取算法[J].中文信息學(xué)報,2010,24(4):32?38.
相關(guān)閱讀:計算機安全發(fā)表論文版面費多少
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >