韩国激情一区二区高清在线,亚洲中文字幕网址在线,九色在线精品视频,久久深夜福利亚洲网站

    <object id="jtoc7"><button id="jtoc7"></button></object>

      <object id="jtoc7"></object>

      期刊 科普 SCI期刊 投稿技巧 學(xué)術(shù) 出書 購物車

      首頁 > 優(yōu)秀范文 > 數(shù)據(jù)分析論文

      數(shù)據(jù)分析論文樣例十一篇

      時間:2023-06-05 08:44:29

      序論:速發(fā)表網(wǎng)結(jié)合其深厚的文秘經(jīng)驗,特別為您篩選了11篇數(shù)據(jù)分析論文范文。如果您需要更多原創(chuàng)資料,歡迎隨時與我們的客服老師聯(lián)系,希望您能從中汲取靈感和知識!

      數(shù)據(jù)分析論文

      篇1

      1.1數(shù)據(jù)采集系統(tǒng)

      大數(shù)據(jù)時代,大數(shù)據(jù)有著來源復(fù)雜、體量巨大、價值潛伏等特點,這使得大數(shù)據(jù)分析必然要依托計算機技術(shù)予以實現(xiàn).因此從兩個方向上加強數(shù)據(jù)采集統(tǒng)建設(shè),一是側(cè)重于數(shù)據(jù)的處理與表示,強調(diào)采集、存取、加工和可視化數(shù)據(jù)的方法;二是研究數(shù)據(jù)的統(tǒng)計規(guī)律,側(cè)重于對微觀數(shù)據(jù)本質(zhì)特征的提取和模式發(fā)現(xiàn),在兩個方向上的協(xié)同、均衡推進,以此來保障大數(shù)據(jù)平臺應(yīng)用的穩(wěn)健成長和可持續(xù)發(fā)展.廣電的網(wǎng)絡(luò)和用戶是其核心資產(chǎn),而其中流動的數(shù)據(jù)(包括用戶基礎(chǔ)數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、網(wǎng)管/日志數(shù)據(jù)、用戶位置數(shù)據(jù)、終端信息等)是核心數(shù)據(jù)資產(chǎn).對于廣電運營商來說,最有價值的數(shù)據(jù)來自基礎(chǔ)網(wǎng)絡(luò),對于基礎(chǔ)網(wǎng)絡(luò)數(shù)據(jù)的挖掘和分析是運營商大數(shù)據(jù)挖掘的最重要方向.因此其數(shù)據(jù)采集的目標(biāo)包括機頂盒數(shù)據(jù)、CRM數(shù)據(jù)、帳務(wù)數(shù)據(jù)、客服數(shù)據(jù)、運維數(shù)據(jù)、媒資數(shù)據(jù)、GIS數(shù)據(jù)、財務(wù)數(shù)據(jù)和其他手工錄入、表格數(shù)據(jù).采集頻率要求可以實現(xiàn)實時采集和定時批量采集.采集這類數(shù)據(jù)帶來一個問題就是各類數(shù)據(jù)雜亂無章,會導(dǎo)致數(shù)據(jù)質(zhì)量問題越來越嚴(yán)重,通過引進實時質(zhì)量監(jiān)控和清洗技術(shù),建設(shè)強大的分布式計算和集群能力,提高數(shù)據(jù)監(jiān)控和數(shù)據(jù)采集性能,利用分布式處理技術(shù),實現(xiàn)數(shù)據(jù)抽取、數(shù)據(jù)清洗以及相應(yīng)的數(shù)據(jù)質(zhì)量檢查工作,保證采集到高質(zhì)量的數(shù)據(jù),將廣電大數(shù)據(jù)中心建設(shè)成一個覆蓋廣電系統(tǒng)全部數(shù)據(jù)的存儲中心,具備采集各類結(jié)構(gòu)化、非結(jié)構(gòu)化海量數(shù)據(jù)的處理能力.

      1.2數(shù)據(jù)分析中心

      廣電企業(yè)每時每刻都在產(chǎn)生大量的數(shù)據(jù),需要對這些數(shù)據(jù)歸集、提煉,廣電企業(yè)大數(shù)據(jù)平臺建設(shè)的意義在于有效掌握規(guī)模龐大的數(shù)據(jù)信息,對這些數(shù)據(jù)信息進行智能處理,從中分析和挖掘出有價值的信息.在廣電大數(shù)據(jù)分析中需要對直播節(jié)目分析、互動業(yè)務(wù)分析、互聯(lián)網(wǎng)流量分析、互聯(lián)網(wǎng)內(nèi)容分析、廣電客戶分析、市場收益分析、智能內(nèi)容推送和廣告分析等,通過這類數(shù)據(jù)分析,能夠?qū)崟r了解廣電運營商的經(jīng)營狀況,提供決策支持.因此采用兩種方式分析方法對收集到的數(shù)據(jù)進行分析處理.一是采用在線分析方法技術(shù),使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數(shù)據(jù)的目的.這些信息是從原始數(shù)據(jù)直接轉(zhuǎn)換過來的,他們以用戶容易理解的方式反映企業(yè)的真實情況.在線分析策略是將關(guān)系型的或普通的數(shù)據(jù)進行多維數(shù)據(jù)存貯,以便于進行分析,從而達到在線分析處理的目的.這種多維數(shù)據(jù)存儲可以被看作一個超立方體,沿著各個維方向存貯數(shù)據(jù),它允許分析人員沿事物的軸線方便地分析數(shù)據(jù),分析形式一般有切片和切塊以及下鉆、挖掘等操作.二是數(shù)據(jù)挖掘是從海量、不完全的、有噪聲的數(shù)據(jù)中挖據(jù)出隱含的、未知的、用戶可能感興趣的和對決策有潛在價值的知識和規(guī)則.這些規(guī)則蘊含了數(shù)據(jù)庫中一組對象之間的特定關(guān)系,揭示出一些有用的信息,可以為經(jīng)營決策、市場策劃和金融預(yù)測等方面提供依據(jù).

      1.3數(shù)據(jù)應(yīng)用中心

      在大數(shù)據(jù)分析平臺應(yīng)用過程中,數(shù)據(jù)本身并不是數(shù)據(jù)分析和數(shù)據(jù)挖掘的重點,重點在于如何應(yīng)用這些技術(shù)去解決企業(yè)在運營中實際的商業(yè)問題.通過對數(shù)據(jù)分析和挖掘,了解企業(yè)運行過程存在問題,預(yù)判企業(yè)中各類業(yè)務(wù)發(fā)展走向.對數(shù)據(jù)分析與挖掘結(jié)果來說主要有兩個方面,一是將分析結(jié)果給客戶使用,另一個是將分析結(jié)果提供給內(nèi)部用戶使用,因此在大數(shù)據(jù)分析平臺設(shè)計中,將數(shù)據(jù)應(yīng)用劃分為三個應(yīng)用中心:

      1)推薦中心

      推薦中心面向收視、寬帶使用用戶,通過分析使用用戶的收視、互聯(lián)網(wǎng)、消費等行為,將使用用戶分群,總結(jié)群體特征,向不同群體推薦個性化的電視節(jié)目、廣告和增值應(yīng)用服務(wù).從而提升用戶的使用體驗,提升用戶的滿意度和粘度.

      2)決策中心

      決策中心面向廣電企業(yè)內(nèi)部決策者、管理者、經(jīng)營分析人員,通過對企業(yè)經(jīng)營數(shù)據(jù)的KPI、運營監(jiān)控、經(jīng)營盤點,使企業(yè)決策者掌握企業(yè)運營狀況及發(fā)展趨勢;智能報告協(xié)助分析人員自動定位經(jīng)營中的問題;即席查詢在預(yù)定義的語義層基礎(chǔ)上,實現(xiàn)靈活的自定義查詢;通過主題分析滿足各部門、崗位的多維度分析需求;通過專題分析就某一具體問題進行深入挖掘,輔助專業(yè)分析人員的工作;統(tǒng)計報表滿足各部門常規(guī)統(tǒng)計需求.

      3)服務(wù)中心

      服務(wù)中心面向廣電的合作伙伴,比如:電視臺、廣告商、服務(wù)和內(nèi)容提供商、相關(guān)政府職能部門等.通過對使用用戶收視行為的實時分析,將電視欄目實時收視率提供給電視臺,電視臺根據(jù)收視率進行在線的問卷調(diào)查,提高電視臺的影響力,幫助其增強欄目的評價體系.為廣告商提供精準(zhǔn)的廣告投放策略,實時準(zhǔn)確的廣告投放評估,幫助廣告商提升廣告到達率、準(zhǔn)確度和營銷效果.為服務(wù)和內(nèi)容提供商的電影、電視和增值應(yīng)用等產(chǎn)品提升收視率和使用頻率,并進行評估,為其提供受眾喜好特征,幫助其推出有針對性的產(chǎn)品.通過用戶收視數(shù)據(jù)、節(jié)目反饋等信息,將相關(guān)輿情向相關(guān)政府部門匯報.

      1.4系統(tǒng)管理

      系統(tǒng)管理是大數(shù)據(jù)分析平臺一個輔助功能模塊,主要是為了系統(tǒng)管理員對大數(shù)據(jù)平臺進行有效的監(jiān)控和管理,提升大數(shù)據(jù)分析平臺性能使用,包含有如下幾個模塊:權(quán)限管理、數(shù)據(jù)質(zhì)量管理、元數(shù)據(jù)管理、調(diào)度管理、系統(tǒng)監(jiān)控等.

      2數(shù)據(jù)應(yīng)用分析

      移動互聯(lián)網(wǎng)的發(fā)展為傳統(tǒng)行業(yè)帶來了新的思考,如何在互聯(lián)網(wǎng)時代更好地實現(xiàn)以客戶為中心的服務(wù)理念,借助大數(shù)據(jù)分析平臺、海量的客戶非結(jié)構(gòu)化的行為數(shù)據(jù)和傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),可以有效提升廣電個性化、人性化的服務(wù)水平.大數(shù)據(jù)分析平臺通過整合廣電網(wǎng)絡(luò)中多個數(shù)據(jù)源,并按照主題進行劃分,在定義主題的過程中,提供廣電業(yè)務(wù)概念的規(guī)范定義.?dāng)?shù)據(jù)模型不偏重于面向某個應(yīng)用,而是站在企業(yè)角度統(tǒng)攬全局,提供可擴展的模型設(shè)計,偏范式化的設(shè)計使平臺在最大程度上保持一致和靈活擴展性.依托某廣電網(wǎng)絡(luò)公司業(yè)務(wù)開展情況,搭建數(shù)據(jù)分析平臺,具有如圖2所示的主題結(jié)構(gòu),共計8大類53小類,從廣電網(wǎng)絡(luò)運營的各個方面進行了數(shù)據(jù)分析.

      2.1直播節(jié)目分析主題

      直播電視節(jié)目作為廣電運營模式中一直沿用的產(chǎn)品類型,對于廣電用戶的影響和廣電運營商運營模式起著至關(guān)重要的作用.實時直播節(jié)目分析,用戶可以實時查看每個時間點上每個節(jié)目收視率,以此為據(jù)來指導(dǎo)產(chǎn)品定制、節(jié)目選擇、用戶推廣等方面的商業(yè)應(yīng)用,對直播節(jié)目的多維度分析,運營商可深入分析直播節(jié)目收視特性及受眾影響規(guī)律,以指導(dǎo)運營優(yōu)化,提高節(jié)目的收視率和營收.

      2.2多媒體業(yè)務(wù)分析主題

      廣電行業(yè)的雙向網(wǎng)絡(luò)改造不僅將視頻點播、通信及娛樂業(yè)務(wù)成為可能,同時配備增值業(yè)務(wù),如廣告、支付、股票、游戲、付費節(jié)目等服務(wù).可以明顯看到哪類業(yè)務(wù)最受歡迎,哪類業(yè)務(wù)的增長趨勢良好,哪類業(yè)務(wù)應(yīng)用下滑得較快,哪類業(yè)務(wù)不受用戶歡迎,從這樣的分析結(jié)果中,可以為廣電網(wǎng)絡(luò)以后的業(yè)務(wù)引進中提供指導(dǎo),避免引進的業(yè)務(wù)不受用戶歡迎,同時也可以預(yù)見性的引進一些代表將來趨勢性的業(yè)務(wù),提前做好業(yè)務(wù)儲備工作.互動業(yè)務(wù)的互動特性為廣電運營商增加客戶粘度、制定產(chǎn)品投放策略、獲取最大化收益及市場價值提供了前所未有的空間,通過對互動業(yè)務(wù)的應(yīng)用分析,可以分析出用戶的行為趨勢.利用這樣的分析結(jié)果改善廣電業(yè)務(wù)引進,提高用戶的粘度和ARPU值.

      2.3互聯(lián)網(wǎng)應(yīng)用分析主題

      廣電作為政府宣傳的喉舌,一個主要的特點就是可管可控,相對此而言,互聯(lián)網(wǎng)網(wǎng)絡(luò)一個重要特點就是用戶各類行為的不可控性.在三網(wǎng)融合的新環(huán)境下,廣電網(wǎng)絡(luò)一個重大改變就是引進了互聯(lián)網(wǎng)業(yè)務(wù),同時通過多屏互動技術(shù)使廣電終端類型日益復(fù)雜,如何對廣電網(wǎng)絡(luò)引進的互聯(lián)網(wǎng)業(yè)務(wù)和終端進行有效的管控,成為擺在廣電網(wǎng)絡(luò)運營商面前一個重要課題.運營商可以清晰地看到用戶在討論什么、在看什么,以此來分析用戶將來可能采取的行為趨勢,進而來引導(dǎo)用戶輿論與行為,實現(xiàn)對廣電網(wǎng)絡(luò)的可管可控的最終目的.同時廣電網(wǎng)絡(luò)也可以利用互聯(lián)網(wǎng)數(shù)據(jù)從如下兩方面做了分析,運營流量及應(yīng)用優(yōu)化,節(jié)省網(wǎng)絡(luò)帶寬,減少運營費,同時用以提高用戶體驗度,增加用戶粘性;充分利用線上、線下同步運營模式,深入挖掘線上討論內(nèi)容,為線下運營提供指導(dǎo).

      2.4廣電客戶分析主題

      在三網(wǎng)融合的環(huán)境下,廣電網(wǎng)絡(luò)在逐漸擺脫事業(yè)單位模式下經(jīng)營模式,向“市場驅(qū)動”、“客戶驅(qū)動”經(jīng)營模式的轉(zhuǎn)變,“以客戶為中心”的理念和策略不可或缺,而廣電網(wǎng)絡(luò)擁有的客戶群和常規(guī)用戶分析的客戶群體有著本質(zhì)區(qū)別,以往分析往往針對個體用戶進行分析,廣電網(wǎng)絡(luò)面向的用戶通常是以家庭為單位的,這給廣電網(wǎng)絡(luò)用戶行為分析帶來不可預(yù)料的困難.通過針對用戶群體不同年齡、不同時間段的收視行為和上網(wǎng)行為分析,可以區(qū)分某一時間段內(nèi)該家庭用戶內(nèi)個人的行為,可以清晰看到各類用戶在各個階段的變化情況,以及這個變化給廣電網(wǎng)絡(luò)運營帶來的變化.從用戶信息出發(fā),以用戶應(yīng)用行為為主線,深入挖掘用戶關(guān)系,為廣電用戶關(guān)系管理提供有效基礎(chǔ)數(shù)據(jù),提高用戶滿意度、忠誠度,提高廣電網(wǎng)絡(luò)市場運作的主動性.

      2.5市場收益分析主題

      三網(wǎng)融合后,廣電網(wǎng)絡(luò)作為一個市場主體,需要適應(yīng)日趨激烈的市場競爭環(huán)境,提升廣電運營商的企業(yè)核心競爭力,應(yīng)充分利用業(yè)務(wù)支撐系統(tǒng)產(chǎn)生的大量寶貴的數(shù)據(jù)資源,建立廣電企業(yè)收益分析系統(tǒng),實現(xiàn)對收益數(shù)據(jù)的智能化加工和處理,為市場運營工作提供及時、準(zhǔn)確、科學(xué)的決策依據(jù).利用先進的OLAP技術(shù)和數(shù)據(jù)挖掘技術(shù),幫助企業(yè)的經(jīng)營決策層了解企業(yè)經(jīng)營的現(xiàn)狀,發(fā)現(xiàn)企業(yè)運營的優(yōu)勢和劣勢,預(yù)測未來趨勢;幫助細(xì)分市場和客戶,指導(dǎo)營銷、客服部門進行有針對性的營銷和高效的客戶關(guān)系管理;對決策的執(zhí)行情況和結(jié)果進行客觀準(zhǔn)確的評估,深受用戶的青睞.如圖7所示的收益分析結(jié)果,可以清晰看出企業(yè)各類業(yè)務(wù)在營收中所占比例,可以明確了解哪類業(yè)務(wù)是企業(yè)的優(yōu)質(zhì)業(yè)務(wù),哪類業(yè)務(wù)需要進一步加強開拓市場,同時也可以預(yù)測哪類業(yè)務(wù)會有更大的推廣空間,為企業(yè)持續(xù)開展業(yè)務(wù)提供指導(dǎo).

      2.6智能內(nèi)容推送主題

      深層次挖掘用戶潛在的需求,以用戶的需求為導(dǎo)向,向用戶推送有針對性的內(nèi)容.廣電運營商通過對用戶差異性的運營策略,激發(fā)用戶參與的熱情,讓用戶有持續(xù)的良好體驗,提升對用戶的吸引力和黏著度.信息精準(zhǔn)、智能推送的關(guān)鍵在于把握住用戶的行為習(xí)慣,同時讓每一個用戶都可以按自己需求方便、快捷地調(diào)整、歸類相關(guān)信息.大數(shù)據(jù)分析平臺基于用戶行為收集分析系統(tǒng),挖掘出用戶潛在需求,充分了解了用戶的真實意愿,將有助于廣電運營商建立以客戶為中心的服務(wù)理念,提升社會影響力.

      篇2

      2視頻監(jiān)控在煙草行業(yè)的發(fā)展及應(yīng)用現(xiàn)狀

      (1)煙田監(jiān)控:實現(xiàn)對煙田、育苗大棚內(nèi)實時監(jiān)控;

      (2)煙葉收購站監(jiān)控:實現(xiàn)對煙草所有站點煙葉收購全流程監(jiān)控視頻調(diào)看、查詢、巡視、控制的功能;

      (3)生產(chǎn)及公用設(shè)施區(qū)監(jiān)控:主要用于監(jiān)控車間內(nèi)重要設(shè)備、生產(chǎn)線運行、物流線路及環(huán)境狀況,以及動力中心車間內(nèi)空調(diào)、鍋爐等重要設(shè)備的運行及環(huán)境狀況,防止災(zāi)害和事故的發(fā)生。

      (4)煙草物流配送中心監(jiān)控:對物流配送中心進行實時監(jiān)控;

      3視頻大數(shù)據(jù)分析的技術(shù)需求

      隨著視頻監(jiān)控在煙草行業(yè)的大規(guī)模應(yīng)用,視頻數(shù)據(jù)量的增加,每天產(chǎn)生的數(shù)據(jù)量都是以TB(1000GB)級別計算的,若是利用傳統(tǒng)的技術(shù)手段對每天的視頻進行檢索和分析,則需要數(shù)小時的時間才能夠完成,工作量及工作難度可想而知;而對于更高級別的視頻數(shù)據(jù),如PB(1000TB)級別的視頻數(shù)據(jù)進行分析和檢索時間那就是很多天了。視頻檢索與分析的效率低下,也是目前視頻數(shù)據(jù)利用效率及數(shù)據(jù)價值低下的首要原因。為此,如何提高視頻數(shù)據(jù)分析與檢索的效率,如何針對PB(1000TB)級別甚至EB(1000PB)級別的海量數(shù)據(jù)進行分析與檢索,提升視頻監(jiān)控數(shù)據(jù)價值,成為了當(dāng)前用戶的首要需求,也成為了當(dāng)前視頻大數(shù)據(jù)分析技術(shù)的難點及關(guān)鍵點之一。同時,在對視頻進行檢索與分析的過程中,需要考慮檢索結(jié)果的準(zhǔn)確性。由于視頻圖像信息為非結(jié)構(gòu)化數(shù)據(jù),如何合理有效地對非結(jié)構(gòu)化的數(shù)據(jù)進行檢索分析,優(yōu)化計算機圖像識別算法,是提高視頻大數(shù)據(jù)分析準(zhǔn)確性關(guān)鍵所在。再者,當(dāng)完成視頻檢索與分析后,如何做好視頻數(shù)據(jù)與非視屏數(shù)據(jù)的整合與關(guān)聯(lián)工作,是后期視頻數(shù)據(jù)應(yīng)用時重點考慮的內(nèi)容。

      4視頻大數(shù)據(jù)在煙草行業(yè)的應(yīng)用思考

      時下,煙田監(jiān)控、煙葉收購站監(jiān)控、生產(chǎn)及公用設(shè)施區(qū)監(jiān)控、煙草物流配送中心監(jiān)控等的視頻監(jiān)控數(shù)據(jù)較多僅僅用作安防視頻使用,還未涉及到與煙草業(yè)務(wù)的關(guān)聯(lián);隨著視頻監(jiān)控建設(shè)的完善及視頻大數(shù)據(jù)技術(shù)發(fā)展,各類監(jiān)控視頻數(shù)據(jù)量的增加,考慮到投資回報比,是否可以通過視頻大數(shù)據(jù)分析,將煙草業(yè)務(wù)與視頻監(jiān)控相關(guān)聯(lián),在海量的視頻監(jiān)控數(shù)據(jù)中提取有益于煙草行業(yè)發(fā)展的變革或新技術(shù)呢?

      4.1安防業(yè)務(wù)

      基于傳統(tǒng)視頻監(jiān)控,安防業(yè)務(wù)是傳統(tǒng)業(yè)務(wù)之一,通過大數(shù)據(jù)分析,有效快捷的提取安防所需要的視頻片段。同時基于視頻行為告警策略,及時告警。

      4.2安全生產(chǎn)

      結(jié)合視頻大數(shù)據(jù)分析,將以往多次生產(chǎn)事故監(jiān)控視頻整合,通過對多次生產(chǎn)安全事故的分析,總結(jié)出更為安全可靠的生產(chǎn)規(guī)則;再則通過視頻監(jiān)控與生產(chǎn)行為的結(jié)合,制定安全生產(chǎn)標(biāo)準(zhǔn),通過聲音報警或警示燈報警等技術(shù),在不符合標(biāo)準(zhǔn)視頻監(jiān)控預(yù)定義的安全規(guī)則情況時,能夠及時報警。通過視頻監(jiān)控分析,提升生產(chǎn)的安全性。如采用彩色網(wǎng)絡(luò)快球攝像機和彩色固定網(wǎng)絡(luò)槍式攝像機,彩色網(wǎng)絡(luò)快球攝像機的預(yù)制位設(shè)置應(yīng)優(yōu)先,根據(jù)視頻大數(shù)據(jù)分析后,系統(tǒng)可提供不同故障區(qū)域或設(shè)備的故障信號,各工藝段或設(shè)備的操作運行信號,通過系統(tǒng)集成與生產(chǎn)監(jiān)控實現(xiàn)聯(lián)動,平常攝像機對正在操作或運行設(shè)備進行監(jiān)控,一旦某個故障點報警,攝像機立刻自動轉(zhuǎn)動到報警點,監(jiān)控中心的NVR主機開始錄像等。

      4.3效率生產(chǎn)

      結(jié)合視頻大數(shù)據(jù)分析,通過分析各個不同煙站或煙廠中的同一種生產(chǎn)行為,結(jié)合對海量數(shù)據(jù)進行智能分析,提取出價值數(shù)據(jù)片段,形成元數(shù)據(jù)信息庫,再通過人為加工后期數(shù)據(jù),總結(jié)形成效率生產(chǎn)有用的價值信息,提供生產(chǎn)借鑒,提高生產(chǎn)效率。

      4.4創(chuàng)新生產(chǎn)

      通過視頻大數(shù)據(jù)分析,將以往的視頻通過軌跡分析,得出以往生產(chǎn)過程中各類生產(chǎn)動作中不必要或者多余的部分,簡化或者優(yōu)化生產(chǎn)規(guī)則;通過對給類生產(chǎn)行為的總結(jié),提出合理的建議,為生產(chǎn)提出創(chuàng)新性意見或建議,提高生產(chǎn)率。

      篇3

      2.1數(shù)據(jù)抽取Agent

      數(shù)據(jù)抽取Agent(DA)主要實現(xiàn)對網(wǎng)上電子數(shù)據(jù)交換的單證進行監(jiān)控性或合法性的格式檢查,并從不同的單證中自動地抽取出所需的數(shù)據(jù)項,提交給交互協(xié)調(diào)Agent,以便進行分析和統(tǒng)計。其對單證格式檢查的要求,以及數(shù)據(jù)抽取的要求統(tǒng)一由交互協(xié)調(diào)Agent管理。Agent實時監(jiān)測網(wǎng)上電子交換系統(tǒng)單證的收發(fā),當(dāng)用戶收到或發(fā)送單證時,它就會自動提取單證中的數(shù)據(jù),根據(jù)單證的種類、知識庫中處理要求,進行數(shù)據(jù)處理和存儲,并發(fā)送給交互協(xié)調(diào)Agent分析統(tǒng)計或報警。

      2.2計算統(tǒng)計Agent

      計算統(tǒng)計Agent(TA)主要對抽取出的單證數(shù)據(jù)按類別、時間、對象等多角度,采用馬爾可夫、多元回歸、指數(shù)等多種方法進行分析統(tǒng)計。因此,需要建立模型庫、知識庫對不同的單證進行不同要求的處理。計算統(tǒng)計Agent的組織結(jié)構(gòu)圖如圖1所示。

      TA會根據(jù)由交互協(xié)調(diào)Agent設(shè)定好的要求,當(dāng)收到的相應(yīng)單證數(shù)達到一定數(shù)目或者是積累了到預(yù)定的時間時,自動會進行分析和統(tǒng)計,如銷售單處理中的本月單證數(shù)目,本月銷售額、最大額銷售情況、下月的銷售量預(yù)測、最優(yōu)庫存量等。

      2.3交互協(xié)調(diào)Agent

      交互協(xié)調(diào)Agent(CA)是系統(tǒng)的關(guān)鍵,它既是與用戶溝通的橋梁,又是與各Agent交互協(xié)調(diào)工作的核心,其主要任務(wù)是實現(xiàn)問題求解的任務(wù)分配、調(diào)度和協(xié)作交互。為實現(xiàn)CA的交互協(xié)調(diào)和交互流程的一致,存放CA與其他Agent間的任務(wù)請求和分配信息;存放問題求解過程中的協(xié)作要求和參數(shù)信息;存放其他Agent的處理描述性信息,供CA分配任務(wù)時使用。

      2.4Agent之間的通信與協(xié)作

      在系統(tǒng)中,Agent之間的通訊是基于消息的通訊機制,利用消息完成傳遞服務(wù)請求及協(xié)調(diào)Agent之間的同步。DA和TA根據(jù)消息通訊來獲取環(huán)境信息、任務(wù)、結(jié)果反饋信息;DA的每一個監(jiān)控和執(zhí)行任務(wù)以及TA的每一個計算統(tǒng)計任務(wù)都可以表示為一個任務(wù)提交者CA向承擔(dān)者DA和TA發(fā)送任務(wù)消息;監(jiān)控和數(shù)據(jù)抽取任務(wù)的實施或暫停是由CA向DA發(fā)送任務(wù)消息,其監(jiān)控和數(shù)據(jù)抽取的結(jié)果則通過向CA回送消息予以體現(xiàn);同樣,計算統(tǒng)計的實施過程是TA接收到消息后產(chǎn)生狀態(tài)變化的過程,其計算分析結(jié)果通過向CA回送消息予以體現(xiàn),并由此來實現(xiàn)多Agent間的共享和合作運行。

      3網(wǎng)絡(luò)單證數(shù)據(jù)數(shù)據(jù)分析系統(tǒng)

      3.1系統(tǒng)結(jié)構(gòu)

      網(wǎng)絡(luò)單證數(shù)據(jù)數(shù)據(jù)分析系統(tǒng)是嵌入在原有的網(wǎng)上電子數(shù)據(jù)交換系統(tǒng)之上,主要由交互協(xié)作Agent、數(shù)據(jù)抽取Agent和計算統(tǒng)計Agent構(gòu)成,還包括了與原系統(tǒng)的接口。網(wǎng)絡(luò)單證數(shù)據(jù)數(shù)據(jù)分析系統(tǒng)結(jié)構(gòu)圖2所示。

      從圖2可知,CA控制協(xié)調(diào)DA和TD,以及控制數(shù)據(jù)接口和人機接口,而DA與數(shù)據(jù)接口僅有數(shù)據(jù)傳遞的連接關(guān)系,數(shù)據(jù)傳遞與否受CA的控制;數(shù)據(jù)接口是原網(wǎng)上電子數(shù)據(jù)交換系統(tǒng)與本系統(tǒng)的數(shù)據(jù)交換通道,只面向數(shù)據(jù)共享的要求;人機接口是為用戶進行任務(wù)設(shè)置而設(shè)計的,一旦任務(wù)設(shè)置后,系統(tǒng)可自動按設(shè)置值運行,無需外界干預(yù)。

      3.2EDIDA的工作流程

      通過人機接口,由用戶向CA進行任務(wù)設(shè)置;

      CA對設(shè)置的任務(wù)進行分解;

      各Agent獨立地進行工作,求解相應(yīng)的問題;

      由CA協(xié)調(diào)DA、TA的在求解中的問題請求,按上述的交互協(xié)作流程來完成任務(wù);

      CA會按要求的格式傳遞給設(shè)置的服務(wù)器,進行記錄和提示;

      在CA獲得TA的統(tǒng)計分析結(jié)果后,按要求的傳遞給設(shè)置的服務(wù)器進行記錄、輸出、保存、打印。

      CA對整個執(zhí)行過程記錄存儲,以優(yōu)化模型和知識的選擇和比較對比;

      3.3網(wǎng)上手機訂貨數(shù)據(jù)的分析

      在原有的網(wǎng)上電子數(shù)據(jù)交換系統(tǒng)中,有關(guān)于商家和供應(yīng)商間網(wǎng)上手機訂單處理。為此,將EDIDA嵌入后進行Motorola手機訂單的數(shù)據(jù)處理,包括訂單中訂貨數(shù)量的監(jiān)控、2007年7月的訂貨數(shù)量的預(yù)測。

      對訂單中訂貨數(shù)量的監(jiān)控,采用的方法是:訂貨量大于30部時,產(chǎn)生5秒的告警聲并記錄該單證號;對于2007年7月訂貨數(shù)量的預(yù)測,采用的方法是:選用最小二乘法模型ZXRC、指數(shù)加權(quán)移動平均模型YDJQ、三項和比例模型SXBL這三個模型來預(yù)測2007年7月的訂貨數(shù)量,并由CA根據(jù)評選規(guī)則來確定最后預(yù)測值,預(yù)測結(jié)果如表1所示。

      表中“*”號是指訂貨量大于30部的報警次數(shù),具體的訂貨量大于30部各訂單號則保存在CA的數(shù)據(jù)庫中。預(yù)測結(jié)果的最終選定由CA根據(jù)知識庫中規(guī)則來確定,評選的規(guī)則有:平均法,即對每個結(jié)果進行算術(shù)平均,把平均結(jié)果作為最后結(jié)果。去掉最大和最小法,再對剩下的結(jié)果進行算術(shù)平均。取中間值法,即最靠近中間的值,若中間值有兩個,則取其平均值為最后結(jié)果。使用頻率最高法,即根據(jù)使用成功次數(shù),選擇成功最多的模型結(jié)果為最終結(jié)果。最大原則,即選取最大預(yù)測值為最終結(jié)果。最小原則,即選取最小預(yù)測值為最終結(jié)果。

      本次預(yù)測采用平均法,即預(yù)測值=(146+135+151)/3,最終的預(yù)測結(jié)果為2007年7月Motorola手機的訂貨量為144部,與當(dāng)年實際Motorola手機訂貨量147部非常相近,并給出了季度指數(shù)。

      4結(jié)語

      本文采用Agent技術(shù),提出了對網(wǎng)上電子數(shù)據(jù)交換系統(tǒng)中XML單證的監(jiān)控和統(tǒng)計分析方法和實現(xiàn)技術(shù),初步探索了Agent在網(wǎng)絡(luò)監(jiān)控和預(yù)測領(lǐng)域中應(yīng)用,并結(jié)合實際進行了驗證。今后的研究將考慮用單個Agent來實現(xiàn)系統(tǒng)的功能,并加入黑匣子技術(shù),面向網(wǎng)上的應(yīng)用深入開展研究。

      參考文獻

      [1]A.Rao,M.Georgeff.BDIagents:Fromtheorytopractice.[J].InProceedingsoftheFirst

      InternationalConferenceonMulti-AgentSystems,1995:312-319.

      [2]M.J.Wooldridge,N.R.Jennings.Intelligentagents:Theoryandpractice[J].TheKnowledgeEngineeringReview,1995,10(2):115-152.

      [3]張寅生.智能Agent與Agent系統(tǒng)[J].計算機系統(tǒng)應(yīng)用.1998,(7).

      篇4

      野外人工模擬降雨試驗要在前期土壤水分不飽和的狀態(tài)下進行,因此每次模擬降雨試驗只能在同一徑流小區(qū)進行一次降雨過程。為獲取更多的野外模擬降雨產(chǎn)匯流及水土流失對比數(shù)據(jù),計劃在每個項目區(qū)的典型坡度———5°~8°、8°~15°、15°~25°分別建設(shè)坡地徑流小區(qū)。徑流小區(qū)的布設(shè)與等高線垂直,根據(jù)相關(guān)規(guī)范和實際條件,徑流小區(qū)投影面積一般為60m2,即20m(順坡投影長度)×3m(寬與等高線平行)。云縣石佛山坡耕地水土流失綜合治理試點工程水土保持監(jiān)測項目于2010年12月初完成8°、12°、15°三塊坡地小區(qū)的建設(shè),2011年6月下旬第一次模擬降雨試驗后,為方便對比分析,根據(jù)工程進展情況在12°坡地小區(qū)旁增設(shè)一塊梯地小區(qū)。

      1.2人工模擬降雨系統(tǒng)

      此次人工模擬降雨試驗采用西安理工大學(xué)研制的人工模擬降雨試驗系統(tǒng)(圖1)。它基于工控組態(tài)軟件,應(yīng)用現(xiàn)有的人工模擬降雨試驗裝置,將試驗過程的常用設(shè)備和工控軟件結(jié)合在一起,增加了自動控制環(huán)節(jié),通過對控制系統(tǒng)進行改造,解決了手動調(diào)節(jié)雨強不方便的問題,實現(xiàn)了對不同時段、不同雨強、不同分布的人工模擬降雨系統(tǒng)的手動和自動雙控制,采用監(jiān)控組態(tài)系統(tǒng)更好地滿足了人工模擬降雨試驗的需求。該人工模擬降雨系統(tǒng)可建于自然坡面上,高6m,降雨試驗區(qū)長20m、寬3m,有效降雨面積60m2。降雨系統(tǒng)布設(shè)在降雨裝置支架上,噴頭選用與天然降雨雨滴譜最為接近的X型下噴式噴頭,由4組不同噴嘴孔徑組合而成。為兼顧模擬降雨的均勻性與搭建支架的經(jīng)濟性和安全性,將系統(tǒng)在野外難以架設(shè)的固定式方鋼支架改為鋼管腳手架。頂寬超出徑流小區(qū)寬度方向兩邊各0.3m,頂端橫桿按照水管和噴頭分布架設(shè),壓力控制裝置設(shè)4個出水管,每管對應(yīng)同一噴嘴孔徑的噴頭,共設(shè)置4組24個不同噴嘴孔徑噴頭,支架內(nèi)部無任何遮擋。壓力控制裝置可自動、手動控制出水管的全開、全關(guān)或部分開啟。本系統(tǒng)可模擬降雨強度變化范圍4~200mm/h,降雨雨強最小分辨值1.3mm/h,降雨強度控制精度0.66mm/h,降雨均勻度>0.95。系統(tǒng)采用先進的閉環(huán)自動控制理論和技術(shù),是一種應(yīng)用交流變頻調(diào)速器控制的人工模擬降雨自動控制設(shè)備,以降雨過程的最終實際降雨參數(shù)控制和驅(qū)動系統(tǒng)的各個降雨部件,克服了從水源到噴頭之間諸多環(huán)節(jié)對降雨的隨機影響。實驗室測試結(jié)果表明,該設(shè)備的主要性能指標(biāo)優(yōu)于國內(nèi)外其他人工模擬降雨系統(tǒng),是進行土壤產(chǎn)匯流和侵蝕規(guī)律研究的重要試驗設(shè)備。

      1.3人工模擬降雨雨強

      石佛山小流域位于云南省臨滄市云縣幸福鎮(zhèn)幸福村水土保持監(jiān)測項目區(qū)。模擬降雨設(shè)計頻率及雨強參照幸福雨量站。該站距項目區(qū)直線距離2km,1983年建站,有1983—2010年共28年的完整降雨資料,降雨資料質(zhì)量可靠,能滿足設(shè)計暴雨頻率分析要求。通過幸福雨量站1h短歷時暴雨頻率計算,石佛山小流域100年一遇1h降雨量為84.8mm,50年一遇1h降雨量為77.0mm,30年一遇1h降雨量為72.1mm。人

      工模擬降雨采用100年一遇1h降雨過程。

      2人工模擬降雨監(jiān)測結(jié)果

      2.1JDZ02型自記雨量器記錄結(jié)果

      人工模擬降雨試驗于2011年1月開始,至2012年9月結(jié)束,跨2年歷時40天,試驗時間分別為枯水期兩次(第一次、第三次)、主汛期兩次(第二次、第四次)。在不同坡度的徑流小區(qū)分別進行15場次的人工模擬降雨試驗。

      2.2普通雨量器監(jiān)測結(jié)果

      徑流小區(qū)人工模擬降雨面降雨量采用普通雨量器監(jiān)測,用算術(shù)平均法計算平均面降雨量。用普通雨量器觀測的15場次人工模擬降雨面降雨量計算結(jié)果見表3。

      2.3人工模擬降雨產(chǎn)流產(chǎn)沙量監(jiān)測

      人工模擬降雨雨強采用100年一遇1h降雨雨強。在模擬降雨試驗前采用移動墑情監(jiān)測儀和稱重法在各小區(qū)距地表10、20、30cm土層剖面處取土樣分別測定前期土壤含水率,并取平均值。產(chǎn)流產(chǎn)沙量的監(jiān)測是在有徑流產(chǎn)生時,每5min取1個水樣,采用加權(quán)平均法計算平均含沙量,并用容積法記錄產(chǎn)流量。監(jiān)測結(jié)果。

      3試驗結(jié)果分析

      3.1人工模擬降雨試驗降雨監(jiān)測結(jié)果分析

      云南省人工模擬降雨試驗是全國第一次大規(guī)模使用人工模擬降雨系統(tǒng)在野外研究土壤產(chǎn)匯流和侵蝕規(guī)律的試驗。實驗室內(nèi)的環(huán)境與野外環(huán)境差距較大,在野外試驗雖然是按100年一遇的標(biāo)準(zhǔn)進行人工降雨,但是由于受風(fēng)速、風(fēng)向影響較大,加之降雨雨滴與實際還有一定差距,所以部分降雨隨風(fēng)飄落到小區(qū)之外,落到小區(qū)地面的降雨標(biāo)準(zhǔn)也因此降低。考慮到上述情況,試驗都選在無風(fēng)或輕微風(fēng)和微風(fēng)的環(huán)境下進行。將徑流小區(qū)內(nèi)安裝的JDZ02型自記雨量器記錄的降雨雨強與設(shè)計降雨雨強進行相關(guān)性分析,相關(guān)系數(shù)都在0.6以上,說明人工模擬降雨過程與設(shè)計降雨過程之間存在強相關(guān)。根據(jù)統(tǒng)計學(xué)原理,使用Brown-Forsythe檢驗法檢驗設(shè)計降雨過程與12場次JDZ02型自記雨量器記錄降雨過程的差異性,在顯著性水平α=0.05下檢驗結(jié)果為各組之間差異不顯著。對比設(shè)計雨量與JDZ02型自記雨量器記錄結(jié)果,有7場次降雨接近或超過設(shè)計雨強,說明在徑流小區(qū)局部,人工模擬降雨雨強是達到設(shè)計要求的。對徑流小區(qū)12場次面降雨量監(jiān)測結(jié)果進行分析,小區(qū)內(nèi)模擬降雨重現(xiàn)期達到10年一遇以上的有7場,以下的有5場,最高重現(xiàn)期為13年一遇,最低為2年一遇。小區(qū)內(nèi)降雨極不均勻,單個普通雨量器收集的降雨量有的大于設(shè)計雨強,有的小于設(shè)計雨強,特別是小區(qū)兩側(cè)降雨量與設(shè)計雨量誤差最大,達到82.5mm。受風(fēng)速、風(fēng)向、試驗支架架設(shè)高度和植被的影響,用加權(quán)平均法計算出徑流小區(qū)內(nèi)21只普通雨量器的實測面平均雨量均小于設(shè)計雨量,相對誤差在-62.7%~-27.0%之間,未達到設(shè)計要求。

      3.2徑流小區(qū)產(chǎn)流產(chǎn)沙情況分析

      (1)8°徑流小區(qū)。由表4知,第一次模擬降雨試驗,坡地小區(qū)土壤含水率接近飽和、植被覆蓋率為0,降雨4min后開始產(chǎn)流,歷時1h,產(chǎn)流量1.402m3,產(chǎn)沙量15.6kg。第二次試驗在主汛期進行,土壤含水率接近飽和,小區(qū)內(nèi)種植玉米,植被覆蓋率為100%,降雨2min后開始產(chǎn)流,歷時62min,產(chǎn)流2145m3,產(chǎn)沙量10.2kg。第三次試驗,小區(qū)土壤含水率12.16%,植被為雜草和伐倒的玉米植株,植被覆蓋率為70%,降雨9min后開始產(chǎn)流,歷時40min,產(chǎn)流量0.064m3,產(chǎn)沙量0.015kg。該次模擬降雨面平均雨量為44.1mm,僅占設(shè)計雨量的48.5%,加之前期土壤含水率低,因此產(chǎn)流量和產(chǎn)沙量都較小。第四次試驗,小區(qū)內(nèi)種植的玉米已進入成熟期,植株較高,植被覆蓋率為100%。試驗時為減小風(fēng)力對人工模擬降雨的影響,將降雨架高度由6m減至4m。降雨27min后開始產(chǎn)流,歷時12min,產(chǎn)流量0.082m3,產(chǎn)沙量0.082kg。該次降雨面平均雨量為59.9mm,占到設(shè)計雨量的70.6%,但是由于小區(qū)前期土壤含水率低,僅為9.04%,故產(chǎn)流量和產(chǎn)沙量都較小。

      (2)12°徑流小區(qū)。第一次試驗,由于模擬降雨面平均雨量小(31.6mm),雖然前期土壤含水率高達1503%,但該次降雨條件下該小區(qū)未產(chǎn)流。第二次試驗,小區(qū)前期土壤含水率已接近飽和,植被覆蓋率達100%,降雨2min后開始產(chǎn)流,歷時58min,產(chǎn)流量1.513m3,產(chǎn)沙量20.9kg。第三次試驗,小區(qū)前期土壤含水率11.41%、植被覆蓋率70%,降雨11min后開始產(chǎn)流,歷時42min,產(chǎn)流量0.156m3,產(chǎn)沙量0.044kg。該次模擬降雨面平均雨量較大,占到設(shè)計雨量的71.3%,但是由于前期土壤含水率低,故產(chǎn)流量和產(chǎn)沙量都較小。第四次試驗,小區(qū)植被覆蓋率100%,降雨31min后開始產(chǎn)流,產(chǎn)流時間5min,產(chǎn)流量0.010m3,產(chǎn)沙量0.004kg。該次模擬降雨面平均雨量達到50.9mm,占到設(shè)計雨量的60.0%,但是受土壤含水率僅為10.59%的影響,產(chǎn)流量和產(chǎn)沙量都較小。

      (3)15°徑流小區(qū)。由表4可知,第一次試驗,小區(qū)前期土壤含水率為16.05%、植被覆蓋率為0,降雨30min后開始產(chǎn)流,歷時10min,產(chǎn)流量0.0165m3,產(chǎn)沙量0.133kg。第二次試驗,土壤含水率已接近飽和,達20.65%,小區(qū)植被覆蓋率60%,降雨7min后開始產(chǎn)流,產(chǎn)流53min,產(chǎn)流量0.629m3,產(chǎn)沙量10.6kg。第三次試驗在冬季進行,小區(qū)植被覆蓋率為80%,由于前期土壤含水率低(10.41%)、面平均雨量偏小(43.3mm),因此該次降雨在該小區(qū)未產(chǎn)流。第四次試驗,小區(qū)植被覆蓋率100%,人工模擬降雨60min未產(chǎn)流,為檢驗產(chǎn)流情況,在12:15將人工模擬降雨裝置閘門全開,以最大降雨強度連續(xù)降雨5min,于降雨64min后開始產(chǎn)流,產(chǎn)流5min,產(chǎn)流量0.022m3,產(chǎn)沙量0.036kg。該次模擬降雨歷時65min,面平均雨量達到61.1mm,占到設(shè)計雨量的72.1%,受前期土壤含水率(10.74%)較低、植被覆蓋率較高影響,該小區(qū)產(chǎn)流量和產(chǎn)沙量都較小。(4)梯地徑流小區(qū)。由表4可知,梯地徑流小區(qū)第一次試驗在主汛期進行,前期土壤含水率為17.46%,植被覆蓋率為20%,降雨2min后開始產(chǎn)流,產(chǎn)流48min,產(chǎn)流量1.146m3,產(chǎn)沙量1.93kg。第二次試驗在冬季進行,小區(qū)前期土壤含水率8.09%,植被覆蓋率90%,模擬降雨面平均雨量為58.5mm,由于前期土壤含水率過低,該次降雨在該小區(qū)未產(chǎn)流。第三次試驗在9月份進行,前期土壤含水率為8.48%,植被覆蓋率為100%,模擬降雨面平均雨量為54.1mm。該次試驗該小區(qū)未產(chǎn)流,其主要原因也是梯地小區(qū)前期土壤含水率過低。

      4結(jié)語

      篇5

      2數(shù)據(jù)挖掘技術(shù)應(yīng)用于電信用戶數(shù)據(jù)研究

      2.1固網(wǎng)用戶數(shù)據(jù)的組成和結(jié)構(gòu)

      對于企業(yè)來說,大量的用戶數(shù)據(jù)不僅有利于客戶關(guān)系管理(CRM),同時也是獲得用戶知識的源泉。從用戶知識發(fā)現(xiàn)的過程中可以看到,用戶數(shù)據(jù)的質(zhì)量會對知識發(fā)現(xiàn)的結(jié)果產(chǎn)生直接的影響,所以用戶數(shù)據(jù)準(zhǔn)備也是一項很重要的步驟。從商業(yè)系統(tǒng)中提取出高質(zhì)量的用戶數(shù)據(jù)就成為一項最主要的工作。固網(wǎng)企業(yè)的用戶數(shù)據(jù)包括用戶基本信息、用戶賬單信息以及客服信息。數(shù)據(jù)倉庫就是根據(jù)這種方式來組織的。

      2.2知識發(fā)現(xiàn)的方法和過程

      用戶知識發(fā)現(xiàn)概括如下:根據(jù)提出的商業(yè)目標(biāo),分析大量的用戶數(shù)據(jù),找出隱藏的和未知的規(guī)律或者豐富已知的規(guī)律,進而提出模型;最后要將數(shù)據(jù)挖掘和分析的結(jié)果轉(zhuǎn)化成有商業(yè)意義的方法,然后采取進一步的行動。用戶知識發(fā)現(xiàn)必須遵循以下幾個步驟:商業(yè)理解,數(shù)據(jù)理解,數(shù)據(jù)準(zhǔn)備,分類模型,評估應(yīng)用。

      2.3數(shù)據(jù)挖掘建立用戶分類模型

      近年來,“以客戶為中心”的電信市場開始強調(diào)為不同用戶提供個性化服務(wù),其前提條件就是用戶分類。這也說明了過去的消費行為也預(yù)示了未來的消費傾向。

      (1)商業(yè)理解

      對用戶的理解不僅是理解電信市場的開始,也是理解客戶關(guān)系管理的開始。在電信企業(yè)中對用戶的理解包括:用戶種類,不同類中用戶的本質(zhì)屬性區(qū)別,用戶偏好,不同類別之間的用戶如何通信等。

      (2)用戶數(shù)據(jù)準(zhǔn)備

      對用戶分類的研究主要是從用戶屬性中得到用戶特征和行為習(xí)慣。主要數(shù)據(jù)來源于用戶賬單信息,同時也需要從商業(yè)系統(tǒng)中得到一些用戶的基本屬性信息。

      (3)用戶分類模型

      本文使用聚類分析對用戶進行細(xì)分以建立分類模型。聚類分析是把大量數(shù)據(jù)點的集合根據(jù)最大化類內(nèi)相似性、最小化類間相似性的原則進行聚類或分組,使得每個類中的數(shù)據(jù)之間最大限度地相似、而不同類中的數(shù)據(jù)之間最大限度地不同。

      3固網(wǎng)漏話用戶數(shù)據(jù)分析

      3.1關(guān)于固網(wǎng)漏話用戶數(shù)據(jù)分析的商業(yè)理解

      通過各種渠道調(diào)查,對固網(wǎng)漏話用戶數(shù)據(jù)分析的目標(biāo)可以概括為以下幾點:

      (1)對用戶通話次數(shù)、時間段等分析,找出特征,以此來尋找目標(biāo)用戶;

      (2)對用戶開通漏話保護業(yè)務(wù)前后的ARPU值分析比較,分析收益的對比;

      (3)對目標(biāo)用戶數(shù)據(jù)分析,從用戶分類的角度來管理,設(shè)計針對性的服務(wù),提升用戶滿意度。

      3.2系統(tǒng)用戶數(shù)據(jù)準(zhǔn)備

      數(shù)據(jù)準(zhǔn)備的過程:明確目標(biāo);制定計劃;分析變量的獲取;數(shù)據(jù)收集和獲取;數(shù)據(jù)集成。根據(jù)當(dāng)前客戶關(guān)系管理基本狀況和數(shù)據(jù)挖掘的目的,涉及到的人口屬性變量有:性別、年齡、住址、用戶職業(yè)、婚否、學(xué)歷、薪資等。用戶分類結(jié)束之后,再使用描述變量來進行分析說明。本文選用某市電信公司運營支持系統(tǒng)和經(jīng)營分析系統(tǒng)的數(shù)據(jù),從中選取了基本客戶基本信息表、客戶詳細(xì)話表、賬單及繳費信息表、產(chǎn)品信息表、業(yè)務(wù)使用清單等原始數(shù)據(jù)。數(shù)據(jù)挖掘工具選擇SPSSClementine。在使用該工具進行挖掘之前,需要對數(shù)據(jù)進行清洗:

      (1)刪掉不滿足要求的數(shù)據(jù):選擇普通的用戶;選擇狀態(tài)正常的用戶;選擇入網(wǎng)時間較長的用戶,使數(shù)據(jù)有完整的用戶周期;

      (2)去掉異常數(shù)據(jù):比如用于測試的號碼;

      (3)去掉極端值:不具備普遍性的極值容易產(chǎn)生噪聲。

      3.3固網(wǎng)漏話用戶數(shù)據(jù)分析結(jié)果

      考慮到不同分類建立的有效性和簡便性,以及固話用戶和數(shù)據(jù)源的特點,本文采用常見的K-means算法,其高可靠性、高精準(zhǔn)性以及低復(fù)雜度使其成為主流的聚類算法。本文選用SPSSClementine作為數(shù)據(jù)挖掘工具進行K-means聚類分析。獲取原始數(shù)據(jù)并進行預(yù)處理之后,選擇參與聚類的細(xì)分變量,輸入簇的個數(shù)k,選擇k=7,然后點擊“聚類”按鈕,使用K-means算法對固網(wǎng)漏話用戶數(shù)據(jù)進行聚類。經(jīng)過正常值選擇、極值處理等一系列的數(shù)據(jù)清洗工作,最后用于研究的記錄有251284條。

      3.4分析結(jié)果和解釋

      93%的遇忙話務(wù)都出現(xiàn)在8∶00~18∶00的工作時段,這說明該時段遇忙話務(wù)較多,話務(wù)量流失嚴(yán)重,特別需要遇忙話務(wù)的解決方法。而這一時間段遇忙話務(wù)量最多的就是政企用戶,這些話務(wù)量流失對政企用戶將造成巨大的損失:30000政企用戶一個月遇忙話務(wù)損失達到260萬次,本網(wǎng)超過120萬次,每個月預(yù)計損失20萬;以電信中等發(fā)達省份為例:符合條件的政企高端用戶約為60萬;每年度損失的潛在業(yè)務(wù)收入為50000萬。經(jīng)過分析,得到該市各地區(qū)已開通和未開通漏話保護業(yè)務(wù)的用戶分布,如圖4所示。C區(qū)屬于政務(wù)新區(qū),未開通漏話業(yè)務(wù)的用戶較多,而F區(qū)屬于工業(yè)園區(qū),企業(yè)較多,很多用戶已開通漏話保護業(yè)務(wù),但是還有大量用戶未開通該業(yè)務(wù),所以C區(qū)和F區(qū)應(yīng)該作為該業(yè)務(wù)的重點推廣地區(qū)。綜上分析,固網(wǎng)漏話業(yè)務(wù)是一個非常有潛力的業(yè)務(wù),解決漏話問題是提高用戶滿意度和忠誠度的重要途徑。根據(jù)上文的分析,在8∶00~18∶00時間段,用戶遇忙話務(wù)量非常多,在這段時間內(nèi),企業(yè)需要更多的漏話接入服務(wù)器,而在其他時間段可以減少接入服務(wù)器以節(jié)約成本。而在不同的地區(qū),用戶數(shù)量和精準(zhǔn)用戶的數(shù)量也不同,應(yīng)該選擇精準(zhǔn)用戶較為集中的地區(qū)優(yōu)先推廣漏話保護業(yè)務(wù)。由于精準(zhǔn)高端用戶帶來的收益遠(yuǎn)遠(yuǎn)超過普通用戶,所以要對經(jīng)過篩選的精準(zhǔn)用戶采取針對性措施,比如在C區(qū)和F區(qū)大力宣傳,以各種形式讓精準(zhǔn)客戶看到該業(yè)務(wù)帶來的收益,還可以電話推廣為精準(zhǔn)用戶提供信息。

      篇6

      2煤礦安全生產(chǎn)大數(shù)據(jù)分析系統(tǒng)

      2.1大數(shù)據(jù)分析的概念大數(shù)據(jù)分析

      是指數(shù)據(jù)量急劇積累迅速超出主流軟件工具和人類思維處理的極限,大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)比較起來,有四大特征:數(shù)據(jù)體量巨大(Volume)、數(shù)據(jù)類型繁多(Variety)、數(shù)據(jù)價值密度低(Value)、更新速度快時效高(Velocity)。大數(shù)據(jù)分析需要全新的數(shù)據(jù)處理理念和分析工具,洞察發(fā)現(xiàn)海量高速增長信息中潛藏的價值[4]。從理念上,大數(shù)據(jù)分析與傳統(tǒng)數(shù)據(jù)分析有三大轉(zhuǎn)變:要全體不要抽樣,要效率不要絕對精確,要相關(guān)不要因果。針對大數(shù)據(jù),既有的技術(shù)架構(gòu)和分析工具已經(jīng)無法滿足要求,需要全新的數(shù)據(jù)分析方法和技術(shù),這其中包括:(1)大數(shù)據(jù)分析可視化方法;(2)大數(shù)據(jù)挖掘算法;(3)預(yù)測性分析能力;(4)語義處理能力;(5)數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理技術(shù)。

      2.2大數(shù)據(jù)分析系統(tǒng)的建設(shè)

      根據(jù)大數(shù)據(jù)處理和分析的理念,煤礦安全大數(shù)據(jù)分析系統(tǒng)的建設(shè)目標(biāo)包括:數(shù)據(jù)綜合集成、安全知識集成、三維虛擬可視化展示、煤礦安全動態(tài)分析診斷。具體建設(shè)內(nèi)容包括:(1)基于物聯(lián)網(wǎng)/云計算技術(shù)的煤礦安全綜合數(shù)據(jù)庫。建設(shè)煤礦安全大數(shù)據(jù)分析診斷系統(tǒng),首先要利用物聯(lián)網(wǎng)和云計算技術(shù)實現(xiàn)全面綜合的數(shù)據(jù)集成,將基礎(chǔ)空間和屬性數(shù)據(jù)、在線監(jiān)測的實時性數(shù)據(jù)、專業(yè)業(yè)務(wù)系統(tǒng)的事務(wù)性數(shù)據(jù)綜合集成起來,構(gòu)建煤礦安全綜合數(shù)據(jù)庫。(2)基于專家系統(tǒng)的煤礦安全專家知識庫。針對知識集成的目標(biāo),整理規(guī)范規(guī)程體系中的經(jīng)驗或者理論知識(煤礦安全規(guī)程、煤礦作業(yè)規(guī)程、三違行為知識、隱患界定知識、評估模型、設(shè)備操作規(guī)程知識、工種操作規(guī)程知識),構(gòu)建煤礦安全動態(tài)分析診斷的專家知識庫。(3)建設(shè)三維虛擬礦井可視化平臺。針對信息和知識三維虛擬礦井可視化展示分析,主要的建設(shè)內(nèi)容是基于高精度地質(zhì)模型理論研究開發(fā)三維虛擬礦井平臺,實現(xiàn)地層建模、鉆孔建模、斷層建模、工作面建模和巷道建模等工作。然后,基于三維虛擬礦井平臺,實現(xiàn)數(shù)據(jù)和知識可視化、煤礦安全生產(chǎn)活動可視化、分析和決策過程可視化。(4)研發(fā)煤礦安全動態(tài)分析系統(tǒng)。針對基于專家知識庫的煤礦安全生產(chǎn)分析決策,需要利用煤礦安全綜合數(shù)據(jù)庫中的基礎(chǔ)數(shù)據(jù)、實時監(jiān)測數(shù)據(jù)以及事務(wù)性數(shù)據(jù),根據(jù)煤礦安全專家知識庫進行煤礦安全生產(chǎn)狀況評估、推理和演繹,動態(tài)分析診斷煤礦安全生產(chǎn)的現(xiàn)狀與趨勢、預(yù)測未來,并針對煤礦應(yīng)急現(xiàn)象做出科學(xué)合理的響應(yīng)對策。

      篇7

      1.引言

      目前發(fā)展大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)上升為國家戰(zhàn)略,大數(shù)據(jù)的價值也得到了社會的廣泛認(rèn)可。眾多研究[1-5]表明,大數(shù)據(jù)不僅為政府治理開辟了新思路,還是企業(yè)創(chuàng)新的重要源泉和高??蒲械闹匾?。大數(shù)據(jù)交易平臺是整個大數(shù)據(jù)產(chǎn)業(yè)的基礎(chǔ)與核心,它使得數(shù)據(jù)資源可以在不同組織之間流動,從而讓單個組織能夠獲得更多、更全面的數(shù)據(jù)。這樣不僅提高了數(shù)據(jù)資源的利用效率,更重要的是,當(dāng)一個組織擁有的數(shù)據(jù)資源不斷豐富和立體化,有助于其通過數(shù)據(jù)分析發(fā)現(xiàn)更多的潛在規(guī)律,從而對內(nèi)提高自身的效率,對外促進整個社會的不斷進步。

      在現(xiàn)有的大數(shù)據(jù)交易平臺上,數(shù)據(jù)供應(yīng)方和需求方各自供需信息,交易雙方瀏覽這些信息,如果發(fā)現(xiàn)合適的交易對象,則進行大數(shù)據(jù)資源的買賣,交易平臺只作為信息中介存在。這類大數(shù)據(jù)交易的本質(zhì),其實是單獨的大數(shù)據(jù)資源交易,現(xiàn)有平臺可以統(tǒng)稱為第一代大數(shù)據(jù)交易平臺。第一代大數(shù)據(jù)交易平臺在供需平衡、數(shù)據(jù)定價和時效性三個方面都存在較大的不足。本文針對這些不足進行改進,設(shè)計了一種全新的第二代大數(shù)據(jù)交易平臺,命名為:融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺,該平臺將數(shù)據(jù)資源交易與數(shù)據(jù)分析服務(wù)進行深度融合,實現(xiàn)了數(shù)據(jù)與服務(wù)的一體化交易。本研究不僅為當(dāng)下正在建設(shè)的各類大數(shù)據(jù)交易平臺提供有益的借鑒,也豐富了大數(shù)據(jù)交易的基礎(chǔ)理論體系。

      2.相關(guān)研究

      目前大數(shù)據(jù)交易的相關(guān)研究中,比較有代表性的有:

      (1)大數(shù)據(jù)的財產(chǎn)屬性和所有權(quán)。王玉林等[6]對大數(shù)據(jù)的財產(chǎn)屬性展開研究,認(rèn)為大數(shù)據(jù)的法律屬性會直接影響大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,而大數(shù)據(jù)交易實踐本身就反映出大數(shù)據(jù)具有財產(chǎn)屬性。但大數(shù)據(jù)與傳統(tǒng)的財產(chǎn)權(quán)客體存在較大不同,它符合信息財產(chǎn)的特征,是信息財產(chǎn)權(quán)的客體,應(yīng)受到相關(guān)法律的保護。齊愛民等[7]從宏觀的角度分析了國家對于其主權(quán)范圍內(nèi)數(shù)據(jù)的所有權(quán),剖析了個人擁有的數(shù)據(jù)權(quán)以及數(shù)據(jù)的財產(chǎn)權(quán)。

      (2)大數(shù)據(jù)的定價問題。劉朝陽[8]對大數(shù)據(jù)的定價問題展開研究,首先分析了大數(shù)據(jù)的基本特征、價值特征等定價基礎(chǔ)。接著討論了效用價格論、成本價格論等定價模式。最后分析了大數(shù)據(jù)的定價策略,并對大數(shù)據(jù)定價的雙向不確定問題進行了詳細(xì)論述。劉洪玉等[9]認(rèn)為在大數(shù)據(jù)交易過程中,由于缺乏足夠的歷史參考,其數(shù)據(jù)資源的交易價格很難確定,因此提出一種基于競標(biāo)機制的魯賓斯坦模型,用于大數(shù)據(jù)交易雙方進行討價還價,以求達成一個交易的均衡價格。翟麗麗等[10]從資產(chǎn)的期權(quán)價值角度來評估大數(shù)據(jù)資源的價值,并指出數(shù)據(jù)在不斷變化和更新,加上數(shù)據(jù)的非獨占性等情況的出現(xiàn),數(shù)據(jù)資產(chǎn)的價值可能會下降,最后綜合這些因素構(gòu)建了一個評估模型來計算數(shù)據(jù)資產(chǎn)的價值。

      (3)大數(shù)據(jù)交易的安全與隱私保護。史宇航[11]認(rèn)為非法的數(shù)據(jù)交易會對個人數(shù)據(jù)等高價值信息的安全造成影響,對非法數(shù)據(jù)交易的購買方和協(xié)助方都應(yīng)進行處罰。提出應(yīng)先明確數(shù)據(jù)的法律屬性,再以數(shù)據(jù)交易所為平臺進行交易,并對數(shù)據(jù)交易所的法律地位進行了分析。殷建立等[12]為應(yīng)對大數(shù)據(jù)時代數(shù)據(jù)采集、交易等過程中的安全問題,綜合考慮技術(shù)、政策和管理平臺等方面的因素,構(gòu)建了一種個人數(shù)據(jù)溯源管理體系,該體系可在數(shù)據(jù)應(yīng)用時實現(xiàn)個人數(shù)據(jù)的追蹤溯源,從而保護其個人隱私。王忠[13]認(rèn)為大數(shù)據(jù)環(huán)境下強大的數(shù)據(jù)需求會導(dǎo)致個人數(shù)據(jù)的非法交易,為應(yīng)對這種情況,應(yīng)該建立個人數(shù)據(jù)交易許可機制,通過發(fā)放交易許可證、拍賣授予等措施實現(xiàn)隱私保護。

      (4)大數(shù)據(jù)交易的發(fā)展現(xiàn)狀與問題。楊琪等[14]認(rèn)為我國的大數(shù)據(jù)交易還處于行業(yè)發(fā)展的早期,大量數(shù)據(jù)源未被激活,原因是大數(shù)據(jù)產(chǎn)業(yè)價值鏈的各個專業(yè)環(huán)節(jié)發(fā)展滯后,并且對數(shù)據(jù)交易中的安全問題和隱私泄露等有較大的擔(dān)憂。應(yīng)該對數(shù)據(jù)產(chǎn)品進行改造,使其更商品化,并且通過政府開放公共數(shù)據(jù)等措施逐漸消除數(shù)據(jù)流通中的安全顧慮。唐斯斯等[15]首先分析了我國大數(shù)據(jù)交易的發(fā)展特點、交易類型等現(xiàn)狀,接著指出目前大數(shù)據(jù)交易存在法律法規(guī)相對滯后、行業(yè)標(biāo)準(zhǔn)不完善、交易平臺定位不明確、數(shù)據(jù)質(zhì)量不高等問題,最后提出應(yīng)加快相關(guān)法律和標(biāo)準(zhǔn)建設(shè),并推動數(shù)據(jù)開放,加強交易方式的創(chuàng)新。

      除了上述四個主要研究方向以外,李國杰等[16]從理論的角度分析了大數(shù)據(jù)研究在行業(yè)應(yīng)用和科學(xué)研究方面的重要作用,這從客觀上反映了大數(shù)據(jù)流通的必要性。涂永前等[17]認(rèn)為大數(shù)據(jù)時代企業(yè)管理和運用數(shù)據(jù)資源的相關(guān)成本會成為企業(yè)的主要交易成本,這會改變企業(yè)的組織結(jié)構(gòu),并導(dǎo)致企業(yè)邊界的變化,企業(yè)會進行多方向的擴張,這為促進大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的相關(guān)法律的制定提供了理論支持。總的來看,由于大數(shù)據(jù)交易本身屬于較新的領(lǐng)域,因此相關(guān)研究總體上較少,已有研究也大多集中在上述幾個研究方向上。實際上,大數(shù)據(jù)交易平臺是實現(xiàn)大數(shù)據(jù)交易的重要載體,是大數(shù)據(jù)資源流通轉(zhuǎn)換的主要節(jié)點,交易平臺本身需要隨著整個大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,不斷的改進和升級,而現(xiàn)有研究中恰恰缺少對大數(shù)據(jù)交易平臺本身進行創(chuàng)新的研究。由此,本文針對現(xiàn)有大數(shù)據(jù)交易平臺的不足,結(jié)合實際設(shè)計了一種全新的融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺,為實踐和科研提供借鑒和參考。

      3.現(xiàn)有大數(shù)據(jù)交易平臺的不足

      大數(shù)據(jù)本身作為一種新興事物,當(dāng)把它作為一種商品進行交易時,其交易平臺的設(shè)計很自然會參照傳統(tǒng)的商品交易模式,即:交易雙方先供求信息,再經(jīng)過討價還價,達到一個均衡的價格則成交,賣方將大數(shù)據(jù)資源經(jīng)過脫敏處理后,交付給買方。目前無論是政府主導(dǎo)的大數(shù)據(jù)交易所,還是企業(yè)或者高校創(chuàng)建的大數(shù)據(jù)交易平臺,都是采用類似的交易模式,這也是第一代大數(shù)據(jù)交易平臺的突出特點。實際上大數(shù)據(jù)與傳統(tǒng)商品有很大的區(qū)別,照搬傳統(tǒng)商品的交易模式會出現(xiàn)很多問題。本文將從供需平衡、數(shù)據(jù)定價和時效性三個方面分析現(xiàn)有大數(shù)據(jù)交易平臺的不足。

      3.1 數(shù)據(jù)供需的錯配

      現(xiàn)有大數(shù)據(jù)交易平臺的第一點不足就是數(shù)據(jù)供需的錯配,即:供應(yīng)方提供的數(shù)據(jù)資源往往不是需求方所需要的,而需求方需要的數(shù)據(jù)在交易平臺上找不到,即使有相近的數(shù)據(jù)資源,也存在很大的數(shù)據(jù)缺失或冗余,買回去也無法使用。對數(shù)據(jù)供應(yīng)方來說,由于無法準(zhǔn)確預(yù)知數(shù)據(jù)買方多樣性的需求,它只能從自身角度出發(fā),將可以公開的、并且自認(rèn)為有價值的數(shù)據(jù)資源放到平臺上待售。對需求各異的買方來說,供應(yīng)方提供的標(biāo)準(zhǔn)數(shù)據(jù)很難與自己的應(yīng)用方向精準(zhǔn)匹配,這也是目前大數(shù)據(jù)交易還不夠活躍的原因。當(dāng)然,當(dāng)供需雙方建立初步聯(lián)系以后,供應(yīng)方甚至可以為需求方個性化定制大數(shù)據(jù)資源,但即使這樣,供需錯配的問題仍然無法解決,原因就在于單個的數(shù)據(jù)供應(yīng)方無法提供多維的數(shù)據(jù)資源,只有多維的數(shù)據(jù)資源才具有較高的分析價值。

      3.2 大數(shù)據(jù)資源定價困難

      大數(shù)據(jù)資源定價困難是現(xiàn)有大數(shù)據(jù)交易平臺的第二點不足。大數(shù)據(jù)資源和普通商品不同,普通商品可以直接消費或者作為再加工的原材料,其價值都可以通過最終的消費品價格得到體現(xiàn)。而大數(shù)據(jù)本身的價值無法直接衡量,需求方購買它的目的是作為數(shù)據(jù)分析的信息源,但是否能發(fā)現(xiàn)潛在的規(guī)律還未可知。因此無法在購買前,準(zhǔn)確判斷出待售數(shù)據(jù)資源的價值大小。此外,需求方在不確定某大數(shù)據(jù)資源是否能真正能給組織帶來收益情況下,很難給出一個較高的價格,這在客觀上會影響數(shù)據(jù)供應(yīng)方的交易積極性,加大了供需雙方達成交易的難度。

      3.3 數(shù)據(jù)的時效性不強

      現(xiàn)有大數(shù)據(jù)交易平臺的第三點不足,就是數(shù)據(jù)資源的時效性不強。目前很多大數(shù)據(jù)交易平臺上待售的數(shù)據(jù)資源都以歷史數(shù)據(jù)為主,這是因為數(shù)據(jù)資源在交易前需要經(jīng)歷脫敏處理,將涉及政府信息安全、企業(yè)商業(yè)機密和個人隱私等敏感信息進行變換和替代。此外,供應(yīng)方還需要對原始數(shù)據(jù)進行初步的清洗,整理成一定的數(shù)據(jù)格式集中存貯和交付,方便需求方進行數(shù)據(jù)分析。由于一般的數(shù)據(jù)供應(yīng)方并不具備對大數(shù)據(jù)進行實時脫敏和清洗的能力,只能將采集到的數(shù)據(jù)資源,經(jīng)過一段時間的離線處理后,再放到交易平臺上,所以只能供應(yīng)歷史數(shù)據(jù)。隨著社會節(jié)奏的不斷加快,歷史數(shù)據(jù)很可能并不能反映當(dāng)下的真實情況,越來越多的數(shù)據(jù)分析都需要用到實時數(shù)據(jù)作為信息源,這是未來大數(shù)據(jù)交易必須克服的一個短板。

      4.融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺設(shè)計

      本文提出將數(shù)據(jù)分析服務(wù)融合到目前的大數(shù)據(jù)交易中,以此來克服現(xiàn)有交易平臺的不足,本節(jié)將首先對數(shù)據(jù)分析服務(wù)進行概念界定,再依次介紹平臺設(shè)計的總體思路和核心模塊的設(shè)計,具體如下。

      4.1 數(shù)據(jù)分析服務(wù)的概念界定

      數(shù)據(jù)分析是指運用各類數(shù)據(jù)處理模型和信息技術(shù)手段,對數(shù)據(jù)資源進行深度的挖掘,從而發(fā)現(xiàn)其中蘊含的規(guī)律,作為管理決策的依據(jù)。數(shù)據(jù)分析本身是一種能力,如果一個組織將其數(shù)據(jù)分析能力提供給其他組織或個人,并收取一定的費用,這就是數(shù)據(jù)分析服務(wù)。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)資源不僅體量巨大而且種類多,對數(shù)據(jù)分析能力的要求不斷提高。在這種情況下,只有少數(shù)組織具備獨立處理大數(shù)據(jù)的能力,其他的組織比如大量的中小企業(yè),都需要從組織外部尋求專業(yè)的數(shù)據(jù)分析服務(wù),來滿足自身的需要。因此,數(shù)據(jù)分析服務(wù)和大數(shù)據(jù)資源一樣存在巨大的市場需求。

      4.2 平臺設(shè)計的總體思路

      本文將提出的融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺,定位為第二代大數(shù)據(jù)交易平臺,它將大數(shù)據(jù)資源交易與數(shù)據(jù)分析服務(wù)兩者進行深度融合,在交易平臺上實現(xiàn)數(shù)據(jù)與服務(wù)的一體化交易。大數(shù)據(jù)交易平臺的角色也從原來的數(shù)據(jù)資源買賣的信息中介,轉(zhuǎn)變?yōu)榇髷?shù)據(jù)綜合服務(wù)商。在融合后的大數(shù)據(jù)交易平臺上,數(shù)據(jù)需求方不再提交數(shù)據(jù)資源的需求信息,而是直接提出自己的應(yīng)用方向和想要得到的結(jié)果,交易平臺再根據(jù)需求方的應(yīng)用方向,反向匹配數(shù)據(jù)資源和數(shù)據(jù)分析服務(wù)。這個匹配的過程不是單一的數(shù)據(jù)集或服務(wù)的查找,而是對全平臺的數(shù)據(jù)資源進行有效整合,形成高價值的多維數(shù)據(jù),再結(jié)合復(fù)合型的數(shù)據(jù)分析技術(shù),得到最終的分析結(jié)果,最后將分析結(jié)果與基礎(chǔ)數(shù)據(jù)一同交付給需求方。交付基礎(chǔ)數(shù)據(jù)的目的,一是方便需求方進行分析結(jié)果的對照,為決策提供更精準(zhǔn)的參考。二是需求方可以根據(jù)基礎(chǔ)數(shù)據(jù)進行衍生挖掘,進一步提高數(shù)據(jù)的利用效率。平臺設(shè)計的總體思路繪制成圖1。

      圖1 平臺設(shè)計的總體思路

      4.3 核心模塊的設(shè)計

      融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺共劃分為四大模塊,具體如圖2所示。

      圖2 融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺的主要模塊

      系統(tǒng)管理模塊具體又分為用戶管理、系統(tǒng)維護和安全管理。安全管理是系統(tǒng)管理模塊的重點,主要包含三個方面的功能:第一,負(fù)責(zé)整個交易平臺的系統(tǒng)安全,通過對交易平臺進行實時監(jiān)控,阻止外部的非法入侵行為,保障平臺的正常運行。第二,對數(shù)據(jù)供應(yīng)方提交的數(shù)據(jù)資源進行審核,如果發(fā)現(xiàn)是非法數(shù)據(jù),則阻止其交易,并及時將有關(guān)情況反饋給相關(guān)的政府監(jiān)管部門,由它們進行調(diào)查處理。第三,檢查所有數(shù)據(jù)是否經(jīng)過脫敏處理。如果發(fā)現(xiàn)部分?jǐn)?shù)據(jù)存在未脫敏或者脫敏不合格的情況,交易平臺將負(fù)責(zé)對該數(shù)據(jù)資源進行脫敏處理,從而保護數(shù)據(jù)中的隱私不被泄露。

      大數(shù)據(jù)資源池模塊、數(shù)據(jù)分析服務(wù)模塊和協(xié)同模塊是交易平臺的三大核心模塊,是數(shù)據(jù)與服務(wù)兩者融合并實現(xiàn)一體化交易的關(guān)鍵,本文接下來將對這三個核心模塊的功能進行詳細(xì)設(shè)計。

      4.3.1 大數(shù)據(jù)資源池模塊

      大數(shù)據(jù)資源池模塊主要包含三個方面的功能:數(shù)據(jù)資源格式的整理、數(shù)據(jù)的多維度整合、大數(shù)據(jù)資源的云存貯。具體如下。

      (1)數(shù)據(jù)資源格式的整理。由于大數(shù)據(jù)交易平臺上的數(shù)據(jù)資源來自不同的數(shù)據(jù)供應(yīng)方,因此其數(shù)據(jù)資源的格式會有較大的差異。如果不經(jīng)過格式整理就直接進行數(shù)據(jù)分析,很可能會因部分?jǐn)?shù)據(jù)無法準(zhǔn)確讀取,而影響數(shù)據(jù)處理的效率,嚴(yán)重者還會導(dǎo)致數(shù)據(jù)分析中斷。數(shù)據(jù)資源格式整理的主要任務(wù)是將同一類型數(shù)據(jù)的格式進行統(tǒng)一,對部分缺失的數(shù)據(jù)屬性進行補充,對錯誤的數(shù)據(jù)格式進行修正。

      (2)數(shù)據(jù)的多維度整合。在上文3.1中提到供需錯配的一個重要原因,就是單個數(shù)據(jù)供應(yīng)方無法提供高價值的多維數(shù)據(jù)。所謂多維數(shù)據(jù)是包含用戶或者行業(yè)多個背景和情境的大數(shù)據(jù)資源,這些多維數(shù)據(jù)使用戶或行業(yè)多個側(cè)面的信息產(chǎn)生了關(guān)聯(lián),有利于發(fā)現(xiàn)深層次的潛在規(guī)律。融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺應(yīng)該作為數(shù)據(jù)整合的主體,將單個數(shù)據(jù)供應(yīng)方提供的零散的數(shù)據(jù)資源,進行多維度的整合,當(dāng)缺少某一個維度的數(shù)據(jù)時,再向相應(yīng)的數(shù)據(jù)供應(yīng)方進行定向的采集,最后得到相對完整的多維數(shù)據(jù),具有很高的分析價值。

      (3)大數(shù)據(jù)資源的云存貯。大數(shù)據(jù)資源經(jīng)過格式整理和多維度整合以后,已經(jīng)可以作為數(shù)據(jù)分析服務(wù)的信息源。下一步就是將這些數(shù)據(jù)資源進行統(tǒng)一的云存貯,以便數(shù)據(jù)分析服務(wù)調(diào)用。以往部分大數(shù)據(jù)資源由于體量巨大或?qū)崟r更新的需要,無法上傳到交易平臺上,或者只提供部分調(diào)用接口。融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺通過建立云存貯中心,將整合后的多維數(shù)據(jù)進行統(tǒng)一存放和調(diào)用,有助于提高數(shù)據(jù)資源的存取效率。

      4.3.2 數(shù)據(jù)分析服務(wù)模塊

      數(shù)據(jù)分析服務(wù)模塊首先根據(jù)數(shù)據(jù)需求方的應(yīng)用方向,匹配出合適的多維數(shù)據(jù)資源,再選擇相應(yīng)的數(shù)據(jù)分析模型分配所需的計算能力,最后將得到的分析結(jié)果反饋給需求方。本文將數(shù)據(jù)分析服務(wù)劃分為三個大類:基礎(chǔ)性分析服務(wù)、高級分析服務(wù)、深度定制的分析服務(wù)。具體如下。

      (1)基礎(chǔ)性分析服務(wù)。基礎(chǔ)性分析服務(wù)是指那些常規(guī)的數(shù)據(jù)統(tǒng)計,比如:總體中不同對象的占比分析,基于不同屬性的關(guān)聯(lián)分析或相關(guān)性分析等。這些分析服務(wù)耗時較短,分析技術(shù)較為簡單,只要數(shù)據(jù)資源本身完備,就可以迅速得到結(jié)果?;A(chǔ)性分析服務(wù)由大數(shù)據(jù)交易平臺本身來提供,可以面對不同的需求方,實現(xiàn)快速交付。

      (2)高級分析服務(wù)。高級分析服務(wù)是指那些較為復(fù)雜的數(shù)據(jù)分析服務(wù),比如:精準(zhǔn)的趨勢預(yù)測、全面的用戶興趣畫像、非結(jié)構(gòu)化的信息挖掘等。這些分析服務(wù)需要大量專業(yè)的數(shù)據(jù)處理技術(shù),比如:興趣建模、視頻分析,音頻分析、深度語義分析等,必須由大數(shù)據(jù)交易平臺對接第三方的數(shù)據(jù)分析服務(wù)商,由它們來提供高級分析服務(wù)。大數(shù)據(jù)交易平臺在同一數(shù)據(jù)分析領(lǐng)域,應(yīng)引入多家數(shù)據(jù)分析服務(wù)商,通過動態(tài)的競爭,來保證服務(wù)的質(zhì)量。

      (3)深度定制的分析服務(wù)。大數(shù)據(jù)分析目前還處在快速發(fā)展階段,很多前瞻性的技術(shù)還在試驗當(dāng)中,應(yīng)該說數(shù)據(jù)分析技術(shù)的發(fā)展相對于旺盛的現(xiàn)實需求來說是滯后的。當(dāng)需要用的某一數(shù)據(jù)分析技術(shù),在目前的市場上還找不到現(xiàn)成的提供方時,就需要大數(shù)據(jù)交易平臺為其進行深度的定制,交易平臺通過多方位的研發(fā)能力評估,尋找合適的技術(shù)主體來進行專門的技術(shù)攻關(guān)。

      4.3.3 協(xié)同模塊

      協(xié)同模塊主要包含兩個方面的功能:數(shù)據(jù)分析服務(wù)之間的技術(shù)協(xié)同、交易各方的管理協(xié)同。具體如下。

      (1)數(shù)據(jù)分析服務(wù)之間的技術(shù)協(xié)同。在面臨較為復(fù)雜的數(shù)據(jù)分析任務(wù)時,可能需要用到多個領(lǐng)域的數(shù)據(jù)分析技術(shù),這時單個的數(shù)據(jù)分析服務(wù)商可能無法獨立完成。因為不同的行業(yè)領(lǐng)域,都有其行業(yè)技術(shù)的獨特性,需要長時間的專業(yè)積累。在這種情況下,就需要多個數(shù)據(jù)分析服務(wù)商相互合作才能完成。數(shù)據(jù)分析服務(wù)之間的技術(shù)協(xié)同,就是通過一定的技術(shù)標(biāo)準(zhǔn)和操作規(guī)范,讓多個數(shù)據(jù)分析技術(shù)提供方,能夠在完成同一任務(wù)時,在技術(shù)上不沖突,能夠相互并行的完成對數(shù)據(jù)資源的處理,按時按質(zhì)的交付最終的分析結(jié)果。

      (2)交易各方的管理協(xié)同。在融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺上,交易的參與者一共有四類,分別是數(shù)據(jù)資源的供應(yīng)方、數(shù)據(jù)分析服務(wù)商、需求方和交易平臺自身。數(shù)據(jù)需求方在提交自己的應(yīng)用方向和預(yù)期結(jié)果的同時,提交自己的交易預(yù)算。交易平臺根據(jù)需求方提交的應(yīng)用方向和預(yù)期結(jié)果,對數(shù)據(jù)資源和數(shù)據(jù)分析服務(wù)進行反向的選擇。如果數(shù)據(jù)分析任務(wù)中只用到了基礎(chǔ)性分析服務(wù),則整個交易為平臺方、需求方、數(shù)據(jù)資源供應(yīng)方的三方交易。如果某數(shù)據(jù)分析任務(wù),平臺自身無法完成,需要用到第三方的數(shù)據(jù)分析服務(wù)商,則整個交易包含了全部四類參與者,是一個四方交易。交易的基本原則是實現(xiàn)參與各方的利益共享。交易各方的具體利益分配如圖3所示。

      圖3 交易各方的利益分配

      需求方希望在獲得預(yù)期結(jié)果的同時,其支付的成本在可接受的范圍內(nèi)。交易平臺在對數(shù)據(jù)和服務(wù)進行反向匹配后,會出現(xiàn)兩種不同的情況:第一種情況是在原交易預(yù)算下,可以達到需求方預(yù)期的結(jié)果,則可成交。第二種情況是,原交易預(yù)算較低,在該預(yù)算下無法達到需求方要求的結(jié)果,這時交易平臺會和需求方溝通,提出新的報價,需求方經(jīng)過考慮后,與平臺進行討價還價,它們在價格上達成一致時才能完成交易。由于交易數(shù)據(jù)是整合后的多維數(shù)據(jù),因此原始數(shù)據(jù)資源供應(yīng)方的收益,由平臺從總交易價中支付,具體的支付方式可分為平臺一次性買斷或按次數(shù)支付。同一數(shù)據(jù)資源對于不同的需求者來說,其價值是不一樣的,融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺根據(jù)最終的一體化交易成交價,反向?qū)?shù)據(jù)資源進行定價,相對于現(xiàn)有的大數(shù)據(jù)交易平臺來說,是一種進步。交易平臺的深度參與,會使數(shù)據(jù)交易的頻率加快,原始數(shù)據(jù)資源供應(yīng)方會獲得更多的收益。數(shù)據(jù)分析服務(wù)商根據(jù)具體的數(shù)據(jù)分析任務(wù),直接參與由平臺發(fā)起的競價,達成交易后由平臺支付。交易平臺本身的收益則是需求方支付額減去其他各方收益的差價。

      5.融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺的優(yōu)勢

      本文3.1到3.3中指出現(xiàn)有大數(shù)據(jù)交易平臺存在數(shù)據(jù)供需錯配、大數(shù)據(jù)資源定價困難、數(shù)據(jù)的時效性不強三大不足。融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺作為改進后的第二代大數(shù)據(jù)交易平臺,可以很好地克服上述三點不足。除了這三個方面的優(yōu)勢以外,由于融合后可實現(xiàn)數(shù)據(jù)與服務(wù)的一體化交易,這將擴大交易對象的覆蓋范圍,提升交易的活力,具體如下。

      5.1 直接面向應(yīng)用,從根本上避免了數(shù)據(jù)供需的錯配

      在融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺上,需求方對交易平臺直接提出應(yīng)用方向和預(yù)期結(jié)果。交易平臺對全平臺的數(shù)據(jù)進行多維度整合,如果缺失某個維度的數(shù)據(jù),可以進行定向的采集和補充,最后形成高價值的多維數(shù)據(jù)。這些多維數(shù)據(jù)才是真正具有分析價值的數(shù)據(jù)資源,這是單個數(shù)據(jù)供應(yīng)方無法提供的。在得到多維數(shù)據(jù)后,結(jié)合平臺自身和第三方數(shù)據(jù)服務(wù)商的分析能力,得到最終的分析結(jié)果。交易平臺最后交付給需求方的是數(shù)據(jù)分析結(jié)果和基礎(chǔ)數(shù)據(jù),這種直接面向最終應(yīng)用的大數(shù)據(jù)交易方式,從根本上避免了數(shù)據(jù)供需的錯配。

      5.2 融合后定價更有根據(jù)

      在現(xiàn)有的大數(shù)據(jù)平臺上,數(shù)據(jù)需求方是將數(shù)據(jù)資源買回去以后自己分析,而在購買數(shù)據(jù)資源之前,不能預(yù)知數(shù)據(jù)分析效果的好壞,因此無法進行有效的價值判斷,這是定價困難的關(guān)鍵點。在融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺上,需求方不再直接對數(shù)據(jù)資源付費,而是對最終的數(shù)據(jù)分析結(jié)果付費,并且數(shù)據(jù)分析結(jié)果是根據(jù)需求方的要求反向定制的,是符合需求方利益的。需求方可以通過評估預(yù)期結(jié)果對自身的重要性或收益的改進程度,給出適當(dāng)?shù)慕灰最A(yù)算。交易平臺以該預(yù)算為參照,對數(shù)據(jù)和服務(wù)進行選擇,若出現(xiàn)原預(yù)算約束下無法實現(xiàn)預(yù)期結(jié)果的情況,交易平臺再與需求方進行溝通,雙方討價還價后達成交易。這樣相對于現(xiàn)有的大數(shù)據(jù)交易平臺來說,融合后定價更有依據(jù)。

      5.3 融合后可提供實時數(shù)據(jù)

      在融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺上,數(shù)據(jù)資源采用云存貯的模式,由平臺進行統(tǒng)一管理,這提高了數(shù)據(jù)資源的安全性。在數(shù)據(jù)安全有保障的前提下,由交易平臺出面和數(shù)據(jù)資源供應(yīng)方進行實時數(shù)據(jù)的對接,將實時數(shù)據(jù)納入大數(shù)據(jù)資源池中。對于單個的數(shù)據(jù)資源供應(yīng)方來說,實時的數(shù)據(jù)脫敏難度太大。但大數(shù)據(jù)交易平臺不一樣,它可以利用規(guī)模優(yōu)勢,組建強大的計算能力,對大數(shù)據(jù)資源進行實時的脫敏和清洗,極大地提高了數(shù)據(jù)資源的時效性。

      5.4 融合后將擴大交易對象的覆蓋范圍,提升交易的活力

      融合后可實現(xiàn)數(shù)據(jù)和服務(wù)的一體化交易,讓很多自身不具備數(shù)據(jù)分析能力的組織和個人,也能方便地利用大數(shù)據(jù),特別是大量的中小企業(yè),這將大大增加交易對象的覆蓋范圍。

      交易對象的增多會促進交易頻率的增長,從而為數(shù)據(jù)資源供應(yīng)方帶來更多的收益,這樣會提升它們參與交易的積極性,鼓勵它們供應(yīng)更多的數(shù)據(jù)資源,從而提升交易的活力,整個大數(shù)據(jù)交易行業(yè)就形成了正向循環(huán)的良好發(fā)展態(tài)勢。

      6結(jié)語

      本文對大數(shù)據(jù)交易平臺本身進行了改進與創(chuàng)新,設(shè)計了一種全新的第二代大數(shù)據(jù)交易平臺,即:融合數(shù)據(jù)分析服務(wù)的大數(shù)據(jù)交易平臺。該交易平臺可以直接面向需求方的應(yīng)用方向,實現(xiàn)數(shù)據(jù)和服務(wù)的一體化交易,不僅從根本上避免了數(shù)據(jù)供需的錯配,還使大數(shù)據(jù)交易的定價更有依據(jù),平臺的深度參也讓提供實時數(shù)據(jù)成為可能,這些將從整體上提升大數(shù)據(jù)交易的效率。融合后數(shù)據(jù)和服務(wù)的一體化交易降低了大數(shù)據(jù)應(yīng)用的技術(shù)門檻,鼓勵更多組織和個人參與,增加了交易活力。未來筆者將繼續(xù)關(guān)注大數(shù)據(jù)交易平臺的創(chuàng)新研究,為實際應(yīng)用和學(xué)術(shù)科研提供更多有益的參考。

      參考文獻

      [1]趙強,單煒.大數(shù)據(jù)政府創(chuàng)新:基于數(shù)據(jù)流的公共價值創(chuàng)造[J].中國科技論壇,2014(12):23-27.

      [2]徐繼華,馮啟娜,陳貞汝.智慧政府:大數(shù)據(jù)治國時代的來臨[M].北京:中信出版社,2014.

      [3]李文蓮,夏健明.基于“大數(shù)據(jù)”的商業(yè)模式創(chuàng)新[J].中國工業(yè)經(jīng)濟,2013(5):83-95.

      [4]侯錫林,李天柱,馬佳,等.大數(shù)據(jù)環(huán)境下企業(yè)創(chuàng)新機會研究[J].科技進步與對策,2014,31(24):82-86.

      [5]張峰,張迪.論大數(shù)據(jù)時代科研方法新特征及其影響[J].科學(xué)學(xué)研究,2016,34(2):166-170,202.

      [6]王玉林,高富平.大數(shù)據(jù)的財產(chǎn)屬性研究[J]。圖書與情報,2016(1):29-35,43.

      [7]齊愛民,盤佳.數(shù)據(jù)權(quán)、數(shù)據(jù)主權(quán)的確立與大數(shù)據(jù)保護的基本原則[J].蘇州大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2015(1):64-70.

      [8]劉朝陽.大數(shù)據(jù)定價問題分析[J].圖書情報知識,2016(1):57-64.

      [9]劉洪玉,張曉玉,侯錫林.基于討價還價博弈模型的大數(shù)據(jù)交易價格研究[J].中國冶金教育,2015(6):86-91.

      [10]翟麗麗,王佳妮,何曉燕.移動云計算聯(lián)盟企業(yè)數(shù)據(jù)資產(chǎn)評估方法研究[J].價格理論與實踐,2016(2):153-156.

      [11]史宇航.個人數(shù)據(jù)交易的法律規(guī)制[J].情報理論與實踐,2016,39(5):34-39.

      [12]殷建立,王忠.大數(shù)據(jù)環(huán)境下個人數(shù)據(jù)溯源管理體系研究[J].情報科學(xué),2016,34(2):139-143.

      [13]王忠.大數(shù)據(jù)時代個人數(shù)據(jù)交易許可機制研究[J].理論月刊,2015(6):131-135.

      篇8

      2電力在線監(jiān)測過程中異常數(shù)據(jù)的分析和解讀

      根據(jù)《國家電網(wǎng)報》的報道可以看到,在2014年,在南方某地區(qū)電力工作人員通過監(jiān)測發(fā)現(xiàn)轄區(qū)內(nèi)的一個電度表出現(xiàn)了電壓不穩(wěn)的情況,這種情況的出現(xiàn),就淺析“量價費損”在線監(jiān)測過程中異常數(shù)據(jù)分析及處理楊娟國網(wǎng)山東鄄城縣供電公司274600說明此電表所管轄的區(qū)域內(nèi)有違規(guī)用電戶,或者是記電表出現(xiàn)了問題。通過工作人員的連夜分析,發(fā)現(xiàn)是記電表的內(nèi)部芯片出現(xiàn)了問題,正是因為這個問題才導(dǎo)致了整個電力系統(tǒng)的不穩(wěn)。工作人員將所有記電表的內(nèi)置芯片全部更換,發(fā)現(xiàn)電力系統(tǒng)開始正常運行,芯片更換后,追補到了六千余瓦電量,取得了階段性內(nèi)的成功。這就說明,通過監(jiān)測發(fā)現(xiàn)了數(shù)據(jù)異常后,需要及時的分析才能排除可能,從而“對癥下藥”。

      3如何處理電力監(jiān)測中的異常問題

      隨著科技和時代的發(fā)展“,量價費損”在線系統(tǒng)在國家電網(wǎng)公司逐步實施使用,此種工具有著不同功能和作用,使用得當(dāng)可以為企業(yè)增加經(jīng)濟效益,如果使用不得當(dāng)那么就會引起一系列的問題。國家電網(wǎng)公司在2013年上線試點了電力在線監(jiān)測系統(tǒng),對多個城市開展全面性的試點監(jiān)測。主要工作原理是通過第三方平臺,對區(qū)域內(nèi)的用電量、電價、電力傳輸線路等細(xì)節(jié)進行監(jiān)測,如果在監(jiān)測過程中發(fā)現(xiàn)了任何異常問題,就自動采用“閉環(huán)協(xié)調(diào)運作”的形式,可以讓工作人員在第一時間了解問題,從而解決問題。這個監(jiān)測工具可以深入到用電系統(tǒng)的方方面面,將以往遺漏的地方全都納入監(jiān)測之中。通過監(jiān)測工具形成了按時匯報,定點處理的營銷機制,從根本上為復(fù)雜多樣的電力系統(tǒng)監(jiān)測提供了高效優(yōu)良手段。

      3.1“量價費損”在線監(jiān)測工具的運行機制

      此監(jiān)測工具主要是進行電力預(yù)警,將有可能出現(xiàn)的問題以形象直觀的方式及時反饋。一般來說,監(jiān)測工具是使用多種類型的監(jiān)測盤構(gòu)成的,不同的監(jiān)測盤負(fù)責(zé)監(jiān)測電力系統(tǒng)的不同方面。監(jiān)測盤可以通過人工定時的方式自動刷新,沒更新一次數(shù)據(jù)就是一次新的監(jiān)測。通過監(jiān)測盤,可以展現(xiàn)出電費、電價、電力使用情況等方方面面的數(shù)據(jù),各種數(shù)據(jù)指標(biāo)都是各電力工作人員需要著重構(gòu)建用電系統(tǒng)的依據(jù)。其中不同顏色表示風(fēng)險預(yù)警的不同狀態(tài),如果是紅色,那么就說明電力系統(tǒng)存在高危風(fēng)險,此時應(yīng)該特別注意,全力排查有關(guān)問題。監(jiān)測盤的指針如果落到了黃色區(qū)域,那就說明高危風(fēng)險出現(xiàn)的幾率增加,此時應(yīng)該防患于未然,如果指針在綠色區(qū)域,就說明一切指標(biāo)和數(shù)據(jù)處于一個安全的狀態(tài)內(nèi),所有用電系統(tǒng)一切正常。

      3.2“量價費損”監(jiān)測過程中的問題預(yù)測

      在電力監(jiān)測過程中,除了有不同顏色的標(biāo)注之外,還有彈出窗口作為提醒。這區(qū)別于不同的顏色風(fēng)險區(qū)域,可以以更加醒目的方式提醒有關(guān)人員,引起全部人員的注意力。在電力監(jiān)測過程中會發(fā)現(xiàn),電費問題一直是一個難以解決的重要難題。因為用電戶繁多,沒法及時將電費收回,影響了電力公司的正常運轉(zhuǎn)。而在監(jiān)測工具中,新增了智能運算這一個過程,可以通過有關(guān)程序,計算出有關(guān)的電費和電價,從而對相應(yīng)的用電客戶做出提醒,降低電力系統(tǒng)的風(fēng)險,這種省時省力的方式受到了良好的效果。

      3.3“量價費損”在線監(jiān)測的優(yōu)點

      在線監(jiān)測工具在用電系統(tǒng)中的廣泛應(yīng)用,使得各大城市可以在宏觀上把握各大電網(wǎng)的運行狀態(tài)。對于供電企業(yè)的決策處理水平有了一個很大的提高。供電企業(yè)的數(shù)據(jù)分析擺脫了低效的機制,從而構(gòu)建了一個全新的用電管理系統(tǒng)。對于廣大市民來說,此種監(jiān)測工具成為了溝通用電戶和電力公司的橋梁,在二者之間建立起一個良好的信譽體系,促進了節(jié)約用電的意識,規(guī)范了用電機制和模式??梢员WC日常生活中電費的順利上繳和回收。此種用電監(jiān)測工具能在源頭上防止不正確的用電行為,保證了供電企業(yè)的經(jīng)濟效益。可以確保供電企業(yè)的資金合理運轉(zhuǎn),杜絕了以往用電過多、蓄意浪費等不良行為。如果有蓄意欠費用戶,也可以通過監(jiān)測第一時間發(fā)現(xiàn),從而避免了供電企業(yè)的經(jīng)濟損失。根據(jù)調(diào)查表明,在監(jiān)測工具使用后,違章用電客戶比之前減少了百分之六十,大大增強了電力資源的利用率。

      篇9

      BI商業(yè)智能軟件一般都會提供若干數(shù)據(jù)整合、數(shù)據(jù)查詢、分析與評價、數(shù)據(jù)可視化及數(shù)據(jù)分享的手段,但是在BI項目的構(gòu)建與實施過程中,如果不按照一定的應(yīng)用組織思路、數(shù)據(jù)分析模式及分析流程使用這些工具或手段,呈現(xiàn)給最終用戶的將是獨立的工具集和離散的分析內(nèi)容,BI系統(tǒng)的整體應(yīng)用效果將大打折扣。同時,最終用戶也了解數(shù)據(jù)分析模式及數(shù)據(jù)分析流程方面的一些常用理論和方法,以便形成自己的分析內(nèi)容組織思路,從而有效開展數(shù)據(jù)決策分析工作。這方面目前已有多種卓有成效的理論及實踐體系,本文基于既往經(jīng)歷的典型BI/DW項目實施經(jīng)驗及對BI軟件規(guī)劃研發(fā)和實施經(jīng)驗,給出一種BI系統(tǒng)中的數(shù)據(jù)分析內(nèi)容及分析流程組織思路。

      1.整體應(yīng)用模式

      在商業(yè)智能項目(DW/BI項目)中,通過梳理和優(yōu)化現(xiàn)有的指標(biāo)、報表體系和分析體系,同時整合主要的業(yè)務(wù)系統(tǒng)數(shù)據(jù)(業(yè)務(wù)核心支撐系統(tǒng)、財務(wù)系統(tǒng)、HR系統(tǒng)、手工維護的數(shù)據(jù)如行業(yè)數(shù)據(jù)、競爭對手?jǐn)?shù)據(jù)等),從而建立面向總部和子公司的業(yè)務(wù)及IT等部門,集中使用、管理和維護的BI商業(yè)智能系統(tǒng),以強化信息共享、業(yè)務(wù)分析、輔助管理決策工作。

      在系統(tǒng)構(gòu)建思路(系統(tǒng)整體應(yīng)用模式)方面,面向數(shù)據(jù)分析的BI商業(yè)智能系統(tǒng)構(gòu)建工作應(yīng)達到如下目標(biāo):

      2.數(shù)據(jù)分析模式

      在數(shù)據(jù)分析的原理及模式方面,BI商業(yè)智能系統(tǒng)可采取PDCA管理循環(huán)理論的分析問題的模式,PDCA管理循環(huán)理論起初應(yīng)用于質(zhì)量檢查與保障優(yōu)化領(lǐng)域,后來在精細(xì)化管理及數(shù)據(jù)分析與決策領(lǐng)域卓有成效。

      應(yīng)用在商業(yè)智能項目(BI/DW類)中時,PDCA管理循環(huán)理論的P、D、C、A四個英文字母所代表的意義如下:

      1)P(Plan)——計劃

      包括方針和目標(biāo)的確定以及活動計劃的制定,包括業(yè)務(wù)發(fā)展目標(biāo)(goal),中期計劃(plan),年度、季度及月度預(yù)算等(budget)。

      計劃環(huán)節(jié)的內(nèi)容觸發(fā)了BI商業(yè)智能系統(tǒng)應(yīng)當(dāng)具有導(dǎo)入并集成計劃與預(yù)算等相關(guān)數(shù)據(jù)的能力這一要求,而計劃及預(yù)算的制定工作,一般則是通過在專項的計劃與預(yù)算管理系統(tǒng)中進行。也有個別BI廠商基于自定義的填報方案為客戶提供計劃和預(yù)算的下發(fā)與上報等管理功能。

      2)D(DO)——執(zhí)行

      執(zhí)行就是具體運作,實現(xiàn)計劃中的內(nèi)容。在BI商業(yè)智能系統(tǒng)需要對及時、準(zhǔn)確的反應(yīng)業(yè)務(wù)的現(xiàn)狀提供必要的、充分的手段,包括圍繞業(yè)務(wù)整體狀況及各個業(yè)務(wù)面構(gòu)建的Dashboard、報表、查詢、預(yù)警及其他數(shù)據(jù)分析及可視化手段。

      有比較才能明了現(xiàn)狀,有參照才能進行比較。因此BI商業(yè)智能系統(tǒng)還應(yīng)該提供來自內(nèi)部、外部的參照體系,比如計劃數(shù)據(jù)、歷史數(shù)據(jù)、標(biāo)桿數(shù)據(jù)、競爭數(shù)據(jù)等,以便對業(yè)務(wù)現(xiàn)狀的健康程度有足夠的參照依據(jù)。

      3)C(Check)——檢查

      就是要檢查并總結(jié)執(zhí)行計劃的結(jié)果,分清哪些對了,哪些錯了,明確效果,找出問題。

      在BI商業(yè)智能系統(tǒng)中,應(yīng)提供相應(yīng)的對比和評價手段,如各類計劃的達成情況分析、標(biāo)桿分析、綜合績效評價、EVA評價等手段,以便對一個業(yè)務(wù)周期的效果進行分析與評價。

      該部分的分析粒度應(yīng)有所提高(如沿著時間、人員等維度),分析的范圍相應(yīng)縮窄,結(jié)合管理及業(yè)務(wù)現(xiàn)狀有針對性對總體及關(guān)鍵業(yè)務(wù)環(huán)節(jié)設(shè)立專項檢查與評價手段,檢查評價的內(nèi)容一般集中在業(yè)務(wù)效率及財務(wù)表現(xiàn)等方面。

      4)A(Action)——處理

      對上文Check環(huán)節(jié)檢查的結(jié)果進行處理,管理人員通過仔細(xì)分析內(nèi)在原因之后對檢車結(jié)果認(rèn)可、否定或調(diào)整改進相關(guān)參數(shù)及結(jié)果。并利用有效的結(jié)果針對性的開展相關(guān)商務(wù)政策及管理措施等。

      比如,在既往實施的多個經(jīng)銷商網(wǎng)絡(luò)管理商業(yè)智能項目中,Action環(huán)節(jié)落實為相應(yīng)銷售政策、獎罰措施及總部向各經(jīng)銷商、商的利潤返還計劃,同時也落實為對下一輪業(yè)務(wù)目標(biāo)計劃數(shù)據(jù)的調(diào)整。

      3.數(shù)據(jù)分析流程

      篇10

      1引言

      本課題來源于中央廣播電視大學(xué)教務(wù)管理系統(tǒng)的后續(xù)開發(fā)。隨著中央電大在開放式教育思想指導(dǎo)下的教學(xué)改革的展開,系統(tǒng)業(yè)務(wù)量急劇猛增,原有的教學(xué)管理系統(tǒng)已經(jīng)逐漸的滿足不了應(yīng)用需求。所以新一代教學(xué)管理系統(tǒng)正在開發(fā)中,同時由于教育業(yè)務(wù)本身的連貫性,導(dǎo)致了新舊系統(tǒng)并行的局面出現(xiàn)。但是由于新舊系統(tǒng)間缺少關(guān)聯(lián)和通信以及必要的規(guī)范,導(dǎo)致信息“孤島”現(xiàn)象嚴(yán)重,而舊系統(tǒng)又恰恰是電大不可放棄的重要投資。同時由于各個系統(tǒng)集成度不足,運行業(yè)務(wù)的數(shù)據(jù)庫和應(yīng)用程序也是在不同時期部署的,它們來自不同的供應(yīng)商,使用各不相同的定制技術(shù)。從而面臨著如何構(gòu)建一個強壯的、可靠的,將新舊系統(tǒng)中的分散功能組織成可共用的標(biāo)準(zhǔn)服務(wù)來滿足業(yè)務(wù)要求的平臺,成為我們需要研究的難點。

      通過實踐我們可以發(fā)現(xiàn),應(yīng)用程序始終都與數(shù)據(jù)有關(guān),企業(yè)級的服務(wù)程序更是如此。今天,企業(yè)應(yīng)用程序開發(fā)中有高達70%的時間都是用于訪問不同的數(shù)據(jù)。因此,對企業(yè)信息和數(shù)據(jù)按業(yè)務(wù)邏輯進行梳理和抽取,形成企業(yè)數(shù)據(jù)的統(tǒng)一表現(xiàn)實體,該實體可以在全企業(yè)范圍內(nèi)得到一致性的使用,是邁向面向服務(wù)的體系架構(gòu)的第一步。因此我們提出了主題數(shù)據(jù)平臺的概念。

      2主題數(shù)據(jù)平臺結(jié)構(gòu)

      主題數(shù)據(jù)平臺結(jié)構(gòu)見圖1。主題數(shù)據(jù)平臺由:主題數(shù)據(jù)服務(wù)層、數(shù)據(jù)處理構(gòu)件、數(shù)據(jù)處理管道、適配器構(gòu)件組成。

      圖1數(shù)據(jù)主題平臺的設(shè)計構(gòu)架

      主題數(shù)據(jù)服務(wù)層:是底層接口與上層應(yīng)用的中間層,用于屏蔽底層接口,向上提供統(tǒng)一的服務(wù)。有兩種角色:一種角色是數(shù)據(jù)中轉(zhuǎn)站,用于保存臨時數(shù)據(jù),并等數(shù)據(jù)傳輸完整之后,進一步對數(shù)據(jù)進行分析和處理;另一種角色是主題數(shù)據(jù)服務(wù)層角色,用于保存數(shù)據(jù)處理的最終結(jié)果:主題數(shù)據(jù)。

      數(shù)據(jù)處理構(gòu)件:是數(shù)據(jù)處理的基礎(chǔ)構(gòu)件,每一個數(shù)據(jù)處理構(gòu)件都封裝了一部分相對獨立的數(shù)據(jù)處理邏輯,包括刪除不需要的數(shù)據(jù)、補充缺少的數(shù)據(jù)、對數(shù)據(jù)進行簡單的四則運算、代碼轉(zhuǎn)換和按主題建立新的數(shù)據(jù)結(jié)構(gòu)等功能。

      數(shù)據(jù)處理管道:是由多個數(shù)據(jù)處理構(gòu)件組成,它合理的組合和安排這些數(shù)據(jù)處理構(gòu)件,從而完成復(fù)雜的數(shù)據(jù)處理邏輯。

      適配器構(gòu)件:用于實現(xiàn)異構(gòu)數(shù)據(jù)庫與數(shù)據(jù)處理管道的無縫連接,從而能夠方便的從異構(gòu)數(shù)據(jù)庫中抽取或插入數(shù)據(jù)。

      3基于局域網(wǎng)的主題數(shù)據(jù)平臺的實現(xiàn)方案

      基于局域網(wǎng)的主題數(shù)據(jù)平臺的實現(xiàn)方案見圖2。

      圖2基于局域網(wǎng)的數(shù)據(jù)主題平臺的實現(xiàn)方案

      由于局域網(wǎng)有著:網(wǎng)絡(luò)傳輸速度快、網(wǎng)絡(luò)故障率低、即時性強、服務(wù)器固定等優(yōu)點。所以我們采用:DTS技術(shù)、Nmake技術(shù)、臨時庫等技術(shù)來解決基于局域網(wǎng)的主題數(shù)據(jù)平臺的實現(xiàn)問題。

      3.1DTS技術(shù)的應(yīng)用

      采用DTS技術(shù)可以實現(xiàn)在局域網(wǎng)中從異構(gòu)的數(shù)據(jù)庫中提取或插入數(shù)據(jù),并能對數(shù)據(jù)進行簡單的邏輯操作。它可以把相對獨立的數(shù)據(jù)處理邏輯封裝在對應(yīng)的DTS包中,從而把公用的數(shù)據(jù)處理邏輯從數(shù)據(jù)處理業(yè)務(wù)中提煉了出來,以備復(fù)用。并提供了工作流支持,保證了DTS包中數(shù)據(jù)處理業(yè)務(wù)的事務(wù)性和完整性。

      ⑴適配器構(gòu)件

      適配器構(gòu)件只是一個數(shù)據(jù)處理通道和異構(gòu)數(shù)據(jù)源的連接器,它負(fù)責(zé)從異構(gòu)數(shù)據(jù)源中抽取或者插入數(shù)據(jù)并將數(shù)據(jù)轉(zhuǎn)移到數(shù)據(jù)處理通道中。每一個數(shù)據(jù)源對應(yīng)一個或多個適配器構(gòu)件,每個適配器構(gòu)件包含在對應(yīng)的DTS包中。整個DTS包中包含一個原數(shù)據(jù)源、一個目標(biāo)數(shù)據(jù)源和一個數(shù)據(jù)對應(yīng)轉(zhuǎn)換任務(wù)。將整個數(shù)據(jù)轉(zhuǎn)換邏輯封裝為一個構(gòu)件,有利于適配器構(gòu)件的復(fù)用。

      ⑵數(shù)據(jù)處理構(gòu)件

      數(shù)據(jù)處理構(gòu)件封裝了數(shù)據(jù)處理邏輯,這些處理邏輯由數(shù)據(jù)業(yè)務(wù)驅(qū)動,包括刪除不需要的數(shù)據(jù)、從不同的數(shù)據(jù)來源補齊缺少的數(shù)據(jù)、對數(shù)據(jù)進行簡單的四則運算、不同信息系統(tǒng)之間的代碼轉(zhuǎn)換等功能。數(shù)據(jù)處理邏輯按其獨立性和公用性被封裝在不同的DTS包中,增強了數(shù)據(jù)處理構(gòu)件的可變性和復(fù)用性。DTS包提供了驗證機制這既可以保證數(shù)據(jù)處理邏輯的正確性,又可以保證數(shù)據(jù)處理邏輯的事務(wù)性。DTS包內(nèi)包含工作流,可以針對不同的情況做出不同的處理,極大地提高了數(shù)據(jù)處理構(gòu)件的復(fù)用性,并可對業(yè)務(wù)性錯誤做出必要的處理。

      3.2Nmake技術(shù)的應(yīng)用

      Microsoft程序維護實用工具Nmake是一個32位基于說明文件中包含的命令生成項目的工具。NMake具有豐富的選項,可以完成復(fù)雜的處理操作,并有樹狀文件任務(wù)處理結(jié)構(gòu),并且易于編寫,結(jié)構(gòu)清晰,對于實現(xiàn)復(fù)雜的數(shù)據(jù)處理業(yè)務(wù)提供了很大的方便。采用Nmake技術(shù)可以有效的將結(jié)構(gòu)松散的、相對獨立的數(shù)據(jù)處理構(gòu)件聚合起來,從而能夠處理復(fù)雜的數(shù)據(jù)處理業(yè)務(wù)。

      數(shù)據(jù)處理管道

      數(shù)據(jù)處理管道是將數(shù)據(jù)處理構(gòu)件有機的組合起來并封裝好,對主題數(shù)據(jù)服務(wù)層提供統(tǒng)一的訪問接口,從而把數(shù)據(jù)服務(wù)邏輯與數(shù)據(jù)處理邏輯分割開來。數(shù)據(jù)處理管道可以極大地提高數(shù)據(jù)處理構(gòu)件的復(fù)用率,并把復(fù)雜的數(shù)據(jù)處理邏輯從數(shù)據(jù)處理構(gòu)件中抽離了出來,當(dāng)數(shù)據(jù)處理業(yè)務(wù)變動的時候不需要修改構(gòu)件只要按著業(yè)務(wù)需求,重新組織構(gòu)件即可解決問題。Nmake可以按著業(yè)務(wù)需求輕松地把數(shù)據(jù)處理構(gòu)件組合起來形成帶有業(yè)務(wù)邏輯關(guān)系的數(shù)據(jù)處理管道,并且Nmake提供了業(yè)務(wù)流功能,針對不同的業(yè)務(wù)需求可以提供不同的業(yè)務(wù)流支持,從而極大的提高業(yè)務(wù)本身的靈活性。當(dāng)業(yè)務(wù)需求變動時,Nmake可以通過重新組合數(shù)據(jù)處理構(gòu)件來完成業(yè)務(wù),而不需修改或者重新編寫數(shù)據(jù)處理構(gòu)件,從而提高數(shù)據(jù)處理構(gòu)件的可復(fù)用性。

      4基于互聯(lián)網(wǎng)的主題數(shù)據(jù)平臺的解決方案

      基于互聯(lián)網(wǎng)的主題數(shù)據(jù)平臺面臨的主要問題是如何通過遠(yuǎn)程數(shù)據(jù)傳輸將互聯(lián)網(wǎng)的異地、異構(gòu)的數(shù)據(jù)源中的數(shù)據(jù)傳輸?shù)街黝}數(shù)據(jù)服務(wù)層中。數(shù)據(jù)一旦進入主題數(shù)據(jù)平臺的主題數(shù)據(jù)服務(wù)層,就可以使用和基于局域網(wǎng)的解決方案相同的技術(shù)對數(shù)據(jù)進行整理。通過遠(yuǎn)程數(shù)據(jù)傳輸將互聯(lián)網(wǎng)的異構(gòu)數(shù)據(jù)傳輸?shù)街黝}數(shù)據(jù)服務(wù)層之后的功能與基于局域網(wǎng)的數(shù)據(jù)轉(zhuǎn)換接口的功能相同。

      中央廣播電視大學(xué)遠(yuǎn)程開放教育的教務(wù)管理系統(tǒng)是一個跨越44個省面向全國的開放式教育體系結(jié)構(gòu)。該系統(tǒng)包含四級平臺、五種角色,由于其獨特性中央電大教務(wù)管理系統(tǒng)基于互聯(lián)網(wǎng)的主題數(shù)據(jù)平臺的搭建有如下4方面需求:

      1)中央電大各個系統(tǒng)之間、中央電大教務(wù)管理系統(tǒng)各級平臺之間需要能進行靈活的數(shù)據(jù)交換。

      2)每次交換數(shù)據(jù)的數(shù)據(jù)量可能達到GB級。

      3)部分?jǐn)?shù)據(jù)交換有實時性要求,在規(guī)定時間內(nèi)客戶端必須收到響應(yīng),不能因為數(shù)據(jù)傳輸而推遲業(yè)務(wù)進度。

      4)需要在網(wǎng)絡(luò)狀況不穩(wěn)定的情況下完成數(shù)據(jù)交換,因為中央電大教務(wù)系統(tǒng)是跨越44個省的開放式教育系統(tǒng),所以中央電大需要同44所省電大交換數(shù)據(jù),在這種情況下網(wǎng)絡(luò)狀況不可預(yù)知、穩(wěn)定性難以保證,但傳輸仍然需要進行。

      4.1SOAP協(xié)議與Hessian協(xié)議的比較

      目前,Web服務(wù)技術(shù)是解決異構(gòu)平臺系統(tǒng)的集成及互操作問題的主流技術(shù)[1]。它所基于的XML已經(jīng)是Internet上交換數(shù)據(jù)的實際標(biāo)準(zhǔn),基于通用的進程間通信協(xié)議和網(wǎng)絡(luò)傳輸協(xié)議屏蔽平臺的差異,可以將各種異構(gòu)環(huán)境下的通信及調(diào)用請求均統(tǒng)一為標(biāo)準(zhǔn)的Web服務(wù)格式[3]。

      但是由于SOAP協(xié)議的結(jié)構(gòu)問題會使封裝的數(shù)據(jù)膨脹數(shù)倍。當(dāng)傳輸數(shù)據(jù)量比較小時,問題不是那么明顯,但是當(dāng)進行大數(shù)據(jù)量傳輸時就會導(dǎo)致Web服務(wù)的傳輸性能在實際運用中降低了很多。這對于經(jīng)常有大數(shù)據(jù)量數(shù)據(jù)交換的應(yīng)用系統(tǒng)來說是不適用的。

      CauchoTechnology公司制定的HBWSP(HessianBinaryWebServiceProtocol)[2]在這方面的有所突破。Hessian協(xié)議和webservice常用的SOAP協(xié)議類似,也是將協(xié)議報文封裝在HTTP封包中,通過HTTP信道進行傳輸?shù)摹R虼薍essian協(xié)議具有與SOAP協(xié)議同樣的優(yōu)點,即傳輸不受防火墻的限制(防火墻通常不限制HTTP信道)。Hessian協(xié)議的優(yōu)勢在于:它把本地格式的數(shù)據(jù)編碼為二進制數(shù)據(jù),僅用一個字符作為結(jié)構(gòu)化標(biāo)記,HBWSP封裝后的數(shù)據(jù)增量明顯小于SOAP封裝后的數(shù)據(jù)增量。并且相對于SOAP,Hessian協(xié)議的外部數(shù)據(jù)表示有3個顯著的優(yōu)勢:

      1)采用簡單的結(jié)構(gòu)化標(biāo)記。簡單的結(jié)構(gòu)化標(biāo)記減少了編碼、解碼操作對內(nèi)存的占用量。編碼時,只需寫少量的數(shù)據(jù),就可以標(biāo)記結(jié)構(gòu);解碼時,只需讀少量的數(shù)據(jù)就可以確定結(jié)構(gòu)。而且,簡單的結(jié)構(gòu)化標(biāo)記減少了編碼后的數(shù)據(jù)增量。

      2)采用定長的字節(jié)記錄值。用定長的字節(jié)記錄值,解碼時,就可以使用位操作從固定長度的位獲得值。這樣不僅操作簡單,而且可以獲得較高的性能。

      3)采用引用取代重復(fù)遇到的對象。使用引用取代重復(fù)遇到的對象可以避免對重復(fù)對象的編碼,而且也減少了編碼后的數(shù)據(jù)量。

      因此使用Hessian協(xié)議傳輸數(shù)據(jù)量比SOAP協(xié)議要小得多。實踐證明,傳輸同樣的對象Hessian協(xié)議傳輸?shù)臄?shù)據(jù)量比SOAP協(xié)議低一個數(shù)量級。因此Hessian協(xié)議比SOAP協(xié)議更適用于分布式應(yīng)用系統(tǒng)間大數(shù)據(jù)量的數(shù)據(jù)交換。

      4.2Hessian協(xié)議的實現(xiàn)構(gòu)架

      Hessian協(xié)議的實現(xiàn)構(gòu)架如圖3所示:為了實現(xiàn)Hessian構(gòu)架,設(shè)計了下列組件:編碼組件、解碼組件、通信組件、報告故障組件、組件、調(diào)用服務(wù)過程組件。

      圖3Hessian協(xié)議的實現(xiàn)構(gòu)架

      首先客戶端發(fā)出本地請求,組件響應(yīng)請求依據(jù)服務(wù)接口,生成客戶端存根,并調(diào)用編碼組件對本地請求進行基于HessianBinaryWebServiceProtocol標(biāo)準(zhǔn)的二進制編碼。然后調(diào)用通信組件將請求發(fā)送給服務(wù)器端。服務(wù)器端通信組件接收到請求后把請求轉(zhuǎn)發(fā)給調(diào)用服務(wù)過程組件,調(diào)用服務(wù)過程組件會首先調(diào)用解碼組件,得到過程標(biāo)識,將過程標(biāo)識轉(zhuǎn)給服務(wù)器端存根,并依據(jù)部署文件和客戶端的請求加載服務(wù)過程的實現(xiàn)類。然后根據(jù)過程標(biāo)識、過程參數(shù)調(diào)用服務(wù)過程。最后調(diào)用編碼組件將響應(yīng)結(jié)果進行編碼并通過通信組件返回給客戶端。

      當(dāng)數(shù)據(jù)傳輸、通信發(fā)生錯誤的時候就需要啟用報告故障組件,它可以以異常的形式,報告發(fā)送端、接收端、或者網(wǎng)絡(luò)連接發(fā)生的故障,并把錯誤記錄以日志的方式記錄下來保存在文件中,以備日后查閱。

      4.3實現(xiàn)結(jié)構(gòu)

      針對教務(wù)管理系統(tǒng)互聯(lián)網(wǎng)傳輸存在的一系列問題,基于互聯(lián)網(wǎng)的主體數(shù)據(jù)平臺采用基于HBWSP的輕量級跨平臺通信技術(shù)實現(xiàn)數(shù)據(jù)交換,如圖4所示。在客戶端,應(yīng)用服務(wù)器從主題數(shù)據(jù)服務(wù)層中抽取數(shù)據(jù),并按著HBWSP的外部數(shù)據(jù)表示對本地格式數(shù)據(jù)進行編碼。然后通過internet網(wǎng)進行傳輸,在服務(wù)器端,數(shù)據(jù)交換的服務(wù)負(fù)責(zé)按照HBWSP的外部數(shù)據(jù)表示對接收到的數(shù)據(jù)進行解碼,然后再對數(shù)據(jù)進行分析、處理后把數(shù)據(jù)插入到服務(wù)器端的主題數(shù)據(jù)服務(wù)層中。

      圖4非持久同步方式的數(shù)據(jù)交換解決方案

      該解決方案的主要特點包括:

      1)采用了HBWSP的二進制編碼方式解決了異地、異構(gòu)平臺系統(tǒng)的通信問題,并使數(shù)據(jù)交互具有了一定的實時性。

      2)由于HBWSP簡潔的編碼方式以及編碼、解碼性能高等特點使數(shù)據(jù)交換具有交換GB級數(shù)據(jù)的能力。

      3)采用了HBWSP的二進制編碼方式有助于縮短整個數(shù)據(jù)交換所需要的時間。其編碼性能高的特點,有助于提高編碼速度,減少發(fā)送方編碼本地數(shù)據(jù)的時間。其解碼性能高的特點,可以減少接收方解碼、重構(gòu)本地數(shù)據(jù)的時間。從而減少了數(shù)據(jù)交換的響應(yīng)時間。

      4)采用了HBWSP的二進制編碼方式和數(shù)據(jù)分批傳送技術(shù)有助于充分利用網(wǎng)絡(luò)狀況良好的時段??梢栽诰W(wǎng)絡(luò)狀況良好的時段盡可能多的完成數(shù)據(jù)交換。

      5)采用了斷點續(xù)傳技術(shù),保證了當(dāng)網(wǎng)絡(luò)斷連或響應(yīng)超時導(dǎo)致正在進行的數(shù)據(jù)交換被中斷,在故障修復(fù)后仍然可以從中斷處開始,繼續(xù)完成上次沒有完成的數(shù)據(jù)交換的能力。斷點的粒度可以調(diào)節(jié),可以是一條數(shù)據(jù),也可以是多條數(shù)據(jù)。

      6)采用了事務(wù)保護機制,把每批要傳輸?shù)臄?shù)據(jù)定義為一個事務(wù),本批要傳輸?shù)臄?shù)據(jù)的事務(wù)完整性不依賴于已經(jīng)完成的各批數(shù)據(jù),本批數(shù)據(jù)傳輸發(fā)生錯誤也不會對已經(jīng)完成的各批數(shù)據(jù)造成影響。采用這種方法,可以在數(shù)據(jù)交換過程被中斷的情況下保證數(shù)據(jù)交換事務(wù)的完整性。

      5總結(jié)和展望

      本文在SOA理論的基礎(chǔ)上提出了一個主題數(shù)據(jù)平臺的概念,力圖把異地、異構(gòu)的數(shù)據(jù)綜合起來,組成一個強壯的、高可靠性的、可共用的標(biāo)準(zhǔn)數(shù)據(jù)服務(wù)平臺。從而解決中央電大新舊教學(xué)管理系統(tǒng)數(shù)據(jù)“孤島”的問題。我們再進一步針對現(xiàn)實環(huán)境:局域網(wǎng)和互聯(lián)網(wǎng)兩種情況進行了分析,并給出了實現(xiàn)框架和技術(shù)細(xì)節(jié)。

      但是如何在信息暴露的基礎(chǔ)上,對業(yè)務(wù)應(yīng)用進行進一步的梳理、劃分、整合,從而封裝成用戶可以隨意組合、使用的標(biāo)準(zhǔn)服務(wù),從而實現(xiàn)真正的SOA,是需要我們進一步研究的內(nèi)容。

      參考文獻

      篇11

      二、數(shù)據(jù)挖掘技術(shù)在財務(wù)分析中的應(yīng)用

      財務(wù)分析的主要目的是改善經(jīng)營管理,提高企業(yè)的經(jīng)濟效益,其主要目的是保證會計信息資料的正確可靠性,以保證企業(yè)財產(chǎn)的安全性、完整性。比如某生態(tài)園林企業(yè)需要投入大量資金完善生產(chǎn)基礎(chǔ)設(shè)施,并保證現(xiàn)場作業(yè)的有序,如有必要還要投資于企業(yè)產(chǎn)品周邊附屬產(chǎn)業(yè)的發(fā)展,因此財務(wù)決策的重要性不言而喻,而在財務(wù)決策中應(yīng)用數(shù)據(jù)挖掘技術(shù)十分必要。財務(wù)分析中應(yīng)用數(shù)據(jù)挖掘的基本流程包括問題識別、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)開采及結(jié)果表達與解釋等四個步驟,圖1可將財務(wù)分析數(shù)據(jù)挖掘的過程直觀的表達出來:

      (一)問題識別

      典型的財務(wù)決策包括投資決策、籌資決策、成本決策、銷售決策等,企業(yè)要進行財務(wù)分析前必須識別決策問題,明確需要達到的決策目標(biāo)等,再將決策目標(biāo)轉(zhuǎn)換為數(shù)據(jù)挖掘的目標(biāo),最后進行準(zhǔn)確的數(shù)據(jù)定義。如企業(yè)需要投資企業(yè)產(chǎn)品周邊附屬產(chǎn)業(yè),則需要利用數(shù)據(jù)挖掘技術(shù)明確以下問題:

      (1)企業(yè)經(jīng)營中可隨時支配的資金額度,需要財務(wù)人員建立數(shù)據(jù)庫模型,將可用于投資的資金情況準(zhǔn)確、詳細(xì)的計算出來;

      (2)編制投資方案,即與本企業(yè)實際情況相結(jié)合,考慮具體投資計劃,并對投資方案的可操作性進行分析,比如上述園林生態(tài)企業(yè)需要投資進口園林機械的項目,就需要在投資前對該項目的大小做出合理評估,了解該品牌園林機械在國際市場的占有份額、品質(zhì)、成本及銷售價格等信息;

      (3)投資收益分析,投資的主要目的是獲得更高收益,因此在數(shù)據(jù)挖掘過程中,問題識別時必須做出可靠的收益預(yù)算。

      (二)數(shù)據(jù)準(zhǔn)備

      在完成問題識別后,需要根據(jù)不同的需求、從相關(guān)數(shù)據(jù)庫信息中選擇適用的數(shù)據(jù)信息,即進行數(shù)據(jù)準(zhǔn)備,該過程需要收集大量與企業(yè)財務(wù)分析相關(guān)的數(shù)據(jù)信息,以保證數(shù)據(jù)挖掘的真實性、客觀性,比如花卉市場分布信息、裝飾裝潢市場信息、園林設(shè)計與市場銷售等信息。通常情況下,數(shù)據(jù)準(zhǔn)備又可分為數(shù)據(jù)集成、數(shù)據(jù)選擇及數(shù)據(jù)預(yù)處理等三個步驟,其中數(shù)據(jù)集成是把多數(shù)據(jù)庫運行環(huán)境中的數(shù)據(jù)進行合并處理,去除信息噪聲,剔除虛假數(shù)據(jù);而數(shù)據(jù)選擇則是分辨需要分析的數(shù)據(jù)集合,進一步縮小數(shù)據(jù)處理的范圍,提高數(shù)據(jù)質(zhì)量,從而保證數(shù)據(jù)挖掘的有效性;數(shù)據(jù)預(yù)處理的主要目的是解決數(shù)據(jù)挖掘工具局限性的問題。

      (三)數(shù)據(jù)挖掘

      當(dāng)上述準(zhǔn)備工作完成后即可進行深入的數(shù)據(jù)挖掘處理,挖掘過程中需要注意,必須以財務(wù)分析核心思想為指導(dǎo),明確數(shù)據(jù)挖掘的目的性,數(shù)據(jù)挖掘的主要內(nèi)容包括:選擇合適的挖掘工具、具體的挖掘操作及證實發(fā)現(xiàn)的知識等,其中選擇合適的挖掘工具至關(guān)重要,限于篇幅此處對神經(jīng)網(wǎng)絡(luò)及決策樹兩種方法進行簡單介紹。神經(jīng)網(wǎng)絡(luò)是以自學(xué)習(xí)數(shù)學(xué)模型為基礎(chǔ)的,利用該方法可以很容易的解決具有上百個參數(shù)的問題,為高復(fù)雜度的問題提供一種相對簡單的方法;視經(jīng)網(wǎng)絡(luò)既可以表現(xiàn)為有指導(dǎo)的學(xué)習(xí),也可以是無指導(dǎo)聚類,不過輸入神經(jīng)網(wǎng)絡(luò)中的值均為數(shù)值型的。實際應(yīng)用中通常采用該方法進行財務(wù)預(yù)警分析。決策樹法是現(xiàn)階段應(yīng)用最廣泛的歸納推理算法之一,其提供了一種展示在何種條件下會獲得對應(yīng)值的規(guī)則的方法,是一種簡單的知識表示方法,在數(shù)據(jù)挖掘過程中,決策樹法主要用于數(shù)據(jù)挖掘的分類。

      (四)結(jié)果表達

      結(jié)果表達即是在處理數(shù)據(jù)庫信息的基礎(chǔ)上客觀的表達出數(shù)據(jù)挖掘的結(jié)果,以為企業(yè)財務(wù)分析提供可靠依據(jù)??梢哉f結(jié)果表達是數(shù)據(jù)挖掘的成果展示,其所表達的是最有價值的信息,如結(jié)果表達所提供的信息達不到?jīng)Q策的要求,則可重復(fù)挖掘過程,直至決策者滿意為止。