韩国激情一区二区高清在线,亚洲中文字幕网址在线,九色在线精品视频,久久深夜福利亚洲网站

    <object id="jtoc7"><button id="jtoc7"></button></object>

      <object id="jtoc7"></object>

      期刊 科普 SCI期刊 投稿技巧 學(xué)術(shù) 出書 購物車

      首頁 > 優(yōu)秀范文 > 大數(shù)據(jù)分析論文

      大數(shù)據(jù)分析論文樣例十一篇

      時間:2022-04-22 06:39:59

      序論:速發(fā)表網(wǎng)結(jié)合其深厚的文秘經(jīng)驗,特別為您篩選了11篇大數(shù)據(jù)分析論文范文。如果您需要更多原創(chuàng)資料,歡迎隨時與我們的客服老師聯(lián)系,希望您能從中汲取靈感和知識!

      大數(shù)據(jù)分析論文

      篇1

      1.1反射率分析模塊

      反射率的大小體現(xiàn)了氣象目標(biāo)的降水粒子的密度分布及體積大小,在實際氣象技術(shù)中長期用于表示氣象目標(biāo)的強度,在工作上采用dBZ單位表示。對于空管氣象雷達圖,數(shù)據(jù)顯示采用PPI(PlanPositionImage)顯示方式。該方式?jīng)Q定了一張氣象雷達圖由圓錐俯視平面上分析空間的回波構(gòu)成。在設(shè)計上簡單介紹其設(shè)計流程,首先必須讀取原始數(shù)據(jù),并判斷是否首次讀取,若為首次讀取則對其進行預(yù)處理,否則進行坐標(biāo)轉(zhuǎn)換;其次進行圖像繪制并判斷是否需要改變仰角。此處需要關(guān)注的關(guān)鍵是如何進行數(shù)據(jù)的預(yù)處理。在實現(xiàn)上,對接收的數(shù)據(jù)進行反射率信息結(jié)構(gòu)體賦值。當(dāng)然該結(jié)構(gòu)體包括了記錄實際仰角角度、數(shù)據(jù)文件路徑存儲、雷達波段判斷以及相關(guān)數(shù)據(jù)的偏移。通過掃描上述結(jié)構(gòu)體可以實現(xiàn)對雷達數(shù)據(jù)的預(yù)處理。

      1.2速度分析模塊

      多普勒雷達采用了速度退化模糊技術(shù)以擴大其對徑向風(fēng)速測量不模糊的區(qū)間。結(jié)構(gòu)設(shè)計主要考慮數(shù)據(jù)顯示的徑向方式,流程設(shè)計則與反射模塊類似。當(dāng)然在界面設(shè)計上,系統(tǒng)將提供對顏色配置的定義,使其人機交互更為快捷。

      1.3天線穩(wěn)定性分析模塊

      天線是雷達數(shù)據(jù)采集的關(guān)鍵部位,長期以來是影響雷達運行的主要關(guān)鍵點之一。其依賴于底下的電機進行旋轉(zhuǎn),目前大多數(shù)進口電機可以保證24小時安全運行。而運行時仰角提升和轉(zhuǎn)速的平穩(wěn)性直接影響雷達數(shù)據(jù)的采集。為此,我們通過在徑向數(shù)據(jù)上采用方位角及仰角進行掃描實現(xiàn)曲線圖監(jiān)控。通過選擇基數(shù)據(jù)再進行預(yù)處理后繪制相關(guān)曲線實現(xiàn)對天線運行狀態(tài)的評估。其中,曲線圖的繪制需要的參數(shù)為:縱坐標(biāo)為氣象雷達實際運行的每層仰角均值;橫坐標(biāo)為范圍角:0-360°。

      1.4雷達組網(wǎng)分析模塊

      按照民航局的總體規(guī)劃,未來空管將實現(xiàn)多氣象雷達覆蓋,在這過程,多個氣象雷達的組網(wǎng)將成為氣象雷達數(shù)據(jù)的主要來源。這種模式將使得數(shù)據(jù)覆蓋面更大、數(shù)據(jù)安全性更高、數(shù)據(jù)準(zhǔn)確性更強。而與此同時帶來了雷達數(shù)據(jù)融合組網(wǎng)的技術(shù)難點。設(shè)計上,首先模塊將定義雷達站點配置信息,并與此同時提供組網(wǎng)雷達可選數(shù)據(jù);其次對選擇雷達數(shù)據(jù)進行數(shù)據(jù)預(yù)處理;再之則對雷達數(shù)據(jù)進行統(tǒng)計平均并做坐標(biāo)轉(zhuǎn)換;最后進行拼圖處理。在這過程中,需要對雷達數(shù)據(jù)的強度進行自適應(yīng)調(diào)整、顯示范圍自適應(yīng)調(diào)整。與上述同理,系統(tǒng)核心在于預(yù)處理。在C#中定義List數(shù)據(jù)列表,并在定義其結(jié)構(gòu)為[站點標(biāo)示][距離][方位角],對于數(shù)據(jù)讀取時,需要進行插值算法處理,此時的單時數(shù)據(jù)拼接分析可以實現(xiàn)不同仰角和方位角的篩選。為了控制系統(tǒng)數(shù)據(jù)的準(zhǔn)確性可以在前端定義雷達數(shù)據(jù)方位角表,根據(jù)表進行映射處理。通常如若出現(xiàn)非連續(xù)數(shù)據(jù)可以在預(yù)處理上對其進行差值補償。在C#上可以采用反差圓補償方法。

      篇2

      專業(yè)

      計算機科學(xué)與技術(shù)

      學(xué)生姓名

      楊宇瀟

      學(xué)號

      181719251864

      一、 選題的背景、研究現(xiàn)狀與意義

      為什么大數(shù)據(jù)分析很重要?大數(shù)據(jù)分析可幫助組織利用其數(shù)據(jù)并使用它來識別新的機會。反過來,這將導(dǎo)致更明智的業(yè)務(wù)移動,更有效的運營,更高的利潤和更快樂的客戶。

      在許多早期的互聯(lián)網(wǎng)和技術(shù)公司的支持下,大數(shù)據(jù)在2000年代初的數(shù)據(jù)熱潮期間出現(xiàn)。有史以來第一次,軟件和硬件功能是消費者產(chǎn)生的大量非結(jié)構(gòu)化信息。搜索引擎,移動設(shè)備和工業(yè)機械等新技術(shù)可提供公司可以處理并持續(xù)增長的數(shù)據(jù)。隨著可以收集的天文數(shù)據(jù)數(shù)量的增長,很明顯,傳統(tǒng)數(shù)據(jù)技術(shù)(例如數(shù)據(jù)倉庫和關(guān)系數(shù)據(jù)庫)不適合與大量非結(jié)構(gòu)化數(shù)據(jù)一起使用。 Apache軟件基金會啟動了第一個大數(shù)據(jù)創(chuàng)新項目。最重要的貢獻來自Google,Yahoo,F(xiàn)acebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是復(fù)雜數(shù)據(jù)準(zhǔn)備和ETL的旗艦,可以為許多數(shù)據(jù)存儲或分析環(huán)境提供信息以進行深入分析。 Apache Spark(由加州大學(xué)伯克利分校開發(fā))通常用于大容量計算任務(wù)。這些任務(wù)通常是批處理ETL和ML工作負(fù)載,但與Apache Kafka等技術(shù)結(jié)合使用。

      隨著數(shù)據(jù)呈指數(shù)級增長,企業(yè)必須不斷擴展其基礎(chǔ)架構(gòu)以最大化其數(shù)據(jù)的經(jīng)濟價值。在大數(shù)據(jù)的早期(大約2008年),Hadoop被大公司首次認(rèn)可時,維護有用的生產(chǎn)系統(tǒng)非常昂貴且效率低下。要使用大數(shù)據(jù),您還需要適當(dāng)?shù)娜藛T和軟件技能,以及用于處理數(shù)據(jù)和查詢速度的硬件。協(xié)調(diào)所有內(nèi)容同時運行是一項艱巨的任務(wù),許多大數(shù)據(jù)項目都將失敗。如今,云計算已成為市場瞬息萬變的趨勢。因為各種規(guī)模的公司都可以通過單擊幾下立即訪問復(fù)雜的基礎(chǔ)架構(gòu)和技術(shù)。在這里,云提供了強大的基礎(chǔ)架構(gòu),使企業(yè)能夠勝過現(xiàn)有系統(tǒng)。

      二、 擬研究的主要內(nèi)容(提綱)和預(yù)期目標(biāo)

      隨著行業(yè)中數(shù)據(jù)量的爆炸性增長,大數(shù)據(jù)的概念越來越受到關(guān)注。 由于大數(shù)據(jù)的大,復(fù)雜和快速變化的性質(zhì),許多用于小數(shù)據(jù)的傳統(tǒng)機器學(xué)習(xí)算法不再適用于大數(shù)據(jù)環(huán)境中的應(yīng)用程序問題。 因此,在大數(shù)據(jù)環(huán)境下研究機器學(xué)習(xí)算法已成為學(xué)術(shù)界和業(yè)界的普遍關(guān)注。 本文主要討論和總結(jié)用于處理大數(shù)據(jù)的機器學(xué)習(xí)算法的研究現(xiàn)狀。 另外,由于并行處理是處理大數(shù)據(jù)的主要方法,因此我們介紹了一些并行算法,介紹了大數(shù)據(jù)環(huán)境中機器學(xué)習(xí)研究所面臨的問題,最后介紹了機器學(xué)習(xí)的研究趨勢,我們的目標(biāo)就是研究數(shù)據(jù)量大的情況下算法和模型的關(guān)系,同時也會探討大部分細(xì)分行業(yè)數(shù)據(jù)量不大不小的情況下算法的關(guān)系。

      三、 擬采用的研究方法(思路、技術(shù)路線、可行性分析論證等)

       1.視覺分析。大數(shù)據(jù)分析用戶包括大數(shù)據(jù)分析專業(yè)人士和一般用戶,但是大數(shù)據(jù)分析的最基本要求是視覺分析。視覺分析直觀地介紹了大數(shù)據(jù)的特征,并像閱讀照片的讀者一樣容易接受。 2.數(shù)據(jù)挖掘算法。大數(shù)據(jù)分析的理論中心是數(shù)據(jù)挖掘算法。不同的數(shù)據(jù)挖掘算法依賴于不同的數(shù)據(jù)類型和格式來更科學(xué)地表征數(shù)據(jù)本身。由于它們被全世界的統(tǒng)計學(xué)家所公認(rèn),因此各種統(tǒng)計方法(稱為真值)可以深入到數(shù)據(jù)中并挖掘公認(rèn)的值。另一方面是這些數(shù)據(jù)挖掘算法可以更快地處理大數(shù)據(jù)。如果該算法需要花費幾年時間才能得出結(jié)論,那么大數(shù)據(jù)的價值是未知的。 3.預(yù)測分析。大數(shù)據(jù)分析的最后一個應(yīng)用領(lǐng)域是預(yù)測分析,發(fā)現(xiàn)大數(shù)據(jù)功能,科學(xué)地建立模型以及通過模型吸收新數(shù)據(jù)以預(yù)測未來數(shù)據(jù)。 4.語義引擎。非結(jié)構(gòu)化數(shù)據(jù)的多樣化為數(shù)據(jù)分析提出了新的挑戰(zhàn)。您需要一套工具來分析和調(diào)整數(shù)據(jù)。語義引擎必須設(shè)計有足夠的人工智能,以主動從數(shù)據(jù)中提取信息。 5.數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理。大數(shù)據(jù)分析是數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理的組成部分。高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理確保了分析結(jié)果在學(xué)術(shù)研究和商業(yè)應(yīng)用中的可靠性和價值。大數(shù)據(jù)分析的基礎(chǔ)是前五個方面。當(dāng)然,如果您更深入地研究大數(shù)據(jù)分析,則還有更多特征,更深入,更專業(yè)的大數(shù)據(jù)分析方法。

      四、 論文(設(shè)計)的工作進度安排

      2020.03.18-2020.03.20 明確論文內(nèi)容,進行相關(guān)論文資料的查找與翻譯。2020.04.04-2020.04.27:撰寫開題報告 。

      2020.04.28-2020.04.30 :設(shè)計實驗。

      2020.05.01-2020.05.07 :開展實驗。

      2020.05.08-2020.05.15 :準(zhǔn)備中期檢查。

      2020.05.16-2020.05.23:根據(jù)中期檢查的問題,進一步完善實驗2020.05.24-2020.05.28 :完成論文初稿。

      2020.05.29-2020.06.26 :論文修改完善。

       

      五、 參考文獻(不少于5篇)

      1 . 王偉,王珊,杜小勇,覃雄派,王會舉.大數(shù)據(jù)分析——rdbms與mapreduce的競爭與共生 .計算機光盤軟件與應(yīng)用,2012.被引量:273.

      2 . 喻國明. 大數(shù)據(jù)分析下的中國社會輿情:總體態(tài)勢與結(jié)構(gòu)性特征——基于百度熱搜詞(2009—2 012)的輿情模型構(gòu)建.中國人民大學(xué)學(xué)報,2013.被引量:9. 3 . 李廣建,化柏林.大數(shù)據(jù)分析與情報分析關(guān)系辨析.中國圖書館學(xué)報,2014.被引量:16.

      4 . 王智,于戈,郭朝鵬,張一川,宋杰.大數(shù)據(jù)分析的分布式molap技術(shù) .軟件學(xué)報,2014.被引量:6.

      5 . 王德文,孫志偉.電力用戶側(cè)大數(shù)據(jù)分析與并行負(fù)荷預(yù)測 .中國電機工程學(xué)報,2015.被引量:19.

      6 . 江秀臣,杜修明,嚴(yán)英杰,盛戈皞,陳玉峰 ,郭志紅.基于大數(shù)據(jù)分析的輸變電設(shè)備狀態(tài)數(shù)據(jù)異常檢測方法 .中國電機工程學(xué)報,2015.被引量:8.

      7 . 喻國明. 呼喚“社會最大公約數(shù)”:2012年社會輿情運行態(tài)勢研究——基于百度熱搜詞的大 數(shù)據(jù)分析.編輯之友,2013.被引量:4.

      六、指導(dǎo)教師意見

       

       

       

       

       

       

       

       

      簽字:                  年     月    日

      七、學(xué)院院長意見及簽字

       

       

       

       

       

       

      篇3

      在過去的二十年里,商務(wù)智能與分析(Business intelligence and analytics,BI&A)與大數(shù)據(jù)相關(guān)的分析隨著大數(shù)據(jù)的發(fā)展在工業(yè)界及學(xué)術(shù)界變得越來越重要。來自于Bloomberg商業(yè)周刊的報道(2011)顯示,97%的超過1億市值的公司使用了商務(wù)分析技術(shù)。據(jù)麥肯錫全球機構(gòu)預(yù)測,到2018年,僅美國一年就會面臨14到1萬人的深度分析技術(shù)人才的需求,同時約有150萬數(shù)據(jù)分析經(jīng)理的缺口[1]。

      “智能”一詞自20世紀(jì)50年代被人工智能方面的研究人員提出并沿用至今。而商務(wù)智能(Business intelligence)則隨著信息技術(shù)的發(fā)展在20世紀(jì)90年代被企業(yè)界和學(xué)術(shù)界熟知。自2008年大數(shù)據(jù)的一系列論文在NATURE上發(fā)表,大數(shù)據(jù)分析技術(shù)已被應(yīng)用到從文本、計算機日志、傳感器、社交媒體等產(chǎn)生的大量非結(jié)構(gòu)化、體量巨大、類型繁多、價值低密度、要求快速處理的大數(shù)據(jù)。BI&A經(jīng)歷了BI&A1.0,BI&A2.0和BI&A3.0的演進。他們分別對應(yīng)面向基于關(guān)系數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù)、基于web的非結(jié)構(gòu)化數(shù)據(jù)、基于移動及傳感器的非結(jié)構(gòu)化大數(shù)據(jù)。因此,BI&A3.0是面向大數(shù)據(jù)分析的新興領(lǐng)域。

      BI&A3.0面向大數(shù)據(jù)可能產(chǎn)生的巨大影響,它涵蓋了電子商務(wù)及營銷智能、電子政務(wù)及政治2.0、科學(xué)與技術(shù)、智慧健康、安全及公共安保等方面。涉及的技術(shù)領(lǐng)域包括大數(shù)據(jù)分析,例如統(tǒng)計學(xué)習(xí)、序列及暫時挖局、空間挖掘、過程挖掘、網(wǎng)絡(luò)挖掘、web挖掘、基于列的數(shù)據(jù)庫挖掘、內(nèi)存數(shù)據(jù)庫、并行數(shù)據(jù)庫、云計算、Hadoop、Mapreduce,文本分析,例如靜態(tài)NLP信息抽取、主題模型、問答系統(tǒng)、選項挖掘、情緒及影響分析等。除此之外,還包括web分析、網(wǎng)絡(luò)分析、移動分析等大的技術(shù)分析方面。因此,BI&A3.0是未來管理科學(xué)與工程專業(yè)研究生培養(yǎng)的重要基礎(chǔ)和研究熱點。

      BI&A3.0的發(fā)展和應(yīng)用對管理科學(xué)與工程碩士研究生的培養(yǎng)提出了挑戰(zhàn)。主要表現(xiàn)在以下幾個方面,BI&A聚焦于理解、解釋、戰(zhàn)略并服務(wù)于組織。一些學(xué)科對BI&A的發(fā)展作出了貢獻,例如信息管理、計算機科學(xué)、統(tǒng)計學(xué)、管理學(xué)和市場營銷學(xué)。

      然而,目前的課程體系設(shè)置相對于商務(wù)分析技術(shù)及大數(shù)據(jù)的發(fā)展來說較滯后。雖然大部分學(xué)校針對學(xué)生的研究方法及研究能力的培養(yǎng)開設(shè)了一些BI&A課程,例如復(fù)雜系統(tǒng)分析與決策、隨機過程、應(yīng)用統(tǒng)計學(xué)、矩陣分析、Matlab、現(xiàn)代管理分析技術(shù)等。這些課程的設(shè)置對于面向大數(shù)據(jù)的BI&A3.0的研究及應(yīng)用來說尚有差距,缺乏系統(tǒng)性和前沿性。因此,面向BI&A3.0的研究生課程體系改革具有一定的現(xiàn)實意義及急迫性。

      1.教學(xué)研究的內(nèi)容及實踐內(nèi)容

      圍繞如何培養(yǎng)面向大數(shù)據(jù)及BI&A3.0數(shù)據(jù)分析及研究能力進行課程體系改革研究。借鑒國際國內(nèi)針對從BI&A1.0到BI&A3.0的知識體系及技能相關(guān)的教學(xué)改革,注重管理科學(xué)與工程的專業(yè)內(nèi)涵。

      (1)教學(xué)研究的內(nèi)容

      ①對國內(nèi)和國際當(dāng)前的面向BI&A3.0大數(shù)據(jù)分析能力培養(yǎng)的知識體系及技能進行梳理。

      ②對本校管理科學(xué)與工程專業(yè)主要的研究方向進行梳理,調(diào)研面向BI&A3.0大數(shù)據(jù)分析的具體能力和層次要求。

      ③結(jié)合國際國內(nèi)面向BI&A3.0的知識及技能體系與本校管理科學(xué)與工程主要的研究方向,提出面向BI&A3.0的管理類研究生課程體系改革的具體方案,包括課程設(shè)置、教學(xué)方式、考核方式、教學(xué)目的與要求。

      (2)實踐內(nèi)容

      通過設(shè)計與理論相配套的課程實驗、研討與課程內(nèi)容密切相關(guān)的科學(xué)問題、及時追蹤研究熱點,使得實踐環(huán)節(jié)成為提高研究生BI&A3.0創(chuàng)新和研究的推動器,同時也提高學(xué)生在實踐方面的興趣和動手能力。

      2.教學(xué)及實踐改革的目標(biāo)

      (1)教學(xué)目標(biāo)。通過建立面向BI&A3.0的管理類研究生課程教學(xué)體系,使得研究生掌握BI&A3.0的基本知識體系、知識網(wǎng)絡(luò)、基本研究能力,并最終培養(yǎng)研究生掌握面向BI&A3.0的創(chuàng)新能力。

      (2)實踐目標(biāo)。通過培養(yǎng)學(xué)生面向BI&A3.0的實踐技能,培養(yǎng)研究生面向BI&A3.0的實踐能力,包括文獻檢索能力、借助計算機的分析能力、數(shù)學(xué)建模能力、數(shù)據(jù)收集能力。

      3.課題研究要解決的問題

      圍繞面向BI&A3.0的管理類研究生課程體系的建設(shè),本課題將要解決如下問題:

      (1)如何劃定面向BI&A3.0的分析及計算機技能。面向BI&A3.0的分析及計算機技能涵蓋的面十分廣泛,本校管理類研究生所依附的學(xué)科方向及研究重點決定了這些技能需有選擇地納入。因此,需要解決具體納入哪些分析及計算機技能的培養(yǎng)。

      (2)如何結(jié)合研究方向與BI&A3.0的應(yīng)用。培養(yǎng)面向BI&A3.0大數(shù)據(jù)分析能力的目的是將BI&A3.0大數(shù)據(jù)分析應(yīng)用到具體的研究方向。物流、市場營銷、工程管理、運營管理等方向的研究需要將這些領(lǐng)域的知識和BI&A3.0的應(yīng)用結(jié)合起來才能達到培養(yǎng)的目的。

      4.擬采取的方法

      (1)借鑒國內(nèi)外先進的BI&A3.0教學(xué)教改經(jīng)驗。對國際和國內(nèi)BI&A3.0相關(guān)的教學(xué)教改文獻進行分析,并參加相關(guān)的國際國內(nèi)會議,與國內(nèi)外同行進行交流學(xué)習(xí)。

      (2)對本校管理類研究生現(xiàn)狀及改革反饋進行調(diào)研。通過以往教學(xué)實踐的總結(jié)、專家學(xué)者的討論、課題組集體研究的方式,調(diào)研適合本課程體系服務(wù)學(xué)科專業(yè)的研究生課程教學(xué)內(nèi)容、目標(biāo)、方法與手段。

      (3)對企業(yè)界進行調(diào)研發(fā)掘BI&A3.0實際應(yīng)用能力的需求。通過對企業(yè)界進行調(diào)研,發(fā)現(xiàn)潛在的BI&A3.0應(yīng)用方向。通過這些方向的發(fā)掘彌補課程體系設(shè)置的不足。

      篇4

      中圖分類號:G64 文獻標(biāo)識碼:A 文章編號:1009-3044(2016)33-0123-01

      Abstract : With the theme of declare big data and applied technology major, this thesis was written by author from telecommunications engineering academy. It has researched and analysed the composition of big data, related technologies, application requirement about the data mining and the problems has been solved by big data technology; Also it described what kind of related knowledge and skills need to be master by higher vocation education students in school, analysed the teaching qualities contrast with the needs of modern enterprises in details, by all means this thesis will focus on practically personnel training and explore the thinking of vocational colleges’ big data application technology major.

      Key words : big data background, professional technology, skills exploration

      隨著網(wǎng)絡(luò)和數(shù)據(jù)信息科學(xué)的發(fā)展,數(shù)據(jù)在量和復(fù)雜度上的爆炸式增長讓人類進入了大數(shù)據(jù)時代。根據(jù)IDC監(jiān)測,人類產(chǎn)生的數(shù)據(jù)量正在成指數(shù)及增長,大約每兩年翻一番,以此速度在2020年之前會持續(xù)保持下去。大量數(shù)據(jù)源的出現(xiàn)則導(dǎo)致了非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)爆發(fā)式的增長即數(shù)據(jù)結(jié)構(gòu)日趨復(fù)雜。大數(shù)據(jù)分析意味著企業(yè)能夠從這些新的數(shù)據(jù)中獲取新的洞察力,并將其與已知I務(wù)細(xì)節(jié)相融合。大數(shù)據(jù)對各種行業(yè)似乎產(chǎn)生了前所未有的巨大影響,從制造商到旅游業(yè),從產(chǎn)品設(shè)計到消費者行為分析,大數(shù)據(jù)能提供前所未有的信息,幫助公商行業(yè)做出最好的決策。公商行業(yè)對合格的數(shù)據(jù)分析師或者數(shù)據(jù)工程師的需求很大。

      人才市場需要會分?jǐn)?shù)據(jù)并以有用的方式呈現(xiàn)信息的雇員。根據(jù)市場需求,高職院校需要培養(yǎng)學(xué)生成為具有數(shù)據(jù)應(yīng)用技能的人才以滿足市場需求。我們研究方向是調(diào)查公司企業(yè)所需要的技能和大學(xué)教的數(shù)據(jù)分析技能,對比兩方面的技能的差別。人才需求調(diào)研裼昧宋示矸絞講杉專家的意,專家分為相關(guān)專業(yè)學(xué)科教授和企業(yè)內(nèi)本行業(yè)專家。

      大數(shù)據(jù)應(yīng)用技術(shù)專業(yè)的課程設(shè)置應(yīng)跟隨新技術(shù)的應(yīng)用,跟隨社會及企業(yè)需求,在新專業(yè)中重視培養(yǎng)專業(yè)技能和項目經(jīng)驗人才,課程設(shè)置應(yīng)貼合社會需求培養(yǎng)相應(yīng)的就業(yè)技能。需要研究關(guān)于合格的數(shù)據(jù)分析師或者數(shù)據(jù)工程師應(yīng)該具有什么資格及知識技能。調(diào)研的結(jié)果可以幫助學(xué)院開設(shè)有關(guān)大數(shù)據(jù)學(xué)科的學(xué)校及大數(shù)據(jù)有關(guān)的課程教材。

      調(diào)研內(nèi)容如下表格:

      綜上所述,十報告?zhèn)鬟_的是要重視高等職業(yè)教育,強調(diào)“要全面實施素質(zhì)教育,深化教育領(lǐng)域綜合改革,著力提高教育質(zhì)量,培養(yǎng)學(xué)生創(chuàng)新精神?!敝袊穆毥腆w系也在深入發(fā)展改革的過程中。本調(diào)研是針對高等職業(yè)院校的大數(shù)據(jù)應(yīng)用技術(shù)專業(yè)的課程設(shè)置的進行探究,通過對大數(shù)據(jù)應(yīng)用技術(shù)專業(yè)在市場人才需求的研究,對全面實施素質(zhì)教育,重視學(xué)生的創(chuàng)新能力的培養(yǎng)具有重要意義。

      參考文獻:

      [1] 王星.大數(shù)據(jù)分析:方法與應(yīng)用[M].清華大學(xué)出版社,2013.9.

      [2] 曹正鳳.數(shù)據(jù)分析統(tǒng)計基礎(chǔ)[M].電子工業(yè)出版社,2015.2.

      [3] 屈澤中.大數(shù)據(jù)時代數(shù)據(jù)分析[M].復(fù)旦大學(xué)出版社,電子工業(yè)出版社,2015.7.

      篇5

      doi:10.3969/j.issn.1673 - 0194.2015.20.032

      [中圖分類號]TP308;TP311.13 [文獻標(biāo)識碼]A [文章編號]1673-0194(2015)20-0041-01

      1 大數(shù)據(jù)

      大數(shù)據(jù)需要新處理模式才具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)的核心是預(yù)測,它把數(shù)學(xué)算法應(yīng)用到海量數(shù)據(jù)上來預(yù)測事件發(fā)生的可能性。大數(shù)據(jù)同時意味著思維的變革:①小數(shù)據(jù)分析的是隨機樣本,而大數(shù)據(jù)分析的是全體數(shù)據(jù),全面展示樣本無法表達的細(xì)節(jié)信息;②小數(shù)據(jù)分析追求精確性,而大數(shù)據(jù)分析具有混雜性,這意味著大數(shù)據(jù)的簡單算法比采樣數(shù)據(jù)的復(fù)雜算法更有效;③小數(shù)據(jù)分析關(guān)注因果關(guān)系,而大數(shù)據(jù)分析更關(guān)注相關(guān)關(guān)系,通過分析事物之間的關(guān)聯(lián)性,來預(yù)測事件的發(fā)展趨勢。

      2 Hadoop大數(shù)據(jù)平臺

      Hadoop是Apache的開源分布式計算平臺。受Google大數(shù)據(jù)論文的啟發(fā),Doug Cutting用JAVA實現(xiàn)了以MapReduce和HDFS為核心的Hadoop,并將源代碼完全貢獻出來。Hadoop充分發(fā)揮集群的計算和存儲能力,快速完成海量數(shù)據(jù)的處理。Hadoop采用分布式存儲來提高讀寫速度和擴大存儲容量;采用MapReduce整合分布式文件系統(tǒng)上的數(shù)據(jù),實現(xiàn)數(shù)據(jù)高速處理;采用存儲冗余數(shù)據(jù)來保證數(shù)據(jù)的安全性。

      2.1 HDFS

      HDFS是基于流模式訪問和處理超大文件的需求而開發(fā)的,它可以運行于廉價的商用服務(wù)器上,HDFS的主要特點有以下3個方面。①處理超大文件:在實際應(yīng)用中,HDFS已經(jīng)能夠用來存儲管理PB級的數(shù)據(jù)了。②流式訪問數(shù)據(jù):請求讀取整個數(shù)據(jù)集要比讀取一條記錄更加高效。③運行于廉價的商用機器集群上:HDFS對硬件要求較低,無需昂貴的高可用性機器。

      HDFS體系結(jié)構(gòu)中有兩類節(jié)點:NameNode和DataNode,NameNode負(fù)責(zé)管理集群中的執(zhí)行調(diào)度,DataNode是具體任務(wù)的執(zhí)行節(jié)點。當(dāng)執(zhí)行任務(wù)時,客戶端訪問NameNode獲取文件數(shù)據(jù)信息,與DataNode進行交互以訪問整個文件系統(tǒng)。HDFS向用戶提供類似POSIX的文件接口,開發(fā)者在編程時無需考慮NameNode和DataNode的實現(xiàn)細(xì)節(jié)。

      2.2 MapReduce

      MapReduce是Google公司的核心計算模型。在Hadoop中,用于執(zhí)行MapReduce任務(wù)的機器有兩種角色:JobTracker和TaskTracker,一個Hadoop集群中只有一個JobTracker,用于任務(wù)管理和調(diào)度。一般來說,為了減輕網(wǎng)絡(luò)傳輸?shù)膲毫?,?shù)據(jù)存儲在哪個節(jié)點上,就由哪個節(jié)點進行這部分?jǐn)?shù)據(jù)的計算。JobTracker監(jiān)控任務(wù)運行情況,當(dāng)一個TaskTracker出現(xiàn)故障時,JobTracker會將其承擔(dān)的任務(wù)轉(zhuǎn)交到另一個空閑的TaskTracker重新運行。TaskTracker用于執(zhí)行具體的工作。

      3 大數(shù)據(jù)在智能電網(wǎng)中的應(yīng)用構(gòu)想

      通過Hadoop大數(shù)據(jù)平臺,技術(shù)人員可實時觀察到全網(wǎng)范圍內(nèi)的電能流動狀態(tài)、電能負(fù)載熱區(qū)、設(shè)備故障高發(fā)區(qū)和客戶集中區(qū)等數(shù)據(jù),實現(xiàn)更加智能化的電網(wǎng)。具體包括以下4個方面。

      3.1 電網(wǎng)數(shù)據(jù)可視化

      在未來智能電網(wǎng)中,通過大數(shù)據(jù)分析融合調(diào)度、配電、輸電、發(fā)電和用電客戶數(shù)據(jù),實現(xiàn)實時和非實時數(shù)據(jù)的高度信息化集成,通過實時可視化運算分析,全面展示完整和精細(xì)的電網(wǎng)運行狀態(tài)圖,為管理層提供輔助決策支持和依據(jù)。

      3.2 電網(wǎng)負(fù)載趨勢預(yù)測

      在未來智能電網(wǎng)中,通過大數(shù)據(jù)分析電網(wǎng)負(fù)載的歷史數(shù)據(jù)和實時數(shù)據(jù),展示全網(wǎng)實時負(fù)載狀態(tài),預(yù)測電網(wǎng)負(fù)載變化趨勢,通過現(xiàn)代化管理技術(shù)的綜合應(yīng)用,提高設(shè)備的使用效率,降低電能損耗,使電網(wǎng)運行更加經(jīng)濟和高效。

      3.3 設(shè)備故障趨勢預(yù)測

      在未來智能電網(wǎng)中,通過大數(shù)據(jù)分析電網(wǎng)中部分故障設(shè)備的故障類型、歷史狀態(tài)和運行參數(shù)之間的相關(guān)性,預(yù)測電網(wǎng)故障發(fā)生的規(guī)律,評估電網(wǎng)運行風(fēng)險,開展實時預(yù)警,提前做好設(shè)備巡檢和消缺工作,為電網(wǎng)安全穩(wěn)定運行保駕護航。

      3.4 客戶電力需求預(yù)測

      在未來智能電網(wǎng)中,通過大數(shù)據(jù)分析電網(wǎng)客戶的用電數(shù)據(jù),預(yù)測區(qū)域用電和大客戶用電需求變化趨勢,針對客戶需求提前制訂高質(zhì)量的服務(wù)計劃,提升社會滿意度。

      4 結(jié) 語

      篇6

      在英國學(xué)者維克托?邁爾舍恩伯格和肯尼思?庫克耶合著的learning with big data: The future of education一書中,作者提到了基于大數(shù)據(jù)的雙回路學(xué)習(xí)。雙回路學(xué)習(xí)(Double-loop learning)會隨時用數(shù)據(jù)糾正自身的錯誤,同時利用反饋回路中獲得的大量數(shù)據(jù)來做其他很重要的事情。例如,可汗學(xué)院不僅有超過5000個多學(xué)科的視頻課程,它更有價值的地方在于積累學(xué)生如何學(xué)習(xí)的數(shù)據(jù),并實時反饋給教師和學(xué)生。雙回路學(xué)習(xí)把反饋、個性化學(xué)習(xí)、預(yù)測與干預(yù)結(jié)合在一起,成就了大數(shù)據(jù)時代的因材施教。

      開放大數(shù)據(jù)以減少數(shù)字鴻溝

      篇7

      中圖分類號:G642 文獻標(biāo)識碼:B

      文章編號:1671-489X(2016)18-0069-03

      Abstract The advent of the era of big data has brought new vitality

      and challenges for educational research. This paper uses bibliometric visualization software Cite Space to analyze thesis with key words data and education from CNKI based on Co-occurrence analysis of keywords, explore the hot issues in the field of educational research, summarize the research status and trends.

      Key words big data; CiteSpace; education

      1 引言

      近年來,教育領(lǐng)域研究者開始關(guān)注大數(shù)據(jù)背景下的教育管理模式轉(zhuǎn)變、教育決策研究等內(nèi)容,大量基于大數(shù)據(jù)背景的教育領(lǐng)域研究論文逐年增加。以“大數(shù)據(jù)”“教育”為主題關(guān)鍵詞在CNKI中國知網(wǎng)進行搜索,僅選擇SCI、EI、中文核心、CSSCI四類來源期刊截止到2015年12月出版的文獻,共檢索到417條數(shù)據(jù),從2010年開始呈現(xiàn)出逐年上升的趨勢。對這些文章進行瀏覽和篩選,選擇與本研究主題相關(guān)的論文,共247篇。對這247篇文章的關(guān)鍵詞信息進行研究,分析大數(shù)據(jù)的出現(xiàn)對教育領(lǐng)域研究熱點及發(fā)展趨勢的影響。

      2 教育領(lǐng)域熱點問題研究知識圖譜

      CiteSpace軟件是一款引文可視化分析軟件,著眼于分析科學(xué)知識中蘊含的潛在信息,通過可視化的手段呈現(xiàn)科學(xué)知識的結(jié)構(gòu)、規(guī)律和分布情況[1],能對文獻進行作者分析、關(guān)鍵詞共現(xiàn)分析、機構(gòu)分析、作者共被引分析、文獻共被引分析等。關(guān)鍵詞共現(xiàn)分析是一種內(nèi)容分析技術(shù),通過分析在同一個文本主題中的款目對(單詞或名詞短語對)共同出現(xiàn)的形式,確認(rèn)文本所代表的學(xué)科領(lǐng)域中相關(guān)主題的關(guān)系,進而探索分析學(xué)科領(lǐng)域的發(fā)展,發(fā)現(xiàn)學(xué)科的研究熱點和研究趨勢[2]。

      使用CiteSpace軟件對下載的文獻進行關(guān)鍵詞共現(xiàn)分析,生成圖1所示關(guān)鍵詞共現(xiàn)知識圖譜,分析大數(shù)據(jù)的出現(xiàn)對教育領(lǐng)域研究熱點和趨勢的影響。關(guān)鍵詞出現(xiàn)的頻次由圓圈代表的節(jié)點反映,圓圈越大,表明關(guān)鍵詞出現(xiàn)次數(shù)越多,最大圓圈代表的關(guān)鍵詞是“大數(shù)據(jù)”。

      根據(jù)圖1得到表1所示文獻關(guān)鍵詞、被引頻次、中心性等指標(biāo)數(shù)據(jù)。中心性代表共現(xiàn)程度的高低,中心性越強,表明該關(guān)鍵詞與其他關(guān)鍵詞共同出現(xiàn)的幾率就越大,也就表示該關(guān)鍵詞在共現(xiàn)網(wǎng)絡(luò)中的影響力越大。從知識理論角度分析,頻次和中心性高的關(guān)鍵詞一般是某一段時期內(nèi)研究者共同關(guān)注的問題,也就是研究的熱點和前沿。表1中,“大數(shù)據(jù)”是頻次最高也是中心性最高的關(guān)鍵詞;“學(xué)習(xí)分析”頻次為23,中心性為0.22;“數(shù)據(jù)挖掘”頻次為13,中心性為0.15,等等這些都是熱門的研究主題。

      3 大數(shù)據(jù)背景下教育領(lǐng)域的熱點研究

      依據(jù)圖1和表1所示結(jié)果,將大數(shù)據(jù)背景下教育領(lǐng)域的熱點研究總結(jié)為以下幾個方面。

      學(xué)習(xí)分析和數(shù)據(jù)挖掘 教育數(shù)據(jù)挖掘是數(shù)據(jù)挖掘在教育領(lǐng)域的新型應(yīng)用,主要目標(biāo)為知識發(fā)現(xiàn)、決策支持和推薦等。學(xué)習(xí)分析是測量、搜集、分析和報告學(xué)生及其相關(guān)的學(xué)習(xí)環(huán)境的數(shù)據(jù),用以理解和優(yōu)化學(xué)習(xí)過程和學(xué)習(xí)環(huán)境[3]。

      教育數(shù)據(jù)挖掘?qū)W⒂诩夹g(shù)層面,側(cè)重教育數(shù)據(jù)模型和模式的抽取,強調(diào)挖掘結(jié)果的自動化反饋;學(xué)習(xí)分析更注重研究有利于改善學(xué)習(xí)的干預(yù)措施。

      2012年,美國教育部了報告《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進教與學(xué)》[4],提出“數(shù)據(jù)驅(qū)動學(xué)校,分析變革教育”的大數(shù)據(jù)時代已經(jīng)來臨,要綜合運用教育數(shù)據(jù)挖掘和學(xué)習(xí)分析,構(gòu)建教育模型,探索教育變量,為教育教學(xué)提供有效支持。

      在CNKI中以“學(xué)習(xí)分析”和“教育數(shù)據(jù)挖掘”為關(guān)鍵詞進行檢索,得到圖2所示的文獻數(shù)量趨勢圖。如圖2所示,2010年以前的文獻數(shù)量很少,但2010年之后開始呈指數(shù)式增長;2016年1―2月份刊登的相關(guān)主題期刊論文已有5篇,可以預(yù)計本年度,學(xué)習(xí)分析和數(shù)據(jù)挖掘仍將是大數(shù)據(jù)背景下教育領(lǐng)域的研究重點和熱點之一。

      在線教育――興起與變革 以“在線教育”和“大數(shù)據(jù)”為關(guān)鍵詞進行搜索,得到圖3所示文獻數(shù)量趨勢圖。目前在線學(xué)習(xí)的發(fā)展趨勢主要有如下表現(xiàn)。

      1)移動學(xué)習(xí)是大方向:隨著無線網(wǎng)絡(luò)的覆蓋,移動終端特別是手機用戶的增多,移動學(xué)習(xí)逐漸發(fā)展起來。

      2)免費是大趨勢:目前在線學(xué)習(xí)存在各式各樣的免費現(xiàn)象,如免費試用、前期付費后期免費等形式。

      3)細(xì)化管理是要求:任何一種在線學(xué)習(xí)方式,都離不開資源開發(fā)、管理和優(yōu)化等工作,需要設(shè)定管理要求,細(xì)化規(guī)則。

      4)實現(xiàn)互動是必然:交互功能是在線學(xué)習(xí)軟件必然要設(shè)計的功能,大多數(shù)在線學(xué)習(xí)使用者表示學(xué)習(xí)過程中希望能有更多的互動交流。

      5)個性化學(xué)習(xí)是亮點:學(xué)習(xí)分析和教育數(shù)據(jù)挖掘的出現(xiàn),使得在線學(xué)習(xí)存儲的大量數(shù)據(jù)能夠被更快速分析和使用,學(xué)習(xí)者可以隨時掌握學(xué)習(xí)狀況,開發(fā)商也可以掌握學(xué)習(xí)者的興趣點、學(xué)習(xí)特征等,為學(xué)習(xí)者推薦或制訂個性化的學(xué)習(xí)方案。

      教育信息化 我國的教育信息化主要包含兩層含義:一是把提高信息素養(yǎng)納入教育目標(biāo),培養(yǎng)適應(yīng)信息社會的人才;二是把信息技術(shù)手段有效應(yīng)用于教育,注重教育信息資源的開發(fā)與利用。教育信息化的核心是教學(xué)信息化,要求在教育過程中較全面地運用現(xiàn)代信息技術(shù),促進教育改革,適應(yīng)信息化社會提出的新要求,深化教育改革,實施素質(zhì)教育。隨著大數(shù)據(jù)時代的來臨,教育信息化也在不斷進步,未來的教育信息化將在教育云平臺上進行展現(xiàn),現(xiàn)有的教育網(wǎng)、校園網(wǎng)將全面升級,實現(xiàn)互聯(lián)網(wǎng)、電信網(wǎng)、廣電網(wǎng)等跨平臺使用并支持移動設(shè)備。

      在CNKI中以“教育信息化”和“大數(shù)據(jù)”為關(guān)鍵詞進行檢索,2013年共有3篇學(xué)術(shù)論文,2015年共有10篇,研究主題包括大數(shù)據(jù)時代的信息化教學(xué)、教師培訓(xùn)、課程資源建設(shè)、教育輿情監(jiān)控等。

      教育決策 以“教育決策”為關(guān)鍵詞搜索到上千篇學(xué)術(shù)論文,以“教育決策”和“大數(shù)據(jù)”為關(guān)鍵詞,2013年以來共有8篇論文。大數(shù)據(jù)將在教育決策中發(fā)揮越來越重要的作用已成為共識,但如何利用大數(shù)據(jù)進行決策是目前面臨的難題,如何解決這個難題也是研究者重點關(guān)注的領(lǐng)域。教育決策離不開數(shù)據(jù),大數(shù)據(jù)背景下的數(shù)據(jù)更加復(fù)雜、凌亂,呈現(xiàn)碎片化的特征,并且摻雜一些虛假數(shù)據(jù),如何收集、選擇數(shù)據(jù),是第一步需要做的事情。大數(shù)據(jù)對于教育決策的價值在于為教育服務(wù),將數(shù)據(jù)轉(zhuǎn)化為支持決策的信息,需要數(shù)據(jù)分析者具備綜合、全面的數(shù)據(jù)分析素質(zhì)和能力。大數(shù)據(jù)的核心是預(yù)測,隨著教育信息化和在線學(xué)習(xí)的持續(xù)發(fā)展,數(shù)據(jù)呈爆炸式增長,需要對數(shù)據(jù)進行整合、分析,發(fā)現(xiàn)新知識,為教育優(yōu)化服務(wù)。

      4 數(shù)據(jù)推動決策

      傳統(tǒng)決策過程主要依靠決策者的經(jīng)驗,主觀性較強,或多或少存在一些不足,難以充分發(fā)現(xiàn)教育過程中的潛在問題,無法真正有效地優(yōu)化教學(xué)、提高學(xué)生表現(xiàn)。信息化推動了人類發(fā)展,逐漸成為人類生活必不可少的重要部分;信息化技術(shù)普及的同時,也產(chǎn)生前所未有的海量數(shù)據(jù)。大數(shù)據(jù)時代的來臨,顛覆了傳統(tǒng)數(shù)據(jù)分析方法;大數(shù)據(jù)背景

      下,利用數(shù)據(jù)挖掘方法發(fā)現(xiàn)問題、支持決策具有多方面的意義。

      1)優(yōu)化教學(xué)、提高教育質(zhì)量。教師若能充分利用學(xué)生學(xué)習(xí)數(shù)據(jù),分析學(xué)生學(xué)習(xí)過程,可以更加快速、便捷、有效地了解學(xué)生,發(fā)現(xiàn)不足之處并及時反饋,提供改進意見等[5]。

      2)為學(xué)校管理者制訂更加合理的教學(xué)計劃和方案提供決策支持?;跀?shù)據(jù)的教育決策能夠為管理者提供更加準(zhǔn)確、合理的決策支持?;跀?shù)據(jù)的教育決策能夠提供從數(shù)據(jù)到?jīng)Q策,實施決策后產(chǎn)生的數(shù)據(jù)再到?jīng)Q策的一種良性循環(huán)過程[6]。

      3)幫助地區(qū)甚至是國家級決策者進行科學(xué)判斷。數(shù)據(jù)推動決策具有相當(dāng)明顯的優(yōu)勢,能為決策者提供全方位的視角。大數(shù)據(jù)分析得到的結(jié)果具有全面性、多視角性、參考性強等特點,能夠更好地為決策者提供決策支持。

      5 結(jié)語

      上文所分析出的教育領(lǐng)域熱點研究問題,都緊緊圍繞“數(shù)據(jù)推動決策”這一主題,學(xué)習(xí)分析和教育挖掘是分析方法和技術(shù);在線教育是數(shù)據(jù)來源;教育信息化是信息化大數(shù)據(jù)環(huán)境;教育決策則是根據(jù)數(shù)據(jù)制定決策并運用于教育教學(xué)。可見,利用數(shù)據(jù)推動決策已成為教育領(lǐng)域在大數(shù)據(jù)背景下最為重要的研究問題之一。

      參考文獻

      [1]陳悅,陳超美,胡志剛.引文空間分析原理與應(yīng)用:Cite Space實用指南[M].北京:科學(xué)出版社,2014.

      [2]潘黎,王素.近十年來教育研究的熱點領(lǐng)域和前沿主題:基于八種教育學(xué)期刊2000-2009年刊載文獻關(guān)鍵詞共現(xiàn)知識圖譜的計量分析[J].教育研究,2011(2):47-53.

      [3]Siemens G. Learning and Knowledge Analytics-Knewton-the future of education?[EB/OL].[2011-04-17].http:///?p=126.

      篇8

      【摘 要】在云計算、物聯(lián)網(wǎng)等技術(shù)的推動下,世界已經(jīng)進入了一個“大數(shù)據(jù)”時代。本文旨在討論大數(shù)據(jù)時代下,圖書館與大數(shù)據(jù)相關(guān)的研究內(nèi)容、發(fā)展存在的問題以及總體發(fā)展趨勢。在大數(shù)據(jù)時代下,圖書館應(yīng)該進行服務(wù)模式創(chuàng)新與重構(gòu)、服務(wù)內(nèi)容創(chuàng)新與重構(gòu),從而解決發(fā)展瓶頸。

      關(guān)鍵詞 大數(shù)據(jù);圖書館;云計算

      0 引言

      在云計算、物聯(lián)網(wǎng)等技術(shù)的推動下,世界已經(jīng)進入了一個“大數(shù)據(jù)”時代。如何有效地利用大數(shù)據(jù)成為政府公共管理和企業(yè)界共同關(guān)注的問題,但這些數(shù)據(jù)集的規(guī)模往往超出數(shù)據(jù)處理者的能力。圖書館主要工作為實踐,研究和教育。以最大限度地利用人類的知識,促進專業(yè)的交流為責(zé)任。圖書館職業(yè)無法離開專業(yè)知識和信息,影響人類社會的可持續(xù)發(fā)展。數(shù)據(jù)是圖書館藏書的重要組成部分。數(shù)據(jù)作為原始類的產(chǎn)品,可以加工、整理、分析,最后提煉成人與人之間的生產(chǎn)和生活中發(fā)揮更大作用的信息和知識。因此,大數(shù)據(jù)主題是圖書館行業(yè)內(nèi)應(yīng)當(dāng)研究的問題,展示了圖書館界在信息社會求生存,謀發(fā)展能力的提升。本文旨在討論大數(shù)據(jù)時代下,圖書館與大數(shù)據(jù)相關(guān)的研究內(nèi)容、發(fā)展存在的問題以及總體發(fā)展趨勢。

      1 圖書館學(xué)研究教育與大數(shù)據(jù)現(xiàn)狀

      圖書館已有的研究中有文獻計量學(xué)等和大數(shù)據(jù)有關(guān)。研究人員為了促進信息科學(xué)與社會科學(xué)的進步,通過大型網(wǎng)絡(luò)規(guī)模的收集獲得數(shù)據(jù)和分析數(shù)據(jù)得出相關(guān)結(jié)論來實現(xiàn)目標(biāo)。由于大數(shù)據(jù)技術(shù)的應(yīng)用,傳統(tǒng)的文獻計量學(xué)的研究從過去只有簡單的描述性研究擴展到評估和預(yù)測的研究。圖書館學(xué)研究人員參與了很多相關(guān)的項目,例如,新西蘭的奧塔哥大學(xué)的圖書館承擔(dān)了研究數(shù)據(jù)管理項目的任務(wù),在麻省理工大學(xué)設(shè)立項目研究圖書館數(shù)據(jù)存儲、需求分析數(shù)據(jù)的管理,和傳播數(shù)據(jù),并完成數(shù)據(jù)收集保存標(biāo)準(zhǔn)的制定工作。烏里韋和麥克唐納在認(rèn)為數(shù)據(jù)監(jiān)測工作將從傳統(tǒng)的信息技術(shù)受益。Huwe建議采取政治手段,以促進圖書館和數(shù)據(jù)中心的發(fā)展,他認(rèn)為高等教育機構(gòu)應(yīng)該認(rèn)可圖書館對學(xué)術(shù)研究的支持。通過分析2008非常流行的“數(shù)字化監(jiān)控中心的生命周期模型”,希金斯提出,圖書館的“數(shù)據(jù)保留計劃”的生命周期可以被納入其數(shù)字機構(gòu)庫文件管理實體。此外,美國學(xué)者對館員在大數(shù)據(jù)環(huán)境中的作用和專業(yè)知識進行了調(diào)查,他們一致認(rèn)為圖書館可以在大數(shù)據(jù)時代承擔(dān)數(shù)據(jù)管理職責(zé)。謝菲爾德大學(xué)還安排了基礎(chǔ)的信息學(xué)專業(yè)課程。 2011年6月倫敦國際監(jiān)護教育論壇投入使用的,也給數(shù)字監(jiān)控領(lǐng)域的發(fā)展提供了一個機會。

      國內(nèi)目前的相關(guān)研究課題還處于剛起步的狀態(tài),CNKI與該主題相關(guān)的文章也只有寥寥幾篇。相比之下,國內(nèi)對“數(shù)據(jù)監(jiān)護權(quán)”的關(guān)注度更高這,主要是針對大學(xué)圖書館在這個專業(yè)領(lǐng)域展開更多的研究。這方面的論文在2012年之后有一個井噴式的增長,但總體來說,國內(nèi)相關(guān)文獻還相對較少,研究項目也幾乎沒有。

      2 圖書館的大數(shù)據(jù)特征

      在數(shù)字化時代,數(shù)據(jù)處理更容易、更快。圖書館的數(shù)據(jù)資源種類多、數(shù)量大、形式多樣。截至2008年底,CALS的文檔數(shù)據(jù)量達到180T,2010年底的國家圖書館數(shù)字資源總量達到480 T。目前,國家博物館進行維護之后,數(shù)字圖書館的非結(jié)構(gòu)化數(shù)據(jù)的存儲容量將非常大。總數(shù)字資源工程也達到108TB。由此看來,圖書館的數(shù)字資源總量已聚集為一個大的數(shù)據(jù)集。再次,圖書館自動化服務(wù)水平已發(fā)展到了一個新的階段。此外,用戶服務(wù)信息每日激增,用戶對服務(wù)的要求越來越高,圖書館要根據(jù)用戶的服務(wù)信息,做出相應(yīng)的調(diào)整。因此,根據(jù)各自限定的環(huán)境和條件,從大量的數(shù)據(jù)分析中挖掘出用戶當(dāng)前和未來的需求都非常迫切。

      3 大數(shù)據(jù)背景下圖書館發(fā)展趨勢

      3.1 服務(wù)模式創(chuàng)新與重構(gòu)

      目前,隨著科學(xué)技術(shù)的不斷發(fā)展,傳統(tǒng)的紙質(zhì)圖書館向電子、數(shù)字圖書館的轉(zhuǎn)變,因此圖書館服務(wù)的性質(zhì)已經(jīng)發(fā)生了很大的變化。傳統(tǒng)圖書館是點對點的服務(wù),而目前數(shù)字圖書館已經(jīng)成為綜合,服務(wù)的風(fēng)格和方法等方面都發(fā)生了很大的變化。在服務(wù)理念上,數(shù)字圖書館是基于數(shù)據(jù)服務(wù)的基礎(chǔ)上,在大數(shù)據(jù)的基礎(chǔ)上,從數(shù)據(jù)采集,智能服務(wù),提供綜合服務(wù),創(chuàng)新了服務(wù)模式。在大數(shù)據(jù)時代,數(shù)據(jù)資源是豐富的,每個圖書館可以利用網(wǎng)絡(luò)來收集大量的數(shù)據(jù)資源,基于資源共享提供各種數(shù)據(jù)管理的資源之間的無縫連接。

      3.2 服務(wù)內(nèi)容創(chuàng)新與重構(gòu)

      在大數(shù)據(jù)時代背景下,競爭已經(jīng)不再是一個簡單的數(shù)據(jù)資源所有權(quán)的競爭,而是在數(shù)據(jù)的結(jié)構(gòu)以及類型上、數(shù)據(jù)的開發(fā)以及利用上的競爭。從圖書館的角度來看,它是在大數(shù)據(jù)背景下,為了避免自己被邊緣化,就必須分析數(shù)據(jù),來進行相關(guān)的數(shù)據(jù)分析服務(wù)。分析數(shù)據(jù)庫業(yè)務(wù)有以下幾個方面:首先,圖書館需要建立自己的大數(shù)據(jù)分析,數(shù)據(jù)分析通常在現(xiàn)有的數(shù)據(jù),如讀者愛好的書籍等。另外是對讀者的分析,這類似企業(yè)和其他客戶群體參考提供的數(shù)據(jù)分析、競爭情報分析,但也有很大的區(qū)別,不同之處在于數(shù)據(jù)分析對象、用于數(shù)據(jù)分析和數(shù)據(jù)分析的目的等。對于這樣的數(shù)據(jù),可能不會被圖書館所擁有,所以它必然成為在這個行業(yè)發(fā)展的瓶頸限制,我們應(yīng)該想辦法解決這些問題。

      參考文獻

      [1]劉瓊.大數(shù)據(jù)環(huán)境下圖書館面臨的影響與挑戰(zhàn)[J].理論觀察,2013(8):112-113.

      [2]孫琳.大數(shù)據(jù)時代圖書館服務(wù)體系創(chuàng)新研究[J].理論觀察,2013(4):99-100.

      篇9

      大數(shù)據(jù)是在網(wǎng)絡(luò)環(huán)境下發(fā)展起來的一種大規(guī)模、多樣化的數(shù)據(jù)集,現(xiàn)代社會類型多樣、數(shù)量巨大,這些信息對大數(shù)據(jù)環(huán)境下圖書館信息服務(wù)發(fā)展帶來較大的發(fā)展機遇,同時也帶來較大的挑戰(zhàn),圖書館必須要認(rèn)清自身發(fā)展的優(yōu)勢和劣勢,從各個行業(yè)的大數(shù)據(jù)化形式下發(fā)掘發(fā)展經(jīng)營,從而更好的促進自身的發(fā)展。

      一、大數(shù)據(jù)發(fā)展概況

      大數(shù)據(jù)是一個相對比較抽象的概念,也被成為是海量數(shù)據(jù),主要依據(jù)存儲信息量的大小進行分段,目前沒有對大數(shù)據(jù)統(tǒng)一、權(quán)威的定義。實際上大數(shù)據(jù)并不是對數(shù)據(jù)規(guī)模的一種描述,而是一種在信息技術(shù)發(fā)展下類型繁多、數(shù)量大的多樣化數(shù)據(jù)中實施信息提取的一種思維。大數(shù)據(jù)具有一定的規(guī)律性,看似繁雜的數(shù)據(jù)背后隱藏著規(guī)律性信息,但是這些規(guī)律性必須在數(shù)據(jù)分析和整理后才能呈現(xiàn)出來。大數(shù)據(jù)的無偏性,大數(shù)據(jù)技術(shù)額度無偏差性是對一個學(xué)科基礎(chǔ)統(tǒng)計的表示,在這種思維下很多數(shù)據(jù)能夠通過抽樣的方式取得,在統(tǒng)計學(xué)信息的保障下有效提高數(shù)據(jù)的可靠性;大數(shù)據(jù)具有關(guān)聯(lián)性,大數(shù)據(jù)一般是由一個個數(shù)據(jù)庫、數(shù)據(jù)群累加而形成,數(shù)據(jù)越多價值越大,實施數(shù)據(jù)挖掘過程中必須要注重內(nèi)部信息和數(shù)據(jù)之間的關(guān)聯(lián)性,并提高其隱性價值;大數(shù)據(jù)具有開放性,開放性主要是指在預(yù)定的時期內(nèi)進行流程和科學(xué)方法的實施,分析大數(shù)據(jù)規(guī)律性得到科學(xué)的結(jié)論。

      二、大數(shù)據(jù)對圖書館信息服務(wù)的啟示

      大數(shù)據(jù)環(huán)境下,圖書館的經(jīng)營管理也必須利用大數(shù)據(jù)技術(shù)實施技能的深加工處理,大數(shù)據(jù)時代圖書館的數(shù)據(jù)分析、服務(wù)需求和處理等都需要社會信息機構(gòu)和合作,在云計算平臺的支持下利用大型數(shù)據(jù)實施服務(wù),任何一個圖書館都應(yīng)該積極在大數(shù)據(jù)環(huán)境下吸取經(jīng)營,從而促進自身更好的發(fā)展。

      2.1重視數(shù)據(jù)的收集和挖掘

      大數(shù)據(jù)時代,圖書館之間的競爭也比較激烈,除了文獻方面的競爭,同時數(shù)據(jù)方面的應(yīng)用競爭也比較大。目前數(shù)據(jù)分析和挖掘也逐漸成為圖書館信息服務(wù)的重要研究點。圖書館在發(fā)展總必須要以計算、模式識別、可視化等為基礎(chǔ)進行高級數(shù)據(jù)分析,拓展圖書館的服務(wù)。圖書館在數(shù)據(jù)挖掘和數(shù)據(jù)分析匯總首先必須要將數(shù)據(jù)關(guān)聯(lián)起來,在大數(shù)據(jù)環(huán)境下降結(jié)構(gòu)復(fù)雜、類型繁多的環(huán)境下建立數(shù)據(jù)之間的聯(lián)系。同時要充分利用這些數(shù)據(jù)信息,在圖書館系統(tǒng)內(nèi)積極挖掘具有價值的數(shù)據(jù),將處于休眠期的數(shù)據(jù)活起來,發(fā)掘其價值,將其應(yīng)用到實際工作中提高工作效率和服務(wù)質(zhì)量。另外提高數(shù)據(jù)挖掘的價值,充分利用數(shù)據(jù)分析技術(shù)從不完成、模糊的數(shù)中提取潛在知識和價值觀點。

      2.2構(gòu)建多維圖書館信息咨詢形式

      圖書館在實際發(fā)展中要想提高自身的競爭水平,必須提高服務(wù)質(zhì)量,從信息咨詢、數(shù)據(jù)挖掘及時等方面進行分析。從數(shù)據(jù)融合方面進行分析,大數(shù)據(jù)的提取和利用能夠大大提高信息咨詢服務(wù)態(tài)度,所以在發(fā)展中必須要將數(shù)據(jù)細(xì)化,從而提高服務(wù)深度。首先在細(xì)化數(shù)據(jù)的過程中可以提供一些數(shù)據(jù)能力服務(wù)和資源服務(wù),比如讀者數(shù)據(jù)的保存,在大數(shù)據(jù)時代可以通過一些專業(yè)維護的方式將海量信息匯集到信息咨詢平臺,從而最大程度的細(xì)化數(shù)據(jù)存儲需求。凌天在數(shù)據(jù)深度應(yīng)用方面,圖書館深度的數(shù)據(jù)服務(wù)和知識咨詢形式就是其深度的代表,傳統(tǒng)的信息咨詢服務(wù)比較注重知識庫數(shù)量的累積,但是這種僅僅追求數(shù)據(jù)庫規(guī)模的發(fā)展形式已經(jīng)不能適應(yīng)現(xiàn)代社會的發(fā)展,大數(shù)據(jù)環(huán)境下必須要進行信息深加工,融合數(shù)據(jù)信息,實現(xiàn)信息的增值服務(wù),從而提高圖書館的服務(wù)質(zhì)量。

      2.3深度分析用戶信息

      在大數(shù)據(jù)環(huán)境下,人與人之間的交流更加密切,人們在圖書館內(nèi)外的各種信息多保留由信息行為數(shù)據(jù),圖書館應(yīng)該對這些散落在各處的信息進行整理和綜合,并在此基礎(chǔ)上對大量的用戶信息進行挖掘和分析,提取有價值的信息。在對數(shù)據(jù)實時用戶行為分析的過程中,不僅僅關(guān)注信息行為整體行為方式,同時要從中找出影響圖書館利用行為價值的因素,反映客戶的應(yīng)用需求,廣泛的開展用戶行為分析,為圖書館用戶提供更加個性化的服務(wù)。

      結(jié)語:大數(shù)據(jù)發(fā)展環(huán)境下,圖書館的管理更應(yīng)該注重科技信息技術(shù)的利用,摒棄傳統(tǒng)發(fā)展觀念,積極利用數(shù)據(jù)挖掘技術(shù)和大數(shù)據(jù)理念,發(fā)掘客戶信息,了解客戶需求,從而為客戶指定符合其自身發(fā)展的服務(wù)方案,提高自身服務(wù)質(zhì)量。

      參 考 文 獻

      [1]毛曉燕. 大數(shù)據(jù)環(huán)境下圖書館信息服務(wù)走向分析[J]. 圖書館工作與研究,2014,03:72-75.

      篇10

      中圖分類號:G25 文獻標(biāo)識碼:A 文章編號:1672-3791(2016)10(b)-0150-02

      在科學(xué)技術(shù)的影響下,學(xué)術(shù)資源建設(shè)速度越來越快。例如:中國最大的學(xué)術(shù)資源建設(shè)商――中國知網(wǎng),已經(jīng)從期刊論文向國內(nèi)外期刊論文發(fā)展,在圖書資源收藏方面收集了大量資源,可以給行業(yè)機構(gòu)、學(xué)術(shù)等提供大量文獻。在此種發(fā)展形式下,數(shù)字圖書館承受了較大壓力,如何在未來發(fā)展中更好生存,已經(jīng)成為人員研究的主要問題,必須及時對其進行分析。

      1 國內(nèi)外研究與啟示

      1.1 國內(nèi)外相關(guān)論述對我國的影響

      隨著大數(shù)據(jù)時代的到來,人們對數(shù)據(jù)的需求量不斷增大。目前國外相關(guān)研究已經(jīng)從理念、技術(shù)和數(shù)據(jù)等方面進行了很多研究。美國加州大學(xué)伯克利分校圖書館的Huwe在《構(gòu)建數(shù)字D書館》一書中明確指出,大數(shù)據(jù)與數(shù)字化圖書館的發(fā)展方向吻合,可以借助數(shù)字圖書館進行信息采集和收集,進而挖掘用戶行為,幫助人們了解閱讀行為與信息的聯(lián)系。Borgman等人將嵌入式技術(shù)成功安裝于數(shù)字圖書館系統(tǒng)中,增加了數(shù)字圖書館功能,可以實現(xiàn)圖書分類、收集處理和關(guān)聯(lián)等各項操作,促進了數(shù)字圖書館與網(wǎng)絡(luò)技術(shù)的融合,發(fā)揮了大數(shù)據(jù)的作用。

      國內(nèi)研究人員曾建勛曾在《數(shù)字圖書館論壇》中明確指出,大數(shù)據(jù)時代將數(shù)據(jù)數(shù)字圖書館數(shù)據(jù)管理、收集等服務(wù)的深層次發(fā)展,對數(shù)字圖書館人員提出了較高要求。另外武漢大學(xué)生陳傳夫等也從理念、發(fā)展知識和財政投入機制等,分析了圖書館素質(zhì)等問題,并提出了相關(guān)應(yīng)對措施。

      從上述研究均可看出大數(shù)據(jù)對數(shù)字圖書館帶來的發(fā)展機遇和挑戰(zhàn),促進了數(shù)字圖書館和大數(shù)據(jù)的融合。為了促進高校圖書館和我國公共圖書館在大數(shù)據(jù)時代的發(fā)展,發(fā)揮數(shù)字圖書館在人們的生活或科學(xué)研究中的作用,必須深入思考,及時轉(zhuǎn)變觀念,提高數(shù)字圖書館的競爭力。

      1.2 啟示與思考

      從當(dāng)前的發(fā)展?fàn)顩r來看,學(xué)術(shù)資源建設(shè)商已經(jīng)在大數(shù)據(jù)時代取得了很大進展,不僅包含網(wǎng)絡(luò)資源與期刊,還涉及各種文獻資源,可以查找作者、文獻關(guān)系與學(xué)者等關(guān)系,給數(shù)字圖書館的發(fā)展帶來了很大壓力。所以圖書館相關(guān)人員必須提高思想認(rèn)識,將資源建設(shè)商帶來的威脅作為新的機遇。在實際工作中,必須積極吸取圖書館建設(shè)資源,擴展圖書館資源范疇,進行各種資源的有機結(jié)合,同時還要充分發(fā)揮資源價值,促使各種資源的整合,深入挖掘數(shù)據(jù)規(guī)律,認(rèn)真分析數(shù)據(jù)規(guī)律,發(fā)現(xiàn)數(shù)據(jù)潛在價值。從服務(wù)角度上分析,圖書館還要向眾多資源建設(shè)商學(xué)習(xí),從用戶角度探索問題,給用戶提供人性化服務(wù),滿足用戶對資源的需求。

      經(jīng)過分析發(fā)現(xiàn),大數(shù)據(jù)時代,必須要改變傳統(tǒng)的思維模式,形成適合數(shù)字圖書館發(fā)展的模式,適應(yīng)大數(shù)據(jù)時代的發(fā)展,充分利用大數(shù)據(jù)促進數(shù)字圖書館的發(fā)展,讓數(shù)字圖書館在人們的生活、學(xué)習(xí)和工作中發(fā)揮更大作用。

      2 淺析數(shù)字圖書館的大數(shù)據(jù)思維

      數(shù)字圖書館的大數(shù)據(jù)思維主要表示從大數(shù)據(jù)角度思考并分析數(shù)字圖書館發(fā)展中存在的問題,實現(xiàn)數(shù)字圖書館和大數(shù)據(jù)時代的有機融合,增加數(shù)字圖書館產(chǎn)品種類,提高數(shù)字圖書館服務(wù)水平。

      2.1 建設(shè)數(shù)字圖書館資源

      第一,擴大數(shù)字圖書館資源范圍。資源是數(shù)字圖書館發(fā)展的基礎(chǔ),也是提高數(shù)字圖書館服務(wù)質(zhì)量的主要方法。在長期發(fā)展中,圖書館非常重視資源建設(shè),主要是圖書、期刊及學(xué)位論文等資源。為了在大數(shù)據(jù)時代下發(fā)展,必須創(chuàng)新思維,引入一些數(shù)據(jù)庫資源或一些社會熱點信息等內(nèi)容,以用戶的搜索習(xí)慣作為數(shù)字圖書采集參考,深入挖掘各種數(shù)據(jù)之間的聯(lián)系,實現(xiàn)可再生資源的生產(chǎn)、收集和儲存,擴大數(shù)字圖書資源范圍。第二,提高數(shù)字圖書館資源整合度。大數(shù)據(jù)時代的主要特點是數(shù)據(jù)類型較復(fù)雜,單純的文本信息已經(jīng)不能被大數(shù)據(jù)時展用戶吸取,可以實現(xiàn)資源整合向綜合信息服務(wù)轉(zhuǎn)變。為了滿足不同用戶的需求,還可以實現(xiàn)文獻和政府等信息的整合,擴大社會資源和數(shù)字圖書館的聯(lián)系,將公眾最關(guān)注的問題引入到社會資源整合中。第三,加強數(shù)字圖書館資源加工深度。在大數(shù)據(jù)時代,雖然數(shù)字圖書館結(jié)構(gòu)信息具有較強的表現(xiàn)形式,但主要體現(xiàn)在資源庫內(nèi)部。在大數(shù)據(jù)時代下,必須及時擴展數(shù)字資源和外界的聯(lián)系,構(gòu)建全社會數(shù)字圖書館資源架構(gòu)。同時進行圖書館資源深度加工時,必須從知識結(jié)構(gòu)向知識建構(gòu)加工方向發(fā)展。例如:從圖書館文獻資源中分析知識結(jié)構(gòu),利用知識單位和文獻建立知識建構(gòu),形成新知識。

      2.2 靈活應(yīng)用數(shù)字圖書館技術(shù)

      大數(shù)據(jù)時代,數(shù)字圖書館技術(shù)已經(jīng)開始從處理局部數(shù)據(jù)向更廣的區(qū)域發(fā)展。從圖書館技術(shù)體系分析主要進行信息處理、組織架構(gòu)、分析預(yù)測、服務(wù)技術(shù)等操作。

      第一,應(yīng)用語義技術(shù)。大數(shù)據(jù)環(huán)境中可以采用語義實現(xiàn)復(fù)雜數(shù)據(jù)的聯(lián)系。當(dāng)前數(shù)字圖書面臨的主要問題是將語義加入數(shù)字文獻信息中。所以必須將本體技術(shù)、人工智能等先進技術(shù)應(yīng)用到實際工作中,讓數(shù)據(jù)間形成語義關(guān)系,促進收錄資源和知識挖掘等各項操作。目前語義技術(shù)已經(jīng)廣泛應(yīng)用到圖書領(lǐng)域中,如:漢語主題詞表、圖書分類法等均是依靠語義發(fā)展起來的。知識相互間的語義關(guān)系,不僅可以幫助用戶及時獲取知識,還可以獲得有用知識途徑。第二, 數(shù)據(jù)聚類技術(shù)。數(shù)據(jù)聚類是實現(xiàn)信息相互聚集的過程。在繁雜的數(shù)據(jù)中,只有靈活應(yīng)用聚類技術(shù),才能發(fā)揮信息服務(wù)、處理等各種功能。在大數(shù)據(jù)背景下,利用數(shù)據(jù)聚類可將不同數(shù)據(jù)劃分成相互聯(lián)系、主體相近的小數(shù)據(jù),給用戶信息檢索、選擇和分析提供很大方便,給用戶個性化服務(wù)提供了數(shù)據(jù)支持。第三,信息分析技術(shù)。大數(shù)據(jù)時代可以充分利用信息分析技術(shù)??梢詫⒋髷?shù)據(jù)技術(shù)融入到書籍圖書館中,拓展了數(shù)據(jù)分析工作,給用戶提供了高端服務(wù)。例如:聯(lián)機分析技術(shù)可給在線用戶提供數(shù)據(jù)支持;定量定性分析技術(shù)可以在數(shù)字圖書館中得到充分應(yīng)用。

      2.3 數(shù)字圖書館的定位

      第一,打破傳統(tǒng)資源框架束縛。大數(shù)據(jù)給圖書館提供了較廣闊的發(fā)展空間,滿足了用戶對不同信息的需求,在信息采集、收集和服務(wù)等方面均發(fā)生了變化。數(shù)字圖書館進行定位時,必須打破傳統(tǒng)資源框架,將數(shù)據(jù)理念融于到數(shù)字圖書館建設(shè)中,所以不僅要采用傳統(tǒng)的方法進行信息采集,還要進行網(wǎng)絡(luò)信息自動獲取,構(gòu)建語義關(guān)系、數(shù)據(jù)聯(lián)系等信息組織框架。

      第二,建立全方位服務(wù)信息。傳統(tǒng)圖書館主要進行文獻服務(wù)。數(shù)字化圖書館服務(wù)資源發(fā)生了變化,服務(wù)形式開始從被動化向主動化發(fā)展。一方面向全社會提供服務(wù);另一方面,提供全新資源服務(wù);最后不斷擴展服務(wù)與傳播方式,全面擴展數(shù)字圖書館服務(wù)。

      第三,定位數(shù)字圖書館員。大數(shù)據(jù)時代對圖書館員提出了更高要求,每館員都要有敏銳的數(shù)據(jù)分析能力;及時了解學(xué)術(shù)變化;掌握大數(shù)據(jù)分析技術(shù);熟練使用各種數(shù)據(jù)分析工具和軟件,準(zhǔn)確定位網(wǎng)絡(luò)資源,促進數(shù)字圖書館的發(fā)展。

      3 結(jié)語

      大數(shù)據(jù)時代給數(shù)字圖書館帶來了挑戰(zhàn),是數(shù)字圖書館的一種巨大轉(zhuǎn)型,可以擴展數(shù)字圖書館數(shù)據(jù)資源,提高數(shù)字圖書館服務(wù)功能;同時,還要不斷思考資源框架、技術(shù)應(yīng)用模式和服務(wù)功能,與廣大學(xué)術(shù)資源建設(shè)商共同發(fā)展。

      篇11

      0引言

      大數(shù)據(jù)作為繼云計算、物聯(lián)網(wǎng)之后IT行業(yè)又一顛覆性的技術(shù),備受人們的關(guān)注,大數(shù)據(jù)技術(shù)正從概念轉(zhuǎn)向?qū)嶋H的應(yīng)用,涌現(xiàn)出越來越多的大數(shù)據(jù)技術(shù)應(yīng)用成功案例,大數(shù)據(jù)的價值也在迅速增長。2015年,中國大數(shù)據(jù)市場規(guī)模達到115.9億元人民幣,增速達38%,預(yù)計2016~2018年中國大數(shù)據(jù)市場規(guī)模將維持40%左右的高速增長[1]。大數(shù)據(jù)時代的到來,使得軟件行業(yè)對人才的應(yīng)用能力和綜合素質(zhì)提出了更高的要求。咸陽師范學(xué)院作為咸陽市地方應(yīng)用型高校以服務(wù)咸陽地區(qū)經(jīng)濟社會發(fā)展為己任,肩負(fù)著培養(yǎng)滿足咸陽地方社會需求軟件人才的使命,需要把培養(yǎng)面向大數(shù)據(jù)時代的軟件工程專業(yè)人才作為戰(zhàn)略任務(wù)來抓。而課程體系的建設(shè)是軟件工程專業(yè)人才培養(yǎng)體系最重要的一個方面。本文通過分析我院傳統(tǒng)軟件工程專業(yè)課程體系,以及大數(shù)據(jù)時代下企業(yè)對軟件工程專業(yè)人才要求,找出大數(shù)據(jù)時代下軟件工程專業(yè)應(yīng)用型人才中課程體系存在的問題,探索出我院面向大數(shù)據(jù)環(huán)境的應(yīng)用型軟件工程人才中課程體系的建設(shè)。

      1我院軟件工程專業(yè)傳統(tǒng)的課程體系

      自我院計算機系成立以來,軟件工程專業(yè)一直是我院重點建設(shè)專業(yè)。2013年,“‘3+1’校企合作軟件人才培養(yǎng)模式創(chuàng)新實驗區(qū)”被確定為省級人才培養(yǎng)模式創(chuàng)新實驗區(qū)。一直以來,該專業(yè)以培養(yǎng)“厚基礎(chǔ)、強能力、高素質(zhì)”應(yīng)用型人才的為培養(yǎng)目標(biāo),以企業(yè)、市場需求為導(dǎo)向,重視實踐、技能和應(yīng)用能力的培養(yǎng),與尚觀科技、中軟國際、華清遠見、藍鷗科技等西安多家企業(yè)聯(lián)合,采取3+1嵌入式校企聯(lián)合教育培養(yǎng)模式,將課程教學(xué)、工程實踐、行業(yè)理念進行無縫結(jié)合。課程體系是一個專業(yè)所設(shè)置的課程相互間的分工與配合[2],主要反映在基礎(chǔ)課與專業(yè)課,理論課與實踐課,必修課與選修課之間的比例關(guān)系上[3]。地方應(yīng)用型本科院校的課程體系設(shè)計既要體現(xiàn)基礎(chǔ)知識的傳授,也要體現(xiàn)實踐能力的培養(yǎng),同時還要考慮學(xué)生的職業(yè)能力規(guī)劃發(fā)展問題。我院2013-2015級軟件工程專業(yè)課程體系結(jié)構(gòu)圖如圖1所示。圖12013-2015級軟件工程專業(yè)課程體系結(jié)構(gòu)圖從圖1可以看出通識教育必修課程的教學(xué)階段共3個半學(xué)年,主要涉及思想政治基礎(chǔ)知識、體育、人文歷史、外語應(yīng)用能力等;相關(guān)學(xué)科基礎(chǔ)類課程主要包括高數(shù)、線性代數(shù)、數(shù)字邏輯等數(shù)學(xué)類課程;本學(xué)科基礎(chǔ)類課程主要涉及程序設(shè)計語言、計算機網(wǎng)絡(luò)、操作系統(tǒng)、數(shù)據(jù)結(jié)構(gòu)、計算機組成原理等;專業(yè)技能教學(xué)階段強調(diào)對學(xué)生工程性、實用性、技術(shù)性和復(fù)合型能力的培養(yǎng),主要安排專業(yè)必修課程和專業(yè)選修課程。專業(yè)必修課程包括面向?qū)ο蟪绦蛟O(shè)計、軟件工程、數(shù)據(jù)庫原理與應(yīng)用、軟件設(shè)計與體系結(jié)構(gòu)、算法分析與設(shè)計等,專業(yè)選修課程包括Web軟件開發(fā)、Linux系統(tǒng)應(yīng)用程序開發(fā)、移動終端開發(fā)等。根據(jù)教育部專業(yè)教學(xué)指導(dǎo)委員會軟件工程行業(yè)規(guī)范[4],本著“輕理論,重實踐”的原則,我院在一定程度上壓縮理論課課時,增加實踐課課時,優(yōu)化專業(yè)課程體系結(jié)構(gòu)。我院2015級軟件工程專業(yè)的人才培養(yǎng)計劃中,各類課程學(xué)分設(shè)置與所占比例。

      2大數(shù)據(jù)時代企業(yè)對軟件工程專業(yè)人才的要求

      大數(shù)據(jù)時代所需要的人才是一定擁有數(shù)據(jù)處理、分析技術(shù)的,也就是對數(shù)據(jù)有敏銳的直覺和本質(zhì)的認(rèn)知、能夠運用統(tǒng)計分析、機器學(xué)習(xí)、分布式處理等技術(shù),從海量、復(fù)雜的數(shù)據(jù)中挖掘出有用的信息,以清晰易懂的形式傳達給決策者,并創(chuàng)造出豐富有價值的專業(yè)人士[5]。在大數(shù)據(jù)時代下,對軟件專業(yè)人才培養(yǎng),應(yīng)具備以下四個方面的技能。(1)具有厚實的數(shù)學(xué)、統(tǒng)計和計算機學(xué)科的相關(guān)知識,能夠根據(jù)具體案例大數(shù)據(jù)分析任務(wù)的要求,運用大數(shù)據(jù)處理、分析平臺,收集整理海量數(shù)據(jù)并加以分析,挖掘出有價值的信息。(2)掌握大數(shù)據(jù)處理技術(shù)及可視化工具,能根據(jù)具體任務(wù)的需求,對數(shù)據(jù)進行選擇、轉(zhuǎn)換、加工等處理操作,采用有效方法和模型對數(shù)據(jù)進行分析并形成數(shù)據(jù)分析報告,用易于用戶理解的方式,提供科學(xué)的決策依據(jù)。(3)熟悉行業(yè)知識、專門業(yè)務(wù)及流程,將大數(shù)據(jù)技術(shù)和企業(yè)文化相結(jié)合,充分利用大數(shù)據(jù)分析處理的結(jié)果,挖掘出海量數(shù)據(jù)中隱藏的價值并應(yīng)用于企業(yè)市場領(lǐng)域。(4)團隊合作精神,大量數(shù)據(jù)的收集整理、存儲、分析和處理,一個人是很難完成的,需要一個由團隊成員合理分工、共同協(xié)作完成。

      3大數(shù)據(jù)時代我院軟件工程專業(yè)傳統(tǒng)的課程體系存在的問題

      地方高校一直以來受傳統(tǒng)的“學(xué)術(shù)型”、“研究型”人才培養(yǎng)模式的影響較大,形成了適合于“精英教育”為培養(yǎng)研究型人才的課程體系,無法適應(yīng)以工程實踐能力、創(chuàng)新創(chuàng)業(yè)意識、新技術(shù)新方向為目標(biāo)的人才培養(yǎng),課程體系中理論教學(xué)占主導(dǎo)地位,實踐教學(xué)往往處于次要地位[6]。而目前處于大數(shù)據(jù)時代,信息技術(shù)的不斷創(chuàng)新、企業(yè)需求不斷變化、綜合型人才需求巨大等因素的影響下,傳統(tǒng)的培養(yǎng)研究型人才的課程體系,無法適應(yīng)大數(shù)據(jù)時代以工程實踐能力、創(chuàng)新創(chuàng)業(yè)意識、新技術(shù)新方向為目標(biāo)的人才培養(yǎng)。通過了解大數(shù)據(jù)環(huán)境企業(yè)對軟件工程人才的要求,分析我院2013-2015級軟件工程專業(yè)人才培養(yǎng)課程體系結(jié)構(gòu),發(fā)現(xiàn)存在以下問題:(1)缺少大數(shù)據(jù)技術(shù)方面的課程。傳統(tǒng)的課程體系中主要包括軟件工程專業(yè)一些傳統(tǒng)的課程,如數(shù)據(jù)結(jié)構(gòu)、軟件工程、軟件體系結(jié)構(gòu)等,而且課程內(nèi)容較陳舊,所開設(shè)的一些應(yīng)用軟件的學(xué)習(xí)不能緊密貼合行業(yè)和技術(shù)發(fā)展,軟件工程專業(yè)教育必須適應(yīng)互聯(lián)網(wǎng)時展和大數(shù)據(jù)技術(shù)的需求,關(guān)注企業(yè)發(fā)展及大數(shù)據(jù)系統(tǒng)的建設(shè)問題,以滿足企業(yè)對應(yīng)用型人才的需要。(2)實踐類課程學(xué)時所占比例較少。我院2015級軟件工程專業(yè)實踐類課程占總學(xué)時的10.8%,是因為傳統(tǒng)的課程體系注重知識傳授,而忽略了學(xué)生解決問題、動手能力的提高。地方高校在人才培養(yǎng)中重視理論內(nèi)容、計算機編程能力,而忽略學(xué)生探索能力的培養(yǎng),這些都不利于學(xué)生對新技術(shù)、新方向發(fā)展的把握,學(xué)生難以應(yīng)對各種層出不窮、錯綜復(fù)雜的海量數(shù)據(jù),很難挖掘出隱藏的數(shù)據(jù)價值并有效利用。(3)課程體系結(jié)構(gòu)設(shè)置方面,一是存在通識教育類課程教學(xué)階段持續(xù)時間長,一直到第7個學(xué)期,這就影響了后面專業(yè)類課程的學(xué)習(xí);二是專業(yè)基礎(chǔ)類分為專業(yè)必修和選修,沒有從課程教學(xué)階段不同來劃分,不能體現(xiàn)課程先后的銜接關(guān)系。

      4大數(shù)據(jù)時代我院軟件工程專業(yè)課程體系建設(shè)改革

      在大數(shù)據(jù)時代,軟件工程專業(yè)教育必須適應(yīng)企業(yè)發(fā)展和大數(shù)據(jù)行業(yè)的需求。教學(xué)內(nèi)容的設(shè)置應(yīng)與行業(yè)需求接軌,根據(jù)我院學(xué)生特點調(diào)整2016級軟件工程專業(yè)課程體系。具體做了以下幾點的調(diào)整。(1)課程體系結(jié)構(gòu)更合理。一是通識教育類課程的調(diào)整。一方面將教學(xué)階段全部調(diào)整到第1、2學(xué)年完成,這樣在第3學(xué)年學(xué)生就可以重點學(xué)習(xí)專業(yè)類技能課程;另一方面此部分增加了大學(xué)生心理健康和創(chuàng)新創(chuàng)業(yè)教育課程,主要可以加強學(xué)生團隊合作精神的培養(yǎng)。二是專業(yè)類課程結(jié)構(gòu)的調(diào)整。將專業(yè)類課程分為專業(yè)(學(xué)科)基礎(chǔ)課程和專業(yè)技能課程兩大類,專業(yè)(學(xué)科)基礎(chǔ)課程主要包括數(shù)學(xué)類課程、計算機導(dǎo)論、程序設(shè)計語言、數(shù)據(jù)結(jié)構(gòu)、操作系統(tǒng)、軟件工程、運籌學(xué)、數(shù)據(jù)分析與處理。專業(yè)技能課程又分為專業(yè)核心課程和專業(yè)方向課,專業(yè)核心課程包括面向?qū)ο蟪绦蛘Z言類、軟件設(shè)計模式、算法分析與設(shè)計、軟件測試等軟件工程專業(yè)要求的核心課程,而專業(yè)方向課分為3個方向:大數(shù)據(jù)分析、Web技術(shù)應(yīng)用、移動終端開發(fā),鼓勵學(xué)生在學(xué)好專業(yè)基礎(chǔ)和核心課程的同時,發(fā)現(xiàn)自己專業(yè)類的興趣,選擇一個自己感興趣的方向集中學(xué)習(xí),大數(shù)據(jù)分析方向是重點向?qū)W生推薦。在教學(xué)階段安排上,一般專業(yè)(學(xué)科)基礎(chǔ)課程要優(yōu)先于專業(yè)技能課程,這樣可以讓學(xué)生在掌握了學(xué)科、專業(yè)基礎(chǔ)上,充分了解軟件工程專業(yè)技能的訓(xùn)練。(2)增加了大數(shù)據(jù)技術(shù)方面的課程。在新調(diào)整的課程體系中,專業(yè)(學(xué)科)基礎(chǔ)課程和專業(yè)技能課程都增加了大數(shù)據(jù)相關(guān)內(nèi)容?;A(chǔ)課設(shè)置增添運籌學(xué)、數(shù)據(jù)分析與處理等,使學(xué)生了解大數(shù)據(jù)行業(yè)基礎(chǔ)知識,激發(fā)學(xué)生對大數(shù)據(jù)行業(yè)發(fā)展及大數(shù)據(jù)應(yīng)用前景的興趣;專業(yè)技能課設(shè)置了數(shù)據(jù)倉庫與數(shù)據(jù)挖掘、大數(shù)據(jù)統(tǒng)計分析與應(yīng)用、數(shù)據(jù)挖掘算法與應(yīng)用等前沿科學(xué)技術(shù)相關(guān)課程以滿足大數(shù)據(jù)系統(tǒng)建設(shè)與應(yīng)用的需要,培養(yǎng)更多企業(yè)需要的大數(shù)據(jù)管理分析軟件專業(yè)人才。院級選修課鼓勵研究大數(shù)據(jù)方向的教師積極申請大數(shù)據(jù)案例分析、大數(shù)據(jù)安全與隱私保護、HadoopMap/Reduce技術(shù)原理與應(yīng)用等實用性強的課程,以補充對大數(shù)據(jù)方向特別感興趣學(xué)生的學(xué)習(xí)內(nèi)容。(3)增加實踐類課程所占比例。相比較2015級,以培養(yǎng)地方應(yīng)用型人才為總目標(biāo),實踐類課程課時由19課時增加到28課時,所占總課時比例提高了約50%。實踐類課程包括校內(nèi)(課程設(shè)計和實訓(xùn))和校外(見習(xí)、實習(xí)、實訓(xùn)、畢業(yè)論文),種類多樣化,使得學(xué)生多方面提升自己解決問題和動手操作能力。針對校內(nèi)實驗我院教師結(jié)合大數(shù)據(jù)教學(xué)實驗平臺,根據(jù)課程內(nèi)容設(shè)計實驗項目,從初級到高級,安排合理的階梯式學(xué)習(xí),實驗內(nèi)容持續(xù)更新,加入最新、主流的分析建模工具和挖掘算法,學(xué)生在免費、開放的平臺環(huán)境下進行大數(shù)據(jù)構(gòu)建、存儲、分析統(tǒng)計等實驗內(nèi)容,使學(xué)生熟練掌握Ha-doop、HBase、Spark等關(guān)鍵技術(shù),提高大數(shù)據(jù)理論分析及技術(shù)應(yīng)用的能力。做好校內(nèi)實踐的同時,校外實踐更是尤為重要,首先在實習(xí)、實訓(xùn)企業(yè)的選擇上,盡量選擇“口碑好、技術(shù)強、理念先進”的單位,目前我院已與鄰近城市西安與尚觀科技、中軟國際、華清遠見、藍鷗科技等西安多家企業(yè)聯(lián)合,第四學(xué)年分批組織學(xué)生到合作企業(yè)的實訓(xùn)基地參加真實的實訓(xùn)項目,體驗IT企業(yè)真實的工作環(huán)境、工作流程和企業(yè)文化,了解互聯(lián)網(wǎng)大數(shù)據(jù)、零售大數(shù)據(jù)、金融大數(shù)據(jù)等領(lǐng)域知識,學(xué)習(xí)海量數(shù)據(jù)搜集、分析、存儲技術(shù),引導(dǎo)學(xué)生按照項目的需求、總體設(shè)計、詳細(xì)設(shè)計、編碼、測試等流程完成實踐內(nèi)容,規(guī)范化文檔和代碼的編寫,培養(yǎng)學(xué)生的行業(yè)、職業(yè)素養(yǎng)。

      5應(yīng)用效果

      目前應(yīng)用此方案有2016和2017級兩級學(xué)生,雖然這兩級學(xué)生都還沒有就業(yè),但在創(chuàng)新應(yīng)用能力方面都較2015級之前學(xué)生有顯著提升。近兩年有10余組學(xué)生團隊獲得國家級、省級、校級“大學(xué)生科研訓(xùn)練項目”立項資助,有8名同學(xué)獲得“藍橋杯”程序設(shè)計大賽國家級二等獎、三等獎,省級一等獎2項,二等獎、三等獎多項。2016年有兩隊學(xué)生獲得陜西省高?!盎ヂ?lián)網(wǎng)+”創(chuàng)新創(chuàng)業(yè)大賽三等獎,一隊學(xué)生獲得咸陽市青年創(chuàng)業(yè)大賽二等獎。數(shù)十名學(xué)生在核心期刊上公開發(fā)表學(xué)術(shù)論文。從目前取得的成績來看,課程體系結(jié)構(gòu)的調(diào)整,使得學(xué)生不僅獲得扎實的理論知識,而且具備了過硬的實踐和創(chuàng)新能力,我院軟件工程專業(yè)畢業(yè)生一定會深受用人單位喜歡。

      6總結(jié)

      針對大數(shù)據(jù)時代下地方本科院校軟件專業(yè)人才培養(yǎng)中課程體系存在的一些問題,筆者分析了大數(shù)據(jù)環(huán)境對軟件工程專業(yè)人才的要求,以地方本科院校咸陽師范學(xué)院為例,改革調(diào)整了課程體系,主要在在理論教學(xué)和實踐教學(xué)中增加大數(shù)據(jù)相關(guān)理論及技術(shù)內(nèi)容,通過近年來的探索與實踐,此課程體系結(jié)構(gòu)有效提高了學(xué)生的創(chuàng)新應(yīng)用能力,為大數(shù)據(jù)時代企業(yè)發(fā)展培養(yǎng)了高水平、高素質(zhì)的大數(shù)據(jù)分析人才,新的課程體系適應(yīng)了大數(shù)據(jù)環(huán)境下軟件工程人才的培養(yǎng)。

      參考文獻

      [1]孫琳.大數(shù)據(jù)應(yīng)用的創(chuàng)新路徑[N].人民政協(xié)報,2016-05-17.

      [2]潘正高.地方應(yīng)用型高校軟件工程專業(yè)課程體系的研究[J].西昌學(xué)院學(xué)報,2017,31(3):94-97.

      [3]潘怡.應(yīng)用型本科院校軟件工程專業(yè)課程體系設(shè)置探討[J].長沙大學(xué)學(xué)報,2008,22(5):98-100.