日日夜夜撸啊撸,欧美韩国日本,日本人配种xxxx视频,在线免播放器高清观看

數據挖掘技術探討論文大全11篇

時間:2023-03-25 10:46:30

緒論:寫作既是個人情感的抒發,也是對學術真理的探索,歡迎閱讀由發表云整理的11篇數據挖掘技術探討論文范文,希望它們能為您的寫作提供參考和啟發。

數據挖掘技術探討論文

篇(1)

專業

計算機科學與技術

學生姓名

楊宇瀟

學號

181719251864

一、 選題的背景、研究現狀與意義

為什么大數據分析很重要?大數據分析可幫助組織利用其數據并使用它來識別新的機會。反過來,這將導致更明智的業務移動,更有效的運營,更高的利潤和更快樂的客戶。

在許多早期的互聯網和技術公司的支持下,大數據在2000年代初的數據熱潮期間出現。有史以來第一次,軟件和硬件功能是消費者產生的大量非結構化信息。搜索引擎,移動設備和工業機械等新技術可提供公司可以處理并持續增長的數據。隨著可以收集的天文數據數量的增長,很明顯,傳統數據技術(例如數據倉庫和關系數據庫)不適合與大量非結構化數據一起使用。 Apache軟件基金會啟動了第一個大數據創新項目。最重要的貢獻來自Google,Yahoo,Facebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是復雜數據準備和ETL的旗艦,可以為許多數據存儲或分析環境提供信息以進行深入分析。 Apache Spark(由加州大學伯克利分校開發)通常用于大容量計算任務。這些任務通常是批處理ETL和ML工作負載,但與Apache Kafka等技術結合使用。

隨著數據呈指數級增長,企業必須不斷擴展其基礎架構以最大化其數據的經濟價值。在大數據的早期(大約2008年),Hadoop被大公司首次認可時,維護有用的生產系統非常昂貴且效率低下。要使用大數據,您還需要適當的人員和軟件技能,以及用于處理數據和查詢速度的硬件。協調所有內容同時運行是一項艱巨的任務,許多大數據項目都將失敗。如今,云計算已成為市場瞬息萬變的趨勢。因為各種規模的公司都可以通過單擊幾下立即訪問復雜的基礎架構和技術。在這里,云提供了強大的基礎架構,使企業能夠勝過現有系統。

二、 擬研究的主要內容(提綱)和預期目標

隨著行業中數據量的爆炸性增長,大數據的概念越來越受到關注。 由于大數據的大,復雜和快速變化的性質,許多用于小數據的傳統機器學習算法不再適用于大數據環境中的應用程序問題。 因此,在大數據環境下研究機器學習算法已成為學術界和業界的普遍關注。 本文主要討論和總結用于處理大數據的機器學習算法的研究現狀。 另外,由于并行處理是處理大數據的主要方法,因此我們介紹了一些并行算法,介紹了大數據環境中機器學習研究所面臨的問題,最后介紹了機器學習的研究趨勢,我們的目標就是研究數據量大的情況下算法和模型的關系,同時也會探討大部分細分行業數據量不大不小的情況下算法的關系。

三、 擬采用的研究方法(思路、技術路線、可行性分析論證等)

 1.視覺分析。大數據分析用戶包括大數據分析專業人士和一般用戶,但是大數據分析的最基本要求是視覺分析。視覺分析直觀地介紹了大數據的特征,并像閱讀照片的讀者一樣容易接受。 2.數據挖掘算法。大數據分析的理論中心是數據挖掘算法。不同的數據挖掘算法依賴于不同的數據類型和格式來更科學地表征數據本身。由于它們被全世界的統計學家所公認,因此各種統計方法(稱為真值)可以深入到數據中并挖掘公認的值。另一方面是這些數據挖掘算法可以更快地處理大數據。如果該算法需要花費幾年時間才能得出結論,那么大數據的價值是未知的。 3.預測分析。大數據分析的最后一個應用領域是預測分析,發現大數據功能,科學地建立模型以及通過模型吸收新數據以預測未來數據。 4.語義引擎。非結構化數據的多樣化為數據分析提出了新的挑戰。您需要一套工具來分析和調整數據。語義引擎必須設計有足夠的人工智能,以主動從數據中提取信息。 5.數據質量和數據管理。大數據分析是數據質量和數據管理的組成部分。高質量的數據和有效的數據管理確保了分析結果在學術研究和商業應用中的可靠性和價值。大數據分析的基礎是前五個方面。當然,如果您更深入地研究大數據分析,則還有更多特征,更深入,更專業的大數據分析方法。

四、 論文(設計)的工作進度安排

2020.03.18-2020.03.20 明確論文內容,進行相關論文資料的查找與翻譯。2020.04.04-2020.04.27:撰寫開題報告 。

2020.04.28-2020.04.30 :設計實驗。

2020.05.01-2020.05.07 :開展實驗。

2020.05.08-2020.05.15 :準備中期檢查。

2020.05.16-2020.05.23:根據中期檢查的問題,進一步完善實驗2020.05.24-2020.05.28 :完成論文初稿。

2020.05.29-2020.06.26 :論文修改完善。

 

五、 參考文獻(不少于5篇)

1 . 王偉,王珊,杜小勇,覃雄派,王會舉.大數據分析——rdbms與mapreduce的競爭與共生 .計算機光盤軟件與應用,2012.被引量:273.

2 . 喻國明. 大數據分析下的中國社會輿情:總體態勢與結構性特征——基于百度熱搜詞(2009—2 012)的輿情模型構建.中國人民大學學報,2013.被引量:9. 3 . 李廣建,化柏林.大數據分析與情報分析關系辨析.中國圖書館學報,2014.被引量:16.

4 . 王智,于戈,郭朝鵬,張一川,宋杰.大數據分析的分布式molap技術 .軟件學報,2014.被引量:6.

5 . 王德文,孫志偉.電力用戶側大數據分析與并行負荷預測 .中國電機工程學報,2015.被引量:19.

6 . 江秀臣,杜修明,嚴英杰,盛戈皞,陳玉峰 ,郭志紅.基于大數據分析的輸變電設備狀態數據異常檢測方法 .中國電機工程學報,2015.被引量:8.

7 . 喻國明. 呼喚“社會最大公約數”:2012年社會輿情運行態勢研究——基于百度熱搜詞的大 數據分析.編輯之友,2013.被引量:4.

六、指導教師意見

 

 

 

 

 

 

 

 

簽字:                  年     月    日

七、學院院長意見及簽字

 

 

 

 

 

 

篇(2)

【中圖分類號】G420 【文獻標識碼】A 【論文編號】1009―8097(2009)06―0104―03

數據挖掘技術可以從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中人們事先不知道的,但又是潛在有用的信息和知識的過程。通過這種技術把獲取的信息和知識提供給決策支持系統。這種技術已廣泛地用于各種應用,包括商務管理、生產控制、市場分析、工程設計和科學探索等[1,2,3] ,隨著信息技術的發展,數據挖掘在網絡教學中的應用研究也逐漸深入[4,5,6] 。網絡教學成為一種新型教學手段,理論上學習者可以在任何時間、任何地點以任何形式、從任何章節開始學習任何內容,實現個性化學習。但在網絡教學實施過程中,教學內容和組織活動卻不能隨著學生的學習狀況發生動態變化,導致了教與學脫離的現象,教學效果達不到預期效果。因此可以利用該技術對收集到的與學生學習相關的歷史數據進行分析,從而可以為教師深入理解學生的實際學習情況,制定相關的教學目標供 其學習提供有力的決策支持,是提升教學效果的有力手段。

一 擬解決的關鍵問題

本文探討 在現有的網絡教學平臺基礎上,以在教學信息數據庫中采集到的學生學習記錄為樣本,應用數據挖掘技術,挖掘有用的規則,探討學生的學習習慣, 學習興趣和學習成績間的關系,從而及時了解學生對每一章節知識的掌握程度并根據每個學生的情況制定下一章節的教學目標,為其提供不同的教學內容,從而使教學更適合學生

個性的發展,實現網絡分層教學,最終實現教學過程的動態調節。

二 數據預處理

由于人為的原因、設備的故障及數據傳輸中的錯誤,導致現實世界的數據含有臟的、不完整的和不一致的數據。數據預處理技術可以檢測數據異常,調整數據并歸約待分析的數據,從而改進數據的質量,提高其后挖掘過程的精度和性能。

本文數據源于《數據結構》網絡教學課程,48節理論課,24節實驗,4.5個學分。學生111人,其中06級信息與計算科學專業班合計64人,07級地理信息系統專業一個班計47人。針對1節提出的問題,本文通過對網絡教學平臺教學信息數據庫中的學生信息表、學生學習進度表、測試信息表等進行數據挖掘,說明其在網絡教學中的應用。各表結構如表1至表3所示(本文中學生信息經過掩飾處理)。

其中內容是指客觀性考題,如單項選擇題等。主觀性考題,如算法設計之類考題可以以教師組織的BBS討論為依據評分,在此以有效討論次數(有實質性的討論內容)計算。

首先去除數據表中的冗余信息,如學生信息表中除學號信息以外的各分項信息,每一章節學習進度表中的節、日期信息,每章測試信息表中的題號、內容、答案等信息;對某些匯總數據項進行離散化處理,如將測試信息表中得分匯總后分為(0,59),(60,85),(85,100)等 3個組并概化為不及格,合格和優秀三個層次;學習時間匯總后分為(0,2),(2,4),(4,6),(6,)等 四個組,單位:小時;學習次數匯總后分為(0,3),(3,6),(6,)等 三個組,BBS討論匯總后分為(0,3),(3,6),(6,)并 概化為積極,參與和不積極三個層次[7];同時下一章節的教學目標制定為三個層次,內容呈現分別表示為A類、B類、C類三個層次的內容,提供給學生學習。然后檢查數據的完整性及數據的一致性,對其中的噪音數據進行處理。經過數據預處理工作,得到一張描述學生學習過程信息的數據表格,表4是我們整理出的某一章節的學生學習情況數據。

三 數據挖掘過程

主要是利用關聯分析、序列模式分析、分類分析和聚類分析等分析方法對數據庫中的潛在規則進行挖掘。針對1節中提出的問題,根據國內外對各類模式挖掘算法的研究[8,9],本文采用FP-Tree關聯規則挖掘算法進行關聯規則挖掘和用于 分類模型判定樹歸納算法進行數據挖掘。

1 關聯規則挖掘

關聯規則挖掘可以發現大量數據中項集之間有趣的關聯或相關聯系,通過這種挖掘技術對表4進行挖掘,可以發現學生的學習時間、學習次數及網絡課堂討論和學習效果之間的關系,使教師了解學生的網上學習行為和目標掌握程度,幫助教師調整教學計劃,如設計有意義的討論課題提升學生的學習興趣,從而間接增加學生的學習時間和學習次數。

首先給出關聯規則的形式化描述:設 是m個項的集合,D是數據庫事務的集合,每個事務有一個標識符。關聯規則就是形如 的蘊含式,其中 ,并且 。規則的支持度記為 ,是事務D中包含的 事務數與所有事務數之比,置信度記為 ,是指包含的 事務數與包含的 事務數之比。

給定事務數據庫D挖掘關聯規則問題就是產生支持度、置信度分別大于用戶給定的最小支持度和最小置信度的關聯規則。

表5是使用FP-Tree算法對學生學習情況表進行挖掘得到的一系列關聯規則(因篇幅限制,本文僅列出部分內容)。

從上表可以看出,學習時間在6小時以上并且成績為優秀的同學占全班的20.51%,學習時間6小時以上的同學中有34.78%的學生成績為優秀。學習時間在2小時以下的并且成績不及格的同學占全班的7.69%,學習時間2小時以下的同學中有75%的學生成績不及格。學習時間在6小時以上,學習次數多于6次且成績為優秀的學生占全班的7.69%,這部分同學中有75%也積極參與BBS討論,而學習時間少于2小時,次數少于3次,基本不參與討論的同學,不及格率為100%,這部分同學占全班的7.69%。比例明顯偏高,需要調整教學的內容和設計討論問題以提高學生的興趣。從表中還可以看出,學習次數多于6次的學生中有92.31%的學生其學習時間一般也會超過6小時,這部分學生占全班的61.54%,通過關聯規則的挖掘,可以掌握學生網上學習行為,從而為教師的教學策略調整提供依據,可以更好地進行學生的培養。

2 分類模型挖掘

著名的心理學家、教育學家布盧姆提出的掌握學習理論認為:“只要在提供恰當的材料和進行教學的同時給每個學生提供適度的幫助和充分的時間,幾乎所有的學生都能完成學習任務或達到規定的學習目標”。

通過構造判定樹可以建立學生分層教學模型,并依據判定樹為學生提供不同層次的教學內容而 實現對學生的網絡分層教學。分類模型判定樹歸納算法主要表述為計算每個屬性的信息增益,將具有最高信息增益的屬性選作 給定樣本集合的測試屬性,創建樹的結點,并以該屬性標記,對屬性的每個值創建分支,并據此劃分樣本。由于樣本數據中存在噪聲或孤立點,通過樹剪枝去除不合理的分支,以提高在未知數據上分類的準確性。據此算法構造的判定樹如圖1所示。

判定樹的第一層條件為每一章節的單元測試成績,分別表示為優秀、合格和不及格。不及格的同學下一章節進入C類教學目標學習,優秀的同學則進入A類教學目標學習,合格的同學則根據學習的次數決定下一章節的教學目標。學習次數為0~2次的同學進入B類教學目標學習,3~5次的同學則需要根據學習時間判定,根據判定樹可知,所有同學進入B類教學目標學習,這和我們日常的判斷邏輯相符,因為學習次數較多,學習時間較長,但成績卻是合格的同學很有可能是因為方法不當等原因導致接受知識能力較差,進入A類目標學習顯然是不合理的。當學習次數大于6次時,可以根據學生參與BBS討論的次數決定學生的下一章節的學習目標,討論次數0~2次的同學其學習目標定為B類,3次以上的同學其學習目標則定為A類,這類學生表現出對知識的渴求,興趣較濃,理解知識的能力相對較強。

本文為全文原貌 未安裝PDF瀏覽器用戶請先下載安裝 原版全文

根據判定樹,可以根據學生學習本章節的實際情況對學生學習下一章節內容的效果進行預測,據此對學生進行分類,提供不同的教學內容供其學習,以提高整體教學質量。

參考文獻

[1] 湯小文,蔡慶生. 數據挖掘在電信業中的應用[J].計算機工程,2004,30(6):36-37,41.

[2] 楊引霞,謝康林,朱揚勇等.電子商務網站推薦系統中關聯規則推薦模型的實現[J].計算機工程, 2004, 30(19):57-59.

[3] 印鑒,陳憶群,張鋼.基于數據倉庫的聯機分析挖掘系統[J].計算機工程,2004,30(19):49-51.

[4] 楊清蓮,周慶敏,常志玲.Web挖掘技術及其在網絡教學評價中的應用[J].南京工業大學學報(自然科學版),2005, 27(5):100-103.

[5] 劉革平,黃智興,邱玉輝.基于數據挖掘的遠程學習過程評價系統設計與實現[J].電化教育研究,2005,(7):67-69.

[6] 孫瑩,程華,萬浩.基于數據挖掘的遠程學習者網上學習行為研究[J].中國遠程教育,2008,(5):44-47.

[7] 龔志武.關于成人學生網上學習行為影響因素的實證研究[J].中國電化教育,2004,(8):32-34.

[8] Sarwar B, Karypis G, Konstan J,et al. Analysis of Recommendation Algorithms for E-commerce [Z]. ACM Conference on Electronic Commerce, 2000.

[9] Tung A K H, Lu Hongjun, Gan Jiawei,et al. Efficient Mining of Interransaction Association Rules [Z]. IEEE Transactions onKnowledge and Data Engineering, 2003, 15(1).

Application of Data Mining in Network Teaching

SUN Yu-rong1LUO Li-yu2HUANG Hui-hua1

(1.College of Science, Central South University of Forestry and Technology, Changsha ,Hunan, 410004, China;2.The Journal Editorial Department, Hunan University of Technology,Zhuzhou, Hunan, 412007,China)

篇(3)

一、數據挖掘的定義

數據挖掘是一個涉及多學科交叉的研究領域,綜合了人工智能、機器學習、數理統計等學科,它把對數據的應用從較低層次的簡單的查詢提升到從數據中挖掘知識。簡單的說,數據挖掘就是從數據中獲取知識。從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道、但又是潛在有用的信息和知識的過程。數據挖掘應該更正確地命名為“從數據中挖掘知識”。

二、數據挖掘的過程

數據挖掘過程大概可以概括為三部分:數據準備、數據挖掘、結果的表達和解釋。如圖1-1。

三、數據挖掘的特點

數據挖掘是在沒有明確假設的前提下去挖掘信息、發現知識,所得到的信息具有事先未知、有效、實用三個特征;用戶不必提出明確的要求,系統能夠根據數據本身的規律性,自動地挖掘數據潛在的模式,或通過分析建立新的業務模型,幫助決策者調整市場策略,這有利于發現未知的事物。因此,它是由數據驅動的一種真正的知識發現方法。

四、學生成績管理的現狀

隨著高校招生規模的擴大使成績管理處理的數據量急劇增加,存放在數據庫中的大量的成績數據,對于一般的查詢過程是有效的,管理人員能夠通過簡單的統計或排序等功能獲得一些表面的信息,但隨著數據庫中存儲的數據量的增大,傳統的數據庫管理系統的數據管理和處理功能就不能滿足現實的需要,因為無論是查詢、排序還是方差,其處理方式都是對指定的數據進行簡單的數字處理,對于學生成績管理方面,往往只能做一些簡單的功能,由于大量數據以不同的形式存儲在不同的計算機上,從而使隱藏在其中的大量有用信息無法得到有效的利用,無法發現數據中存在的關聯和規則,無法根據現有的數據預測未來的發展趨勢。上述問題直接導致教學管理部門無法進行有效的評估,任課教師無法進行有效的教學方法改進。而如何將這些數據信息轉化為知識表示,為學校管理者提供決策依據,科學指導教學,提高教學管理水平,將是高校需要迫切解決的問題。

五、將數據挖掘技術在成績管理中的應用

1、學生成績分析方面

學生的學習成績是評估學生表現好壞的重要依據,也是學生是否掌握好所學知識的重要標志,目前高校使用的成績管理系統大部分只能做一些簡單的數據管理和處理,例如:學生的平時成績輸入、考試成績輸入、畢業設計成績登記,進行各類統計報表和信息查詢、分析某一個班學生學習成績分布的情況等。目前大量的成績數據只是簡單地存儲在數據庫中,隱藏在這些數據中的潛在信息被閑置,沒能被充分利用。在數據庫中學生成績分析從定性的角度考慮不是很精確,而數據挖掘是從定量的角度精確地分析學生成績分析的各個方面數據。

2、在考試方面

考試是對教師教學效果和學生學習效果的一個檢驗,是教學中必不可少的環節,雖然按考試成績可以總體評價在一定時期內學生取得的成績,但這并不能有效地說明成績的高低與哪些因素有關,無法知道教師教學環節中的成功與不足之處,對教師教學方法的改進和學生學習成績的提高都沒有實際意義上的幫助,而且,學生考試成績的高低也與試題的質量有著很大的關系,因此探索有效的方法來評價試題的質量如試題難易度,知識點全面度等在實際的教學過程中同樣具有重要的意義。將數據挖掘技術應用于試卷分析數據庫中,然后根據學生得分情況分析出每道題的難易度、區分度、相關度等指標,那么據此,教師可以對試題的質量作出比較準確的評價,進而可以用來檢查自己的教學情況及學生的掌握情況,并為今后的教學提供指導。

2、在教學評價方面

教學評價是教學中的一個重要環節,是引導教育、培養高素質人才,幫助社會充分利用教育成果和促進教育健康發展的保證。傳統的教學評價大多是參考相關評價指標體系和調查問卷等方式實施的,而且更是注重評價的結果,以作為教師晉升、學生評優等的依據.高校每學期都要搞課堂教學評價調查,積累了大量的教學信息數據,利用數據挖掘技術,從教學評價數據中進行數據挖掘,探討教學效果的好壞與教師的年齡、職稱之間有無必然的聯系,課堂教學效果與教師整體素質關系如何,合理配備班級的上課教師,使學生能夠較好的保持良好的學習態度,從而為教學部門提供了決策支持信息,促使更好地開展教學工作,提高教學質量。

3、選擇教師的教學方法方面

在教學過程中,教師可以采用多種方法來完成自己的教學任務,比如講授法、多媒體演示、分組討論法、課程實習法等,在通常情況下,一般可以采取一種或幾種方法進行.據此可用數據挖掘的方法來挖掘數據庫中的數據,判定下一步應采取什么樣的教學方法,以滿足教學的需要,更有利于學生對知識的吸收。

4、課程的合理設置方面

在學校,學生的課堂學習是循序漸進的,而且課程之間有一定的關聯與前后順序關系,在學一門較高級課程之前必須先修一些先行課程,如果先行課程沒有學好,勢必會影響后續課程的學習,此外,每一學期安排課程的多少,也會影響學生的學習效果。利用學校教務管理系統中存放的歷屆學生各門學科的考試成績,結合數據挖掘技術的相關功能,得出一些有價值的規則和信息,最終找到影響學生成績的原因,在些基礎上,對課程設置做出合理安排。

六、結束語

隨著我國各高校管理信息化的不斷推進,各類學校的數據庫建設不斷完善,在學校平時的教育教學管理中累積了大量的數據。在這些海量的數據中,隱藏著大量有用的知識,如果利用好這些知識,將能夠對學校的教育教學工作起到積極的指導作用。數據挖掘技術正是為了解決如何從海量數據中挖掘出有用的知識,因此,將數據挖掘技術應用到高校的教育教學中去是非常有必要的。

參考文獻:

【1】吉根林,帥克,孫志揮.數據挖掘技術及其應用.南京師大學報(自然科學版),2000,23(2):25-27

篇(4)

【中圖分類號】 C81 【文獻標識碼】 A 【文章編號】 1004-5937(2016)22-0024-02

第八屆國際數據挖掘與應用統計研究會年會于2016年7月23―26日在油城大慶隆重召開。本屆會議由國際數據挖掘與應用統計研究會主辦,東北石油大學、廈門大學數據挖掘研究中心、臺北醫學大學大數據研究中心、重慶允升科技大數據研究中心和重慶譽鋒宸數據信息技術有限公司聯合承辦。會議主題為“卓越數據共享統計的理論及應用研究”。來自國內外近百所高校、政府和企事業單位的200多位專家學者參會。

會議開幕式由東北石油大學數學與統計學院院長王玉學教授主持。東北石油大學副校長呂延防教授介紹了大慶市貌、學校環境和鐵人精神等,對本次會議的作用和意義進行了高度評價。教育部統計學類專業教學指導委員會主任、廈門大學曾五一教授從統計學科如何適應大數據時代的發展角度,對會議的召開提出了進一步的期望。臺北醫學大學謝邦昌教授結合大慶石油,暢談了大數據的應用前景。廈門大學朱建平教授從學會的起源到現狀,對學會未來的發展前景作了展望。

本屆大會除特邀報告外,入選論文52篇。按照論文所涉及的理論領域和方法應用,將入選論文分為數據挖掘與大數據應用、統計理論、統計方法應用及實證分析等專題進行了分組交流討論。主要學術觀點綜述如下:

一、數據挖掘與大數據研究現狀及未來趨勢研究

謝邦昌教授在《大數據發展現況與未來發展趨勢》中首先闡述了何謂BIG DATA。當你連上臉書按贊打卡、上傳照片到網絡相簿與朋友分享、上班收發e-mail、用悠游卡買杯咖啡、通過ATM領錢、走進大賣場刷卡購物甚至是進家門開燈,都正在源源不斷地創造“海量數據”。這正是云端時代的新金脈。其次是BIG DATA的理論及其應用。最重要的是如何對大數據進行分析,其基本方面如下:(1)數據可視化分析。決策者需要的不是數據本身及分析后的數值,而是龐大數據經分析之后的結果、趨勢或現象,利用可視化效果易于被接受。(2)Data Mining算法。這是大數據分析的理論核心,而深入挖掘和快速處理是兩大重要課題。(3)預測性分析。如何找出特性、科學建模、預測未來。(4)語義引擎。非結構化數據的多元化給數據分析帶來新的挑戰,要提高語義引擎設計的智能化水平。(5)數據質量和數據管理。高質量的數據和有效的數據管理可保證分析結果的真實和有價值。最后,真正制約或者成為大數據發展和應用的三個瓶頸:數據收集的合法性、產業鏈各個環節企業的均衡、大數據有效解讀。

國家統計局潘[博士在《我看當前對大數據的一些非議――兼議大數據應用面臨的問題》中指出近幾年中國的大數據應用取得了一定的進展,但面臨的諸多障礙依然存在,且不斷出現一些對大數據的非議之聲。這些非議有的有一定道理,有的則失之偏頗。潘[博士針對這些非議指出大數據是科學技術及社會生產力發展到特定階段的必然。盡管其發展進程中確實出現了失密、造假等嚴重問題,但這正說明必須正視大數據的撲面而來,并盡快制定各種應對措施,抓住機遇,保存價值,著力解決出現的各種問題。最后,提出完善法律法規、明確牽頭單位、統籌各部門和規范標準等措施。

重慶工商大學李勇在《網絡輿情數據挖掘方法及其在意識形態傳播新特點中的應用研究》中系統研究了當前網絡輿情數據挖掘的主要方法,并將這些方法應用于網上意識形態傳播新特點的研究中。對互聯網出現前后意識形態傳播呈現的不同特點進行了對比分析,提煉出意識形態傳播在當前DT時代的本質特征,結合主流意識形態提出相應的有效傳播方式和防范措施。

東北石油大學辛華博士在《基于密度分布的聚類算法研究》中通過密度聚類方法DBSCAN二次聚類提高了聚類精度。湖北經濟學院陳戰波、陶前功、黃小舟和王磊的《基于阿里云音樂平臺大數據的歌手流行趨勢預測及推薦研究》,山西財經大學舒居安、趙麗琴、劉逸萌的《基于網絡輿情的居民購買力傾向指數構造研究》和重慶工商大學李禹鋒的《基于網絡團購的重慶火鍋消費行為分析》等進行了大數據的應用研究。光環國際楊恩博的《大數據人才發展與培養》、廣州泰迪智能科技趙云龍的《大數據形勢下數據科學人才培養初探》和劉彬的《大數據雙創實踐探索與服務體系》,從業界不同角度探索了大數據人才培養。

二、統計基本理論及應用研究

臺灣淡江大學蔡宗儒教授在《Accelerated Degradation Tests》中,回顧了可靠度分析近期的發展,指出隨著制造技術的進步,產品可靠度大幅提升,進而提升了對產品可靠度分析的難度。而傳統設限方法和近代加速壽命測試法具有一定局限性,通過研究加速退化測試方法,指出如何針對加速退化數據進行統計推斷、評價其可靠度,如何在成本的考察下對加速退化測試實驗進行設計,以利后續的測試實驗參考。

北京大學房祥忠教授在《EM算法及其在置信推斷中的作用》中指出醫學或產品試驗費用昂貴等小樣本情況,其精確置信推斷尤為重要;Buehler置信限在多維參數或刪失數據時,難以計算,并將EM算法用于求精確置信限,給出了可靠性領域中的實證。

重慶工商大學李勇在《灰色統計基本理論及其應用》中系統研究了灰數的統計學基本理論和方法。他從隨機樣本產生灰色估計量和直接從灰色數據開始,構建了一套從數理統計逐步過渡到主要以灰色系統為研究對象的灰色統計方法,如灰數的區間估計、灰數的假設檢驗、灰數的相關分析和回歸分析等,并進行了實例分析。

哈爾濱工業大學張孟琦、田波平在《空間模型參數擬極大似然估計量的漸近性和實證》中提出了雙權重矩陣空間回歸模型參數的極大似然估計量,包括對數似然函數、集中似然函數和參數估計;證明了相合性和漸進分布性質,并實例進行了空間自相關檢驗和空間計量模型分析。

天津財經大學楊貴軍、于洋、孟杰的《基于AIC的粗糙集擇優方法》和楊貴軍、孫玲莉、董世杰的《三種線性回歸多重插補法的模擬研究對比分析》分別從粗糙集擇優和回歸插補進行了研究。云南財經大學張敏博士在《基于高層次結構的多水平發展模型的統計建模及應用》中研究了擬合高層次嵌套數據的多水平發展建模問題。集美大學紀的《模糊數據Jonckheere-Terpstra檢驗法及應用》探討了模糊數據檢驗。廣東財經大學的劉照德、林海明在《因子分析五個爭議的解答》中定量分析了因子分析的爭議問題。湖南大學周四軍、王佳星、羅丹在《基于門限面板模型的我國能源利用效率研究》中,基于柯布―道格拉斯生產函數理論構建了我國能源利用效率門限面板模型,并進行了實證分析。

三、統計方法及實證研究

天津財經大學楊貴軍、孟杰、鄒文慧在《基于模型平均的中國總和生育率估計》中指出目前國內學者對中國總和生育率的估計尚未形成一致性的結論,缺少高質量的數據源以及不完善的估計方法是影響總和生育率估計的主要問題;提出使用社會和經濟等“人口系統”外部數據,引入當前統計學和計量經濟學前沿的模型平均方法對中國總和生育率進行估計。

華僑大學項后軍和浙江財經大學何康在《自貿區的影響與資本流動――以上海為例的“自然實驗”估計》中,從自然實驗角度考察了樣本期內上海自貿區的設立對上海地區資本流動的影響。得出:基于雙重差分模型估計的自貿區對上海資本流動的影響顯著;基于改進后合成控制法得到的“合成上海”對上海設立自貿區之前的模擬程度更高;基于安慰劑檢驗,證實了自貿區政策的有效性。

湖南大學晏艷陽、鄧嘉宜、文丹艷在《鄰里效應與居民政治信任――基于中國家庭追蹤調查(CFPS)的證據》中,指出近年來居民對政府的信任危機頻發,矛盾不斷出現,嚴重制約著政府的行政效率;基于中國家庭追蹤調查(CFPS)截面數據,建立回歸模型進行實證分析,證實了其他信息獲取渠道與社會互動之間具有相互替代的關系,有效解決了關聯效應和反射性問題對鄰里效應估計帶來的影響。

篇(5)

1 科學數據開放共享中的出版商

1.1 科學數據開放共享

在科學研究過程中,有不同的利益相關者參與其中。這些利益相關者類別多樣,性質各異,共同形成科學研究的生態系統。根據各利益相關者的職能,圍繞研究人員,將這一系統進行分類研究,確定出4個利益相關者群體,即資助者、數據管理者、研究機構與出版商作為關鍵參與者,以促進和實現科學研究數據的開放共享。

在這一系統中,每類利益相關者都有各自不同的職能、驅動力及利益點,但總體利益與動機相同,即促進科學的進步。利益相關者的利益與行為動機與各自職能連接在一起,形成了科學研究系統的邊界。該系統本質上受到外部和內部因素的雙重影響:外部因素可能表現為政治、社會、經濟、科學和文化體系等;內部因素包括政治意愿、經濟及學術競爭、技術基礎設施、法律、道德等因素。該系統的價值與動機是外部和內部因素共同作用的結果,其中外部因素控制資源輸入到該系統中,內部因素控制這些資源的可用性和分配。如圖1所示:

在此科學開放系統中,利益相關者群體職能眾多并偶有重疊,總體上各利益相關方對研究數據的開放獲取的意義已達成共識,但各利益相關方對實現開放研究數據的方式的認識并不一致。本研究主要探討在推動科學數據開放共享中,出版商數據政策的現狀、問題,并構建相應模型,提出相應建議。

1.2 出版商在科學數據開放共享系統中的目標

在促進研究數據開放共享方面,各利益相關方發揮不同的作用。出版商通過期刊向作者提供數據共享政策,在數據開放中發揮著重要作用。研究出版商的數據政策,是因為這是在研究過程中將數據政策與研究人員密切關聯起來的點,為研究成果,研究人員有動力、有可能遵守數據政策。同時,研究發現,雖然包括出資者和研究機構都可能有適用于研究人員的政策,但遵守這些政策的研究人員的比例還很低。研究人員沒有遵守數據政策的直接動力;此外研究人員在需要進行數據存檔時,可能也沒有合適的機構知識庫可以選擇。出版商提出的數據政策,是在研究人員完成研究過程后發表研究成果前,研究人員有可能、有動力遵守出版商的數據政策。

1.2.1 科學數據開放共享的價值

科學的思想與科學的證據互相佐證,研究數據和科學實踐之間的聯系是不言自明的,因此,推動開放獲取研究數據,與促進科學嚴謹的目標相一致。更大程度地共享與獲取數據,能加強科學的基礎價值,即允許科學研究有效地自我校正,以便二次分析、檢驗、質疑或改進原有成果[3]。此外,開放獲取政策通過減少重復工作,最大限度地減少研究人員用在搜索信息和數據方面的精力,因而改善了他們的工作條件。

JISC以英國高等教育和研究機構為例,指出研究數據的監護與開放共享具有如下利益[4]: ①研究人員能夠更廣泛地獲得數據,從而促進更多的跨部門的合作,研究人員在行業、政府和非政府組織內有可能獲得大量的教育和培訓機會。數據的開放共享有助于實現數據使用和重用,降低數據的收集和復制成本,分擔數據收集的直接和間接成本(如避免調查疲勞,從而提高響應率等),創造出在數據收集時未曾預想到的新的利用方式,進行數據挖掘等。②在項目申請撥款和評估階段、出版和研究評估階段,更容易發現欺詐和抄襲,更容易進行評估和同行審查。因此將有機會創造更加完整和透明的科學記錄。③通過將研究人員、知識庫、資助者與有價值的資源相鏈接,從而有更多的機會提高研究的可見度。

科學研究系統中的各個利益相關者群體認識到走向開放數據的利益,認同將數據的開放共享置于戰略高度進行考慮。科學表現為知識積累的過程,數據在促進早期工作中起著重要作用。開放獲取研究數據,通過避免重復勞動,促進協作,有助于顯著加快這一科學過程,從整體上使科學成為更加透明的進程,實現推動公眾參與,激勵創新和改革公共服務的宗旨[5]。

1.2.2 基本情況

出版商作為利益相關者,越來越關注數據密集型研究,認同開放獲取研究數據的意義。很多出版商認同布魯塞爾宣言,即“所有的研究者應能自由地獲取原始研究數據。出版商鼓勵公開公布原始研究數據結果,將相關的數據集及子數據集與論文共同提交給期刊,應盡可能讓其他研究人員自由獲取”[6]。很多出版商的數據政策為強制性政策,要求作者將支持出版物的研究數據存儲在經認證的知識庫中,實現開放獲取。研究表明,如果期刊具有強制性數據政策,并且有可獲取數據的聲明,那么在線找到該數據的可能性,幾乎是沒有類似政策的期刊的1 000倍[7]。

盡管目前出版商已開始重視出版物的開放獲取,將開放獲取作為一種出版的商業模式,不過出版商參與研究數據的出版,特別是開放獲取研究數據,目前尚未形成規模。出版商關注研究數據及其開放,重要原因在于數據為出版商的主要產品即出版物增加了價值,數據有助于驗證研究成果,從而增強了所發表研究成果的可信性,而可信度對于研究具有重要意義[2]。此外,資助機構的政策要求公開獲取研究數據,實質上向出版商施加了壓力,出版商需要參與到研究數據開放獲取中,幫助作者和研究機構符合出資人的要求。現在,領先發展的出版商開始與其他利益相關方合作,試圖挖掘研究數據的潛能,形成以數據為基礎的新產品和服務,對研究數據進行同行評議,開展提高數據質量的其他服務。

2 出版商主要數據管理政策

本研究根據STM的年度報告[8],確定出以下出版商為主要分析對象(見表1)。這十大出版商所出版期刊占到2014年所有出版期刊的45.2%,另外本研究將開放獲取出版商,科學公共圖書館(PLoS)、生物醫學中心(BioMed Central)的數據開放政策考慮在內。

2.1 出版商數據政策現狀

2.1.1 將開放獲取作為默認情況

出版商將數據的開放獲取作為訂立政策的基礎,如PLOS研究數據開放獲取強制性政策[9],指出除了極少數例外情況,支持PLOS出版物的所有研究數據都必須開放獲取。作者在向PLOS提交稿件時,要同時提交數據可用性聲明,在聲明中表明遵守PLOS的政策規定,在手稿成功提交后,數據作為最終手稿的部分內容。PLOS要求作者將數據存儲于推薦的經認證的數據中心或知識庫。小數據集可與稿件一并上傳。PLOS的編輯和投稿指南,向研究人員提供指導,協助研究人員遵守期刊開放數據政策。在限制數據獲取的情況下,PLOS有權修正說明,聯系作者的機構或資助者,甚至撤銷出版。

2.1.2 新的出版形式的出現

出版界越來越關注開放數據,產生了一種新型出版產品,即數據期刊。數據期刊的出現,與數據可以單獨緊密相關。數據的單獨可以確保數據作為科學記錄的基本組成部分,以可理解的形式向科學界提供。數據期刊是同行評議的開放獲取平臺,用于、分享和傳播各學科的數據。發表的數據論文包含數據集的具體相關信息,如收集、處理方式等。發表的數據論文與認可的知識庫互相關聯,數據論文引用存儲于知識庫或數據中心中的數據集。正如澳大利亞國家數據服務中心(ANDS)在其數據期刊指南中所指出的,“從根本上說,數據期刊尋求促進科學認證和再利用,提高科學方法和結果的透明度,支持良好的數據管理方法,并為數據集提供一個可訪問的、永久的、可解析的路徑”。ANDS指出,數據論文的出版過程包括對數據集的同行評議,最大限度地提高了數據再利用的機會,并為研究人員提供了學術認可的可能性[10]。

2.1.3 同行評審

對研究數據與數據出版物開放獲取的關注,彰顯了研究數據的科學質量及研究數據同行評審的重要意義。在此背景下,一些出版商將同行評議的范圍擴大到包括數據在內的同行評審。M. S. Mayernik等2014年進行了有關“數據同行評審”的研究,提出因為出版物或資源類型有所不同,進行同行評審的方式也必須有所變化。研究者對幾種類型的評審資源進行了區分,包括在傳統科學論文中分析的數據,在傳統科學期刊上的數據文章,以及通過數據期刊的開放獲取知識庫與數據集。M. S. Mayernik等針對數據的同行評審、數據的質量保證過程確定了一些共同因素,包括:可通過數據中心或知識庫獲取數據集;數據集有足夠的信息以備評審;期刊有明確的方針指明審核的要點,指導評審者進行數據審查等[11]。

開放考古學雜志(JOAD[12-13])對所有提交的數據論文采用同行評審程序,評審內容包括論文的內容與存儲的數據。論文的內容指與數據集的建立和重用相關的信息,以及對數據集的描述。存儲的數據指以可持續性模式提交到存儲庫的數據,包括其許可方式。

2.1.4 數據引用

除對數據進行同行評審外,出版商還逐步引入數據引用政策,以促進研究數據的標準化使用。研究數據對研究過程具有重要價值與意義,為擴大高質量研究數據的傳播,形成數據利用的規范方式,FORCE11[14]制定了數據引用的主要原則。FORCE11的引用原則的前提是數據引用需要實現人類和機器均可讀。該數據引用原則可能并不全面,主要目的是鼓勵各學科制定體現自身特點的引用方式。

FORCE11原則包括:說明數據引用的重要性;通過數據引用促進學術信用;數據引用要實現機器可操作性,包括全球永久唯一標識符;數據引用要促進對數據本身的獲取;數據引用應該具有持久性;便于識別,易于獲取,可以驗證;具有互操作、靈活性等特點。

2.1.5 內容發現和鏈接服務

出版商逐漸把發展方向轉移到內容發現和鏈接服務,專注于文本與數據挖掘(TDM)工具,以便能開發內容,進而提供相關服務。出版商越來越關注數據挖掘是研究人員利用大型數據庫的內容、數據和出版物的需求的直接結果。一份文本和數據挖掘專家小組的報告指出,TDM是一種重要技術,可用于從指數級增長的數字數據中,分析和提取新的見解和知識[15]。該報告的結論是,因為研究人員的技能和技術不斷提升,所研究的數據集的復雜性、多樣性及規模不斷擴大,因此TDM有可能會更加重要。但對于利用文本與數據挖掘工具是否應有所限制,目前仍有爭議。

2.2 期刊數據政策問題

2.2.1 數據格式與文件大小的差異

期刊要包括支持文章結果的所有數據,往往是很難實現的。研究的方法不同,產生的數據也大不相同,數據的格式和文件大小差異巨大。定性研究生成的數據,多以文本形式存在,例如實地觀察筆記,或采訪或報道的文字記錄等。定量研究生成的數據,多以電子表格的形式保存。一項研究可能產生多種類型的數據,而論文可能包括附加文本、數值數據集和數字圖像,這些都可能增加論文的大小。因此出版商表現出對集成到每篇論文中的數據集大小的關注。某些出版商開始嘗試出版在線期刊文章,以包括多種數據,例如愛思唯爾的有關未來的文章的探索[16]。然而,并不是每一種期刊都有包括各種數據的能力。這就要求期刊的辦刊方針應清楚說明,作為論文組成部分的數據,在何種程度上可以包括在論文中。

2.2.2 機構知識庫的成本

為解決出版商服務器超載的問題,將期刊文章的重要數據鏈接到一個特定的機構知識庫,可能是一個合理的選擇,但這將相關的長期運營成本轉嫁到了機構中。但資助者目前的基金中并不包括這部分資金,而機構可能也并不愿意在當前的管理費用中增加這種支出。這就使得在機構知識庫中存儲科學數據的可持續性有待探討。

2.2.3 研究人員對數據開放的認識

許多研究人員并不知道相關的知識庫,為此期刊數據政策應說明,數據是否應該在認可的知識庫中存儲,是否要使用永久統一資源定位符(URL),是否要采用某種形式的數據引用。數據的時間也是一個需要關注的問題,研究人員并不關心在出版過程中的什么時候數據可被公開訪問,而是關心在研究過程中何時數據應被公開訪問。研究論文并不是在研究結果全部產生后才會形成,而是在研究過程中逐步產生的。在的同時,是否適合研究數據取決于多種因素,諸如某些形式的數據有敏感性,要保護受試者等因素。

3 構建期刊研究數據策略模型框架

3.1 出版商期刊政策的基本要求

有效的政策制定過程必然需要將注意力集中于數據共享過程中各利益相關方的意見,而目前的數字基礎設施在不斷變化,出版商、知識庫和系統之間,并沒有強有力的措施鼓勵共享數據。共同點包括:①出版商共享數據的方式差異很大;②在出版過程中,出版商對所接受的數據類型、數據應存儲的地點、應存儲的時間等說明,模糊不清;③研究人員普遍贊成共享數據,但研究人員不知道該如何克服共享障礙;④研究人員認為出版商和期刊有關數據格式和存放地點等清晰的政策,將有益于研究;⑤出版商也認為在數據的關聯與嵌入方面存在障礙。

科學數據共享的許多問題,能夠在出版過程中通過期刊強有力而明確的政策加以解決。因此,本研究的目標是確定能推薦給期刊使用的政策模型。研究收集到的期刊政策信息,對材料進行分析后,歸納出目前主要的政策要求,如表2所示:

3.2 框架模型

基于以上所列出的觀察,形成基本的期刊研究數據政策的模型框架。由資助者和研究機構作為一方,與出版商的另一方進行合作,發展數據政策。表3為所構建的期刊研究數據策略模型框架。

3.3 實施方式

3.3.1 逐步制定出版物的支持性數據的強制性開放共享政策

出版商應該支持期刊編輯制定研究數據的強制性政策,從而提高研究過程透明度,擴展研究數據的潛力。數據的編輯政策應解決諸如文檔、元數據、數據出版格式、許可、引用等問題。編輯政策要求作者在文章提交過程和同行評議過程中,提交數據的可用性描述。對提交的文章不符合規定的情況,政策應提出對應的措施,如撤銷發表的文章。

3.3.2 與認證知識庫和數據中心協作,簡化數據提交流程

出版商可按照相關標準考查知識庫與數據中心的可信度,與符合數據認證標準的數據中心與知識庫協作。類似的知識庫或數據中心可以是主題明確的學科知識庫,也可以是機構知識庫或綜合知識庫。二者的合作應該會產生積極影響,為研究人員和研究機構提供高品質的產品和服務,服務具有可操作性、技術上無縫的特點,從而實現以開放格式傳播和保存高質量的學術產品和研究數據。對于沒有公認的數據中心或知識庫的學科,出版商對研究人員提供指導和幫助,提供適合存儲與獲取的機構知識庫建議,或提供商業數據服務。在這方面,出版商的角色應該是更多地促使學術團體建立資源庫評估準則,從而幫助研究人員選擇合適的存儲庫。當學術界建立起知識庫的認可標準,出版商就可以通過期刊政策執行這些標準。

3.3.3 數據作為一流學術成果,接受同行評議

出版商的主要職責之一是確保出版物的高質量,而研究數據同行評審制度的建立,有助于提升出版產品的品質。同行評審過程,應詳細說明評審的標準,要評估研究數據的技術與質量問題,技術方面如考量數據集的完整性和一致性,收集數據的標準,使用的軟件等;研究數據的科學質量則由研究團體通過出版前與出版后的同行評審進行評估。同行評審流程中,出版商也應該探索對評審者的激勵方式,包括支付酬金,邀請編寫特稿,加入編輯委員會,甚至聘用一些專家進行內容評審。

3.3.4 發展有關研究數據引用的策略

研究數據通過傳統的出版過程傳播,為實現數據的長期可重用,需建立并使用數據的引用標準。在這方面,出版商應要求出版物及相關的數據可引用,并為數據的引用提供明確指導。在說明數據引用時,出版商可參照一些已有的實踐,如Force11[14]的原則,參與DataCite[17],加入到研究界和編輯討論的過程中。數據引用應包括DOI,以及使用許可信息,如創作共用許可,數據的引用方式最好是機器可操作的,可讓用戶知道可以如何處理研究數據。

3.3.5 建立許可政策鼓勵進行文本數據挖掘

出版商的編輯政策應以清晰的方式,說明研究數據的與獲取方式,如默認或建議開放獲取等。考慮到文本數據挖掘工具可帶來顯著經濟效益,鼓勵出版商調整策略,允許研究人員在研究中使用這種技術。

篇(6)

二、數據驅動的高校教育管理智能平臺架構

在海量教育數據亟待有效利用的驅動下,為提高高校管理效益,將商業智能技術應用到高校教育管理中,對高校產生的大量數據用數據挖掘等商業智能技術進行分析研究與處理,可以幫助高校決策者做出對學校發展更為有利的科學決策。其關鍵是建立綜合層面上的、能反映高校整體教育教學管理的信息集成系統平臺(下文簡稱高校BI系統平臺)。高校BI系統平臺體系架構由數據源、數據存儲與管理層、數據分析層和用戶接口層組成,如圖1所示。

(一)數據源

數據源是整個系統的基礎,包括高校各類業務管理信息系統的內部數據和其他外部數據。內部數據包括存放于操作型數據庫中的各種業務數據和辦公自動化系統包含的各類文檔數據,如學校財務處、人事處、教務處、科研處、設備處等部門數據庫中業務數據;外部信息包括各類教育信息、外部統計和調研數據及文檔等。

(二)數據存儲與管理

數據存儲與管理層是整個系統的核心,包括ETL管理工具、公共數據集、元數據、數據倉庫和數據集市。高校BI系統平臺建設采用數據驅動設計方法,從學校原有的各個部門的業務處理系統和外部數據源中經過ETL提取數據,并根據常見的分析和統計主題,建設校級數據倉庫以及人才培養、師資隊伍、科學研究、辦學資源、交流合作等主題的數據集市。

(三)數據查詢與分析

高校決策者常常希望從不同的角度審視教育數據,比如從時間、區域、學科、教學或科研成果、課程建設、學生層次、交流合作、辦學資源等維度全面了解學校的教育質量和狀態。高校BI系統平臺的數據分析層利用商業智能技術為高校管理主要提供固定報表、即席查詢、統計分析、多維分析、預警功能、預測分析、數據挖掘建模分析及優化分析等,根據學校現有學生、教師、資源、科研和人才培養等狀況,有助于高校決策者全面地對學校資源配置進行調控、對學校整體辦學信息的內部結構進行調整等,做出對學校發展更為有利的科學決策。

(四)用戶接口

用戶接口層根據高校用戶訪問需求和角色訪問授權機制,提供強大的多用戶數據查詢操作,并以儀表盤或表格、直方圖、餅圖等直觀方式將查詢結果或決策信息呈現給用戶。

三、應用案例

下面以高校BI系統平臺中的調研數據為商業智能技術應用案例,利用回歸方法對大學生學習成果進行數據挖掘分析。

(一)數據來源

案例分析的數據來源于高校BI系統平臺中“中山大學學生學習狀況調查”項目于2012在中山大學全校范圍內開展的在線調研數據。[13]調查覆蓋全校36個學院(系),調查總體約為3.3萬名本科生。讓學生在無壓力的情況下答題,共回收問卷7051份,回收率約為21.2%,與國際上通用的問卷回收率相當。案例分析聚焦于本科樣本,全部回收的問卷根據答題時長、問卷質量標準等原則,篩選出有效問卷數據6673份,有效率為94.6%。本研究從學生學習經歷角度,在“生源-學習-成果”的邏輯框架中,考察分析學校因素和學生因素對于學生學習成果的影響機制。調查把學生學習經歷和成果分解為生源情況、學校學習資源供給、學生與學校的融合、學生學習投入、學生成果、學校成果6大維度,各維度下題目的內部一致性均達到0.9以上,具有較高的信度。

(二)數據分析

逐步回歸提供了一種識別與學生學習成果相關的具體經歷的方法,對于學生學習狀況調查中的227項進行相似項合并,用向前和向后逐步回歸確定與學習成果相關的項目,對殘差圖和診斷法的徹底審查,最后確定17個獨立變量出現在多元回歸模型中(如表2所示),其中,相關系數R為0.994,校正判定系數R2為0.988,因變量變化中有98.8%左右的信息可以由預測變量解釋,說明模型的擬合優度較好;Durbin-Watson為1.937,接近最佳理想值,如表1所示。表2顯示的是回歸系數的相關統計量,可以看出,這17個獨立變量的顯著性概率Sig.都小于0.05,說明其系數顯著不為0,這17個變量均與學生學習成果顯著相關。分析表2中的數據可以看出,學生學習經歷中的學校學習資源提供、學生學習投入和校園文化及學校成果等四大維度的17個變量均為影響學生學習成果的重要預測變量,包括課程作業評價、專業學習經歷評價、學術規范指導、平等文化、多元能力的培養氛圍等學校因素變量,以及朋輩交流情況、自主學習情況、活動參與情況、課外閱讀情況、論文寫作情況、討論關注的內容情況、師生交流、課業活動及個人閑暇活動時間分配等學生因素變量。同時,在校經歷滿意度、綜合滿意度和能力培養滿意度等融合學校因素和學生因素的學校成果也對學生學習成果具有一定的影響。通過標準系數可以看出,朋輩交流情況、自主學習情況和討論關注的內容情況分別是第一、第二和第三重要的預測變量,而性別、年級、所在校區等人口學變量并未出現在該回歸分析模型中,對學生學習成果的影響不顯著。進一步分析朋輩交流情況和自主學習情況調查指標應答概況,如表3所示,“有時”、“時常”或“頻繁”進行朋輩交流的比例為63.7%~97.7%,自主學習的比例為52.5%~92.9%,朋輩交流和自主學習的平均比例相當高(81.8%)。“有時”、“時常”或“頻繁”地進行朋輩交流方面的主要比例情況為:“與家庭背景(社會、經濟的)不同的同學交流”為97.7%、“與興趣不同的同學交流”為95.6%、“在與同學的談話中得到啟發,改變自己的想法”為94.4%、“與世界觀、價值觀不同的同學交流”為93%、“與不同專業的同學交流”為92.6%、“同學與你談話后,表示受到了你的啟發”為90.8%。“有時”、“時常”或“頻繁”地進行自主學習的主要比例情況為:“利用圖書館、網絡等資源豐富自己的學識”為92.9%、“根據課程安排,做課堂展示”為91.3%、“努力掌握對自己而言較難的課程內容”為91.3%、“隨著學習經歷的豐富不斷整合、梳理自己的知識系統”為88.4%,“因課程設置和教師的要求具有挑戰性而更加努力地學習”為85.9%。上述情形符合VincentTinto在研究大學生退學問題時提出的理論模型:學生取得較好的學習成果,依賴于他們在學習經歷中能否將自身的經驗和目標與學校系統內部的學術系統和社交系統相融合。[10]學術系統代表學生個人的課業表現、智力發展、學業成就等綜合表現,如表2中自主學習情況、活動參與情況、課外閱讀情況、論文寫作情況、討論關注的內容情況及課業活動等屬于學術系統的范疇。社交系統代表學生在校內的同伴關系、師生關系、社交行為等綜合表現,如朋輩交流情況、師生交流及個人閑暇活動時間分配等屬于社交系統的范疇。學生在其學習經歷中,有效地利用學習資源和校園文化氛圍、將學術系統和社交系統進行整合,可以從學業和人際關系上自我提升,從而提高學習成果。

篇(7)

2.1Web數據挖掘概述

數據挖掘(DataMining)是從大量的、不完全的、有噪聲的、模糊的和隨機的數據中提取人們事先不知道的、潛在有用的信息和知識的非平凡過程。

Web數據挖掘(WebMining)是從Web文檔和Web活動中抽取感興趣的、潛在的有用模式和隱藏的信息,是數據庫、數據挖掘、人工智能、信息檢索、自然語言理解等技術的綜合應用,是在一定基礎上應用數據挖掘的方法以發現有用的知識來幫助人們從WWW中提取知識。Web數據挖掘可以分為Web內容挖掘(WebContentMining)、Web結構挖掘(WebStructureMining)、Web使用記錄挖掘(WebUsageMining)三類。Web內容挖掘是指從文檔內容或其描述中抽取知識的過程,又可以分為基于文本的挖掘和基于多媒體的挖掘兩種。Web文本挖掘可以對Web上大量文檔集合的內容進行總結、分類、聚類、關聯分析等。Web結構挖掘是指從Web組織結構和鏈接關系中推導知識。通過對Web結構的挖掘,可以用來指導對頁面進行分類和聚類,找到權威頁面,從而提高檢索的性能,同時還可以用來指導網頁采集工作,提高采集效率。Web使用記錄挖掘是指從服務器端記錄的客戶訪問日志或從客戶的瀏覽信息中抽取感興趣的模式。

基于Web的數據挖掘技術的出現不僅為商家做出正確的商業決策提供了強有力的工具,也為商家更加深入地了解客戶需求信息和購物行為的特征提供了可能性。

2.2電子商務中Web數據挖掘的步驟

電子商務中Web數據挖掘的步驟如下:

①明確數據挖掘的對象—業務對象,確定商業應用主題,不能盲目地進行挖掘;

②將與業務對象的各類原始數據收集起來作為挖掘的數據源泉;

③對收集的數據進行預處理,一般包括數據凈化、用戶識別、會話識別、路徑補充、事務識別和格式化等階段,以提高挖掘效率,剔除無用、無關信息并對信息進行必要的整理。

④根據需要解決的問題建立合適的數據挖掘模型,然后利用已知數據對模型進行訓練和測試,并應用該模型得到挖掘結果;

⑤利用可視化技術,驗證、解釋挖掘的結果,并據此做出決策或豐富知識,即進行模式分析與應用。

在整個Web數據挖掘的過程中,被明確的業務對象是挖掘過程的基礎,它驅動整個Web數據挖掘的全過程;同時,也是檢驗挖掘結果和引導分析人員完成挖掘的依據。

2.3電子商務中Web數據挖掘的數據源

在電子商務中,可以用來作為數據挖掘分析的數據量比較大,而且類型眾多,總結起來有以下幾種類型的數據可用于Web數據挖掘技術產生各種知識模式。

①服務器數據。客戶訪問站點時會在Web服務器上留下相應的日志數據,這些日志數據通常以文本文件的形式存儲在服務器上。一般包括serverslogs、errorlogs、cookieslogs等。

②查詢數據。它是電子商務站點在服務器上產生的一種典型數據。例如,對于再現存儲的客戶也許會搜索一些產品或某些廣告信息,這些查詢信息就是通過cookie或是登記信息連接到服務器的訪問日志上。

③在線市場數據。這類數據主要是傳統關系數據庫里存儲的有關電子商務站點信息、用戶購買信息、商品信息等數據。

④Web頁面。主要是指HTML和XML頁面的內容,包括文本、圖片、語音、圖像等。

⑤Web頁面超級鏈接關系。主要是指頁面之間存在的超級鏈接關系,這也是一種重要的資源。

⑥客戶登記信息。客戶登記信息是指客戶通過Web頁輸入的、要提交給服務器的相關用戶信息,這些信息通常是關于用戶的人口特征。在Web的數據挖掘中,客戶登記信息需要和訪問日志集成,以提高數據挖掘的準確度,使之能更進一步的了解客戶。

2.4Web數據挖掘能夠獲取的知識模式

運用Web數據挖掘技術能夠對站點上的各種數據源進行挖掘,找到相關的一些知識模式,以指導站點人員更好地運作站點和向客戶提供更好的服務。一般運用Web數據挖掘可以在站點上挖掘出來的知識模式有以下幾個:

①路徑分析。它可以被用于判定在一個Web站點中最頻繁訪問的路徑。通過路徑分析,可以得到重要的頁面,可以改進頁面及網站結構的設計。

②關聯規則的發現。在電子商務中關聯規則的發現可以找到客戶對網站上各種文件之間訪問的相互關系,可以找到用戶訪問的頁面與頁面之間的相關性和購買商品間的相關性。利用這些相關性,可以更好的組織站點的內容,實施有效的市場策略,增加交叉銷售量,同時還可以減少用戶過濾信息的負擔。

③序列模式的發現。序列模式的發現就是在時間戳有序的事務集中,找到那些“一些項跟隨另一項”的內部事務模式。它能夠便于進行電子商務的組織預測客戶的訪問模式,對客戶開展有針對性的廣告服務。通過系列模式的發現,能夠在服務器方選擇有針對性地頁面,以滿足訪問者的特定要求。

④分類和預測。分類發現就是給出識別一個特殊群體的公共屬性的描述,這個描述可以用來分類新的項。分類的目的是通過構造分類模型或分類器,把數據庫中的數據項映射到給定類別中的某一個,以便用于預測;也就是利用歷史數據記錄自動推導出對給定數據的推廣描述,從而能對未來數據進行預測,進行適合某一類客戶的商務活動。

⑤聚類分析。聚類分析可以從Web訪問信息數據中聚集出具有相似特性的那些客戶。在Web事務日志中,聚類顧客信息或數據項能夠便于開發和執行未來的市場策略。這種市場策略包括自動給一個特定的顧客聚類發送銷售郵件、為屬于某一個顧客聚類中的顧客推薦特定的商品等。對電子商務來說,客戶聚類可以對市場細分理論提供有力的支持。通過對聚類客戶特征的提取,電子商務網站可以為客戶提供個性化的服務。

⑥異常檢測。異常檢測是對分析對象的少數的、極端的特例的描述,以揭示內在的原因,從而減小經營的風險。異常檢測在電子商務中的應用可以體現在信用卡欺詐甄別、發現異常客戶和網絡入侵檢測等方面。

Web數據挖掘的各項功能不是獨立存在的,而是在挖掘過程中互相聯系,發揮作用。

3Web數據挖掘在電子商務中的應用

3.1數據抽取方法在電子商務中的應用

與傳統商務活動相比,電子商務具有更多的虛擬和不確定的因素:如客戶購買的心理、動機、能力、欲望等。Web數據挖掘要解決的問題就是如何從零散的無規則的網絡數據中找到有用的和有規則的數據和知識,基本方法之一就是進行數據抽取,以期對數據進行濃縮,給出它的緊湊描述,如方差值等統計值或用直方圖等圖形方式表示,從數據泛化的角度討論數據總結,把最原始、基本的信息數據從低層次抽象到高層次,以便于企業決策。

3.2基于Web數據挖掘的智能化搜索引擎

電子商務企業在活動過程中面臨的問題之一是如何通過Internet全面、準確、及時地收集到企業內、外部的環境信息,尤其是一些隱性的、關系到企業經營成敗的關鍵信息,以提高競爭力。目前的搜索引擎存在著查準率低、返回無用信息多的問題,使企業無法得到優質的信息。鑒于此,將Web數據挖掘技術應用于搜索引擎,使之成為智能搜索引擎,從而提高性能,滿足電子商務企業的需要。Web挖掘技術主要在以下幾個方面對搜索引擎有借鑒作用:文檔的自動分類、自動摘要的形成、檢索結果的聯機聚類和相關度排序及實現個性化的搜索引擎。經過文檔的分類處理,可以對搜索結果進行分門別類,可以通過限制搜索范圍來使文本的查找更為容易,幫助用戶快速的對目標知識進行定位,從而提高用戶進行網上信息搜索的效率;自動摘要能夠解決大部分搜索引擎機械地截取文檔的前幾句和固定字數的摘要使信息反映不完整的缺陷,使用戶能較準確、快速、方便地了解檢索信息;通過對檢索結果的文檔集合進行聚類,可以使得與用戶檢索結果相關的文檔集中在一起,從而遠離那些不相關的文檔,將處理以后的信息以超鏈結構組織的層次方式可視化地提供給用戶,由用戶選擇他所感興趣的那一簇,將大大縮小所需瀏覽的頁面數量;將Web使用挖掘中的個性化技術應用在搜索引擎中,可以在大量訓練樣本的基礎上,得到數據對象間的內在特征,并以此為依據進行有目的的信息提取,使得搜索引擎可以按照用戶的興趣偏好擴充用戶搜索的關鍵詞,以使得檢索結果更接近用戶要求,或者根據用戶歷史瀏覽信息的分析獲得用戶興趣庫,調用個性化的搜索引擎可以提高用戶檢索的查全率與查準率。通過借鑒Web挖掘技術可以提高查準率與查全率,改善檢索結果的組織,從而使檢索效率得到改善。

3.3Web數據挖掘在客戶關系管理中的應用

①客戶關系管理的核心

客戶關系管理(CustomerRelationshipManagement,簡稱CRM)的核心是通過客戶和他們行為的有效數據收集,發現潛在的市場和客戶,從而獲得更高的商業利潤,通過完善的客戶服務和深入的客戶分析來滿足客戶的需求,保證實現客戶的終生價值。可以說CRM能給傳統企業帶來在網絡經濟時代謀取生存之道的管理制度和技術手段。它要求企業從“以產品為中心”的模式向“以客戶為中心”的模式轉移。

②Web數據挖掘在客戶關系管理中的應用

Web數據挖掘能夠幫助企業確定客戶的特點,使企業能夠為客戶提供有針對性的服務。將Web數據挖掘用在電子商務CRM中主要體現在客戶的獲取和保持、價值客戶鑒別、客戶滿意度分析及改善站點結構等幾方面。

通過Web數據挖掘,可以理解訪問者的動態行為,據此優化電子商務網站的經營模式。通過把所掌握的大量客戶分成不同的類,對不同類的客戶提供個性化服務來提高客戶的滿意度,從而保持老客戶;通過對新訪問者的網頁瀏覽記錄進行分析,就可以判斷出該訪問者是屬于哪一類客戶,是有利可圖的潛在客戶還是毫無價值的過客,達到區別對待、節省銷售成本、提高訪問者到購買者的轉化率的目的,從而挖掘潛在客戶;通過對具有相似瀏覽行為的客戶進行分組,提取組中客戶的共同特征,從而實現客戶的聚類,這可以幫助電子商務企業更好地了解客戶的興趣、消費習慣和消費傾向,預測他們的需求,有針對性地向他們推薦特定的商品并實現交叉銷售,可以提高交易成功率和交易量,提高營銷效果。

此外,站點的結構和內容是吸引客戶的關鍵。利用關聯規則的發現,針對不同客戶動態調整站點結構和頁面內容,把具有一定支持度和信任度的相關聯的物品放在一起以有助于銷售;通過路徑分析等技術可以判定出一類用戶對Web站點頻繁訪問的路徑,這些路徑反映這類用戶瀏覽站點頁面的順序和習慣,將客戶訪問的有關聯的文件實現直接鏈接,讓客戶容易地訪問到想要的頁面。這樣的網站會給客戶留下好印象,提高客戶忠誠度,吸引客戶,延長他們在網站上的駐留時間以及提高再次訪問的機率。

通過挖掘客戶的行為記錄和反饋情況,進一步優化網站組織結構和服務方式以提高網站的效率。通過Web數據挖掘,可以得到可靠的市場反饋信息,評測廣告的投資回報率,從而評估網絡營銷模式的成功與否;可以根據關心某產品的訪問者的瀏覽模式來決定廣告的位置,增加廣告針對性,提高廣告的投資回報率,降低公司的運營成本。③維護客戶的隱私權

維護客戶的隱私權是商家在商業運作過程中不能忽視的一個基本組成部分。因此,作為電子商務企業,應該盡量避免對單個客戶數據進行挖掘。企業管理客戶隱私權的保護應該從技術和管理兩個方面來實現:技術上,通常是采用加密標志符,并且盡量避免對單個客戶數據進行挖掘;管理上,很多電子商務企業現在已經增設了首席隱私官(CPO,ChiefPrivacyOfficer)職位,隱私官將能在個人對隱私的需求和公司以合理手段使用隱私材料的權利之間,建立適當的平衡關系。這種平衡關系的大成,需要以長期的實踐和經驗為基礎。除了電子商務企業以單獨的主體身份進行客戶隱私權保護的管理之外,行業自律也是保護客戶隱私權的一個行之有效的手段。目前,電子商務網站越來越傾向于通過行業自律的方式來樹立其在客戶心目中的形象,讓客戶放心地提交數據。

3.4Web數據挖掘在個性化服務推薦系統中的應用

電子商務個性化服務推薦系統是向站點企業提供在電子商務中更好地運作CRM,建立良好客戶關系的一種解決方法,是“以客戶為中心”、“一對一”的行銷的堅實執行者。

該系統主要是將數據挖掘的思想和方法應用到Web服務器日志及Web數據庫等資源上,挖掘出客戶的訪問規律;然后將在線訪問客戶歸結到某一類中去,根據該類用戶的訪問規律進行Web頁面的推薦;并且系統還可以通過不斷地跟蹤用戶的當前訪問,實時調整推薦集,為用戶提供個性化的訪問。該系統由五大模塊組成:數據收集模塊、數據預處理模塊、數據存儲模塊、離線挖掘模塊和在線推薦模塊。其系統結構模型如圖1所示:

圖1基于Web數據挖掘的個性化服務推薦系統結構模型

數據收集模塊主要用于收集Web數據庫、使用日志等數據,形成數據采集庫,為以后的挖掘做準備;數據預處理模塊主要是對所收集的數據進行預處理,數據預處理的質量與挖掘的效率和結果緊密相關;數據存儲模塊將預處理后的數據存入用戶事務庫;離線挖掘模塊中的挖掘引擎使用挖掘算法庫中的數據挖掘技術如統計分析、關聯規則、聚類分析、序列模式等,來發現用戶瀏覽模式,并通過模式分析對其進行分析與解釋,根據實際應用,通過觀察和選擇,把發現的統計結果、規則和模型轉換為知識,經過篩選后得到有用的模式用來指導實際的電子商務行為;在線推薦模塊在Web服務器前端設置了推薦引擎,它將用戶當前的瀏覽活動與瀏覽出的頁面推薦集結合起來考慮,生成相應推薦集,然后在用戶最新請求的頁面上添加推薦集的頁面,再通過Web服務器傳遞到用戶端的瀏覽器,為用戶實現實時個性化服務;同時將推薦結果送往網站管理中心,以便調整網站設計,優化網站結構,提高網站效率。

總的來說,在個性化服務推薦系統中運用數據挖掘技術有兩個階段:第一個階段是學習階段,離線進行。第二個階段是模式的使用階段,在線進行。挖掘和在線推薦的特征獲取和規則生成是離線處理的,而當用戶訪問該網站時通過在線推薦引擎進行在線服務。離線模塊和在線模塊相互聯系,在線模塊主要是利用離線模塊提供的規則模型對在線用戶推薦(推薦引擎);離線模塊主要是利用在線模塊積累的數據運用系統推薦算法形成相應的規則。挖掘算法和推薦策略可以根據不同類型站點的要求來具體選擇,挖掘結果和推薦集通過推薦引擎反饋給用戶。電子商務網站的客戶登錄網站以后,其訪問信息將會被記錄到服務器端。這些數據將在經過預處理后,在專用的數據挖掘模塊中,通過具體的挖掘算法和推薦策略來進行模式識別和模式分析。用戶訪問信息也會傳到推薦引擎,推薦引擎根據客戶的會員標識,向挖掘模塊抽取對應客戶的挖掘結果和推薦集,將其可視化地反饋給用戶,達到個性化服務的目的。

3.5基于Web的數據挖掘在商業信用評估中的應用

發達的社會信用水平是發展電子商務的重要基礎,通過Web數據挖掘對站點數據統計和歷史記錄之間的差別,結果與期望值的偏離以及反常實例進行充分的分析,可以有效地防范投資和經營風險。另外,通過數據挖掘技術對企業經營進行跟蹤,開展企業的資產評估、利潤收益分析和發展潛力預測,構建完善的安全保障體系,實施網上全程監控,監督網上言論,維護企業信譽,強化網上交易和在線支付的安全管理,利用數據挖掘的信用評估模型,對交易歷史數據進行挖掘發現客戶的交易數據特征,建立客戶信譽度級別,有效地防范和化解信用風險,提高企業信用甄別與風險管理的水平和能力。

4結論

本文對Web挖掘技術進行了綜述,介紹了其在電子商務中的典型應用。Web數據挖掘高度自動化地對電子商務中的大量信息進行分析和推理,從中挖掘出潛在的模式,預測客戶行為,幫助企業的決策者調整市場策略,減少風險,做出正確的決策。Web數據挖掘是近幾年來數據挖掘領域的探討熱點,利用它的技術知識將它運用到電子商務,將會解決許多實際問題,具有豐富的學術價值。將Web數據挖掘技術和電子商務兩者有機結合,將會為企業更有效的確認目標市場,改進決策,獲得競爭優勢提供幫助,有著很廣闊的應用前景,使電子商務網站更具有競爭力,從而為企業帶來更多的效益。面向電子商務的Web數據挖掘能發現大量數據背后隱藏的知識,指導商家提高銷售額,改善企業客戶關系,提高網站運行效率,改進系統性能,具有良好的發展和應用前景,必將得到越來越多的關注。

參考文獻:

[1]毛國君.數據挖掘原理與算法[M].清華大學出版社.2005(07).

[2]張冬青.數據挖掘在電子商務中應用問題研究[J].現代情報.2005(09).

[3]李鳳慧.面向電子商務的Web數據挖據的研究[D].山東科技大學碩士學位論文.2004(06).

篇(8)

【中圖分類號】G40-057【文獻標識碼】A【論文編號】1009-8097(2015) 06-0089-07【DOI】10.3969/j.issn.1009-8097.2015.06.014

引言

2011年以來,在美國頂尖大學中迅速發展起來并迅速影響世界的MOOC(大規模開放在線課程)模式無疑給“在線學習”這一學習形式樹立了成功應用的典范,該模式證明了只有當大學的課程、課堂教學、學生學習進程、學生體驗、師生互動過程等被完整、系統地在線實現…,特別是當輔導教師的存在以及相關系統指導活動實現時,在線學習才是有效的。這從一個側面說明,在線學習并不是純粹的學生自主學習,還需要充分發揮輔導教師的主導作用。

在線學習模式下,師生活動在時空上相對分離,盡管有同步教學活動發生,但更多時候是異步教學活動,因為異步教學更有助于滿足學習者的個性化學習需要。不同于課堂面授教學,輔導教師難以把握一門在線課程學習者學習開展情況的全貌。但是,通過在線學習平臺對學習過程的記錄,輔導教師了解課程的教學過程是可能的,而且基于學習過程記錄開展在線教學的反思以不斷改進在線教學這一做法也是必要的。一文獻探討

“教學反思”,顧名思義,反思對象就是教學過程,反思的基礎是對教學過程的忠實記錄。波斯納(Poser)將教師的成長發展與其對自己經驗的反思結合起來,提出了一個教師成長的公式:經驗+反思=成長。由此可見反思對教師成長以及專業發展的重要性。

教學反思的方法是多樣的。王映學、趙興奎指出教學反思的途徑主要有錄像反思、日記反思、從學習者角度反思、與同事及專家的交流中反思以及通過向學生征詢意見反思。張大均將教師成長的途徑從觀摩教學、微格教學、教學決策訓練和教學反思幾個方面來說明。俞國良等則將教師的反思訓練列為錄像反思法、對話反思法和教學反思法。從上述方法中可以看到,教學反思的基礎是對教學過程的忠實記錄。在“日記反思法”中,第一步就是對教學中包含問題的教學事件進行詳細、忠實的描述。在“從學習者角度反思”中,第一步就是“簡要記下學習發生的時間、場合、涉及的學習內容和培訓(講授或主持)人員”。在微格教學法中,則通過錄像設備記錄教學全過程。

在信息化網絡時代,教師可以利用現代教育技術手段來實現教學過程的忠實記錄,進行有效的教學反思,從而更好地促進自身的專業發展。各種新的網絡技術工具給我們的生活帶來了新的便利,同時也為教師提供了新的教學反思工具。近年來興起的學習分析技術可以成為教師開展在線教學反思的有力工具。學習分析技術是對學生生成的海量數據進行解釋和分析,以評估學生的學術進展,預測未來的表現,并發現潛在的問題。對教師而言,學習分析技術可用來開展更為深入的教學分析,以便教師在數據分析的基礎上為學生提供更有針對性的教學干預。在線學習中,在線學習平臺詳細記錄了師生行為,猶如課堂教學錄像。借助學習分析技術,分析師生行為記錄數據,可以再現在線學習過程,使教師能夠把握在線教學過程全貌,并了解每個教學環節、重要教學活動以及每個學生的種種細節,使原本模糊的印象數字化、清晰化,輔助教師反思其在教學設計、資源制作、學習引導、學習評價等方面的可取之處與不足之處。

因此,本文選取基于Moodle平臺的在線課程為樣本,應用學習分析技術,具體包括話語分析、社會網絡分析等分析技術,統計分析與可視化、聚類、預測、關系挖掘、文本挖掘等數據挖掘方法,以及SSAS、SPSS、ucrNET、EXCEL、ICTCLAS中文分詞系統等工具,從一位輔導教師的視角,開展基于學習過程記錄的在線教學反思研究,探索一種全新的教學反思形式。

二 研究樣本

本文選取國家開放大學主辦的網絡教育從業人員培訓班為研究對象。該培訓班依托Moodle平臺開設(網址:http://),有“學生支持服務”、“在線學習輔導”和“在線課程設計”三門課,每門課的培訓時間為6周,學生通過Moodle平臺開展在線學習,輔導教師提供全程的在線輔導。本文具體選擇“在線學習輔導”課程第五期培訓班作為研究樣本。

三 數據分析與培訓反思

1 重溫整個教學過程――師生群體平臺訪問行為分析

通過對平臺模塊訪問、模塊訪問序列以及師生活動時間分布情況的分析,重新回顧教學過程,并對一些突出的數據表現加以解讀,使原本時空分離的師生活動再度整合,還原輔導教師的教學過程與學生學習過程的原貌。

(1)平臺模塊訪問總體情況

表l是該期培訓過程中,師生訪問Moodle平臺各模塊的頻次統計結果。

從統計結果可知,師生最常訪問的模塊是“forum”,占總活動頻次的近50%,說明課堂討論是最主要的學習活動,也是這門基于討論的探究式課程學習的突出特點。其次就是“wiki”、“resource”和“assignment”三類行為。這三類行為的頻次和比例較為平均,是位列“Forum”之后的重要學習活動。在討論的基礎上,課程設計中的“wiki”其實是為了給學生協作式小組學習的機會,是除“forum”外學生之間重要的交互空間。“resource”(瀏覽資源)是學習內容重要的組成部分,在此基礎上參加討論和wiki協作學習,最終的學習成果以“assignment”(小論文、大論文)的形式呈現。這幾個模塊的頻次和比例分配較為合理,較好地還原了教學過程。

(2)平臺模塊訪問序列分析

我們已經了解了不同模塊的訪問頻次,下面我們再來了解一些師生訪問平臺模塊的路徑。

這里采用Microsoft順序分析和聚類分析算法,數據來源則是用戶每天瀏覽課程頁面產生的過程數據。筆者選取5個頻繁訪問模塊包括forum、wiki、assignment,resource和user(course除外,因為在該模塊主要發生登錄行為,并沒有實際的學習行為)的數據來分析模塊訪問序列,得到如圖l所示結果。由圖l可知,從user、resource、assignment、wiki四個模塊跳轉到forum的條件概率均比較高(分別為0.40、0.32、0.26、0.16),可見forum是一個活動中心模塊,也是一個重要的活動中介模塊,諸如resource、assignment、wiki等活動可以從中再次啟動。而在由forum跳轉到其他模塊的情形中,forumresource的轉換組合的發生概率是最高的,達到0.06。在發帖參與討論的過程中,發現問題、深入思考再繼續學習相關資源,這符合學習常規,也形成了討論帶動資源的學習兩者之間的良性互動,從而實現深度學習和反思。另外,resource模塊對其他模塊的支撐作用還表現為assignmentresource,這一條件概率達到0.13,即學生在做作業的過程中要求助于資源模塊,這也是符合學習常規的。

(3)不同時期各模塊訪問特點

接下來結合時間維度,了解不同時期平臺各模塊訪問特點,以了解不同時期師生關注重點的變化。計算出本期培訓不同周此平臺模塊訪問頻次分布情況,并繪制師生在主要學習模塊的活動頻次占比隨時間分布的折線圖,得到如圖2所示結果。

從圖2可以看出,除高頻訪問模塊forum外,在正式學習開始前兩周及第1周,學生的訪問重點user模塊和resource模塊反映出學生在熟悉人和內容。這啟示我們,在網絡課程開始之前,輔導教師可能需要提前兩到三周就介入課程的學習,實時跟蹤學習進程,為他們提供相應的服務來進行預熱,這對于后面課程學習的順利發展和學生積極性的保持都很有幫助。進入第2周,開始主要的學習活動,主要模塊則是wiki以及forum。到第3周,wiki活動達到頂峰一一第3周出現本課程第一次wiki協作式小組學習活動,所以這時達到頂峰是正常的;另外,這些學生從沒有接觸過基于wiki的小組寫作式學習,所以他們有很強的好奇心和強烈的興趣參與。到第4周,assignment活動達到頂峰。這實際上是學生提交的第3周布置的assignment(小論文),這是本課程第一次提交assignment;課程結束后的三周,assignment模塊的活動逐漸增強,伴隨著resource模塊活動的增強,forum活動相對減弱,進入做作業(撰寫大論文)的狀態。

2 聚焦重點教學活動一一師生論壇交互分析

師生在論壇的討論發言是本課程的一項重點教學活動。通過這一活動,相關教學信息得以傳遞,各種其他教學活動得以依次展開,課程知識也在這里不斷呈現,支持服務也在這里相繼給出。

(1)師生交互的數量與內容

該課程討論活動在6個學習單元分散展開,本期培訓班發帖數量累計743個,如表2所示。由表2可知,輔導教師的發帖量基本呈緩慢下降的趨勢。從該趨勢我們可以看到,在第1周“學習指南”和第2周“第一單元:什么是在線輔導?”兩周的教學中,由于是在線教學的開始階段,輔導教師需要更多地引導學生進行討論,投入相對更多的時間。從第3周開始,數據顯示,輔導教師的發帖量開始有所減少,從將近50%的比例下降到40%左右。這是因為,經過前兩周的學習,由于輔導教師的有效引導,學生保持了較高的積極性,效果明顯。從第3周開始,輔導教師有意減少了發帖的量,注意留給學生更多的時間思考并參與討論,這時候學生明顯上升到了討論的主角這一角色,這說明輔導教師對于討論的把握和控制比較成功。

(2)師生交互發帖的內容

作者采用傅騫、魏順平等研發的術語提取算法從所發帖子中提取了約240個術語,如表3所示。這些術語的出現頻次為4909次(其中輔導教師使用976次,約占20%);在481個帖子中出現(其中教師帖為204個),占帖子總數的65%。從另外一個角度說,有1/3左右的帖子沒有出現任何術語。由此可見,論壇的主要功能是開展課程知識討論,次要功能則是激發并維持學生的學習動機,引導、鼓勵學生不斷參加學習。

在前10位術語中,“輔導”出現了3次,“在線(遠程)”出現了4次,這比較好地體現了本課程的特點,即在線學習輔導。而排在前兩位的是“輔導教師”和“電大”,這更能說明這次培訓的內容和對象的特點。無一例外,本次培訓的對象全部來自電大系統,所以他們對本系統是最關注的,另外他們對如何做好“輔導教師”也是最關心的,所以他們選擇了這門課。從這些術語可以看出,本期的討論比較成功,課程的設計也比較合理,能夠滿足學生的需求。

接著,作者對各單元使用的普通詞匯(包括動詞和名詞等實詞,不含虛詞,不含術語)使用頻次進行統計,以體現輔導教師的語言藝術和輔導特色。其中使用頻次排名前十的普通詞匯分別是“同學、加油、學生、謝謝、可以、學習、問題、課程、研究、討論”。“加油”和“謝謝”這兩個詞的大量使用反映了輔導教師為學生提供的情感支持。輔導教師時時刻刻不忘鼓勵、支持任何一位學生的發言和進步,處處對他們的討論表示感謝,無論發言是否精彩,無論對他們的觀點是否贊同,都通過“加油”和“謝謝”表示感謝。

(3)師生交互的動態過程與靜態結構

我們從師生交互發帖時間分布以及師生交互網絡分析來了解師生交互的動態過程與靜態結構。本培訓課程設有6個單元外加大論文指導環節(實際上是7個單元),計劃教學時間是6周,一個單元用時一周。理想情況下,學生應該在規定的學習時間內完成相應單元的活動,但事實并非如此。以每個單元的“話題討論”為例,某個單元的話題往往要持續3周才會真正結束。各單元討論活動隨時間分布情況如表4所示。

表4中帶*號的數字部分是在單元規定學習時間內的發帖數量,但是每個單元在規定學習時間后,在隨后的2至3周還陸續有帖子發出來。于是從第3單元開始,將會有3個單元的活動疊加在一起。出現這種疊加現象,可能較大程度上是由工學矛盾造成的。學生不能及時完成本周的學習活動,所以會往后拖延。其實,從學生的角度是可以理解的,這也要求我們的在線教學要有一定的靈活性。同時,也恰恰是在第3周開始出現第一個assgignment(小論文),學生的負擔開始加重。正是當“新債舊債”交織在一起的時候,出現了連鎖式疊加的現象。當然,這種現象也會無形中增加輔導教師的負擔。

根據輔導教師和學生發帖、回帖的關系,借助UCINET社會網絡分析工具,可繪制師生交互網絡圖,如圖3所示。從圖3可以看出,所有24個成員(包括輔導教師,如圖中編號為68的正方形節點)均在一個網絡中,不存在孤立的成員。

篇(9)

2001年以來,信息推送模式成為我國圖書情報界關注與討論的熱點,對信息推送的技術、內容、方式、應用和存在的問題等進行了研究[7],尤其在數字圖書館信息推送中得到較多的實踐,如浙江大學圖書館推出了入藏新書郵件推送服務[8],西北工業大學圖書館對三大索引收錄論文進行郵件推送服務等[9]。期刊擁有3支較大的隊伍,即作者隊伍、審稿專家隊伍和編委隊伍,他們是期刊文獻潛在的用戶群。由于用戶以拉取模式獲取期刊文獻存在以上問題,筆者提出基于用戶科研工作文獻信息的需要,以電子郵件方式進行期刊文獻的推送,以便用戶能夠及時獲取和引用相關文獻信息。這樣可以宣傳與推介期刊,轉變服務理念,由過去的用戶單向被動獲取文獻,到現在的期刊主動出擊,從而加強用戶與期刊的互動與合作,以實現“推”“拉”結合的方式,為用戶提供更及時、主動和有針對性的文獻服務,提升期刊文獻的顯示度、利用率和影響力。

2電子郵件系統進行期刊文獻推送的策略

2.1用戶數據庫的建立

要向用戶推送期刊文獻,必須要有需求期刊文獻用戶的數據信息和電子郵件地址等,可以通過多種渠道準確獲取用戶的有關信息:一是通過編輯部的投審稿系統提取投稿作者及評審專家的信息,如用戶姓名、研究方向及電子郵箱等;二是通過編委資源庫獲取相關編委的個人信息;三是通過行業學術會議的通訊錄等提取相關專業學者的信息;四是通過高校院系網站獲取專業學科帶頭人及有關學者的信息;五是與其他期刊編輯部進行資源互換,獲取有關專家的信息。將收集到的用戶數據(用戶名、專業方向、電子郵箱等)建立在群發郵件工具Outlook(或OutlookExpress等)中,及時更新用戶數據庫,并將用戶按照專業方向進行歸類分組,不斷挖掘和發現用戶文獻信息的需求。

2.2期刊文獻的提取

篇(10)

中圖分類號:G251.5文獻標識碼:A文章編號:1003-1588(2015)03-0113-03

服務是圖書館永恒的主題,程煥文提出圖書館精神為“智慧與服務”[1]。2008年孫浩在論文《關于文獻計量服務的研究》首次提出文獻計量服務(Bibliometric Service)的概念以及相關理論。文獻計量服務工作是促進知識生產的配套措施,是采用數學分析工具和計算機技術對各類文獻計量特征進行統計分析,從而發現文獻情報規律、文獻管理方法以及學科發展趨勢的情報服務工作,向讀者和社會提供全方位的文獻分布藍圖[2]。文獻計量服務理念恰好符合圖書館智慧服務的精神,迎合了圖書館深層次、學科化服務的理念,作為拓展延伸高校圖書館科研支持服務的新生長點,在一定程度上能夠很好地適應當前高校及其科研工作者的信息需求,為圖書館轉變職能角色以及深化學科服務提供了切實可行的理論、方法和途徑。

1開展文獻計量服務工作的基礎

隨著網絡信息技術的飛速發展以及全面的數據庫資源的開發,分析型數據庫也隨之出現,其中比較著名的有SCI、SSCI、ESI、CSSCI、EI、Scopus、Incites等,這些數據庫可以為文獻計量服務提供全面而可靠的統計源,即硬件條件。文獻計量服務要求圖書館員掌握一定量的數學分析工具和計算機技術方法來對各種類型的文獻計量特征進行統計分析,這項工作具有很強的知識性與技術性。高校圖書館近年來引進大量高素質高水平人才,其中包含一批既具有學科背景又有圖書情報專業知識的全能型館員,雖然目前他們暫時分布在各個業務部門,但經過專業訓練,就會形成一支能夠開展文獻計量服務的隊伍,因此目前高校圖書館已經具備開展文獻計量服務的技術保障與人員力量,這為文獻計量服務工作的開展奠定了堅實的基礎。

2文獻計量服務的內容

文獻計量服務是使用文獻計量(信息計量)分析方法和工具,通過一定的情報分析和文獻數據挖掘技巧,對文獻進行深層次的加工,技術含量較高,屬于高層次的知識服務工作。在高校開展文獻計量服務,通過對各類文獻計量特征進行統計與分析,從而發現文獻情報規律、文獻管理方法以及學科發展趨勢,達到對研究機構、科研工作者或學科科研競爭力以及學科發展態勢發展狀況等進行客觀評估及分析[3],以評估科研績效和檢測科研發展態勢,從而輔助科研管理者進行科研決策,包括學校人才的整體狀況分析以及各學科師資力量的分布、科研課題的申報與獎勵,科研基金分配、成果獎勵、人才選拔與引進等。輔助研究者的科學研究包括分析本學科的發展態勢、個人的科研業績以及在同行中的競爭優勢、研究前沿、趨勢、引領學科發展等。具體可以通過對學術期刊、文獻的統計分析,了解研究機構分布、學科的成長階段判斷、發展趨勢預測等,以此作為評價學科發展的依據。通過對科研能力、優勢學科分布、發展狀況、人力資源狀況、科研效率等進行統計分析,可以對學術機構進行評價。還可以通過某一著者的科研論文及專著發表情況、研究領域與專長、學術貢獻、科研潛在能力等進行著者評價。文獻計量服務在很大程度上是以大型分析數據庫作為依據,主要以科研論文作為學科分析與評價統計源,具體的基于論文數據平臺的學科分析見表1。表1學科分析常用論文數據庫平臺

數據庫名稱評價指標評價內容評價維度ESI數據庫國際論文總量排名總體科研表現國際論文總被引排名總體學科影響力學科綜合實力Incites數據庫WOS數據平臺論文占全球的比例科研活躍度論文總被引占全球的比例科研影響力學科H指數學術綜合實力學術影響力Incites數據庫ESI數據庫WOS數據平臺篇均被引的全球均值比科研平均質量ESI高被引論文或熱點論文比例科研前沿性頂級期刊論文的國際份額同行認可度基金項目的論文質量項目完成質量學術質量Incites數據庫國際合作論文占全球的比例國際科研合作國際會議論文占全球的比例國際學術交流國際合作與交流WOS數據平臺跨院系的合作論文比例學科交叉活躍度跨院系的合作論文的學科分布學科交叉的聚度跨院系的合作論文的期刊及被引學科交叉的質量學科交叉王芳,龐德盛,楊錯:高校圖書館開展文獻計量服務的探索與思考王芳,龐德盛,楊錯:高校圖書館開展文獻計量服務的探索與思考學校的職能部門即科研管理者和科研機構及科研工作者對文獻計量服務的關注側重點各有不同,因此文獻計量服務針對不同的對象采取不同的服務內容,這樣服務才更合理、更具針對性。

3文獻計量服務的模式

根據文獻計量服務的特點,將服務模式分為兩種,主動推送和用戶個性化定制。主動推送就是定期通過微博、微信、圖書館主頁、簡報等平臺主動推送服務產品,或通過培訓講座、問卷調查、讀者沙龍等形式讓大家充分了解圖書館館員所做的工作及其價值,特別是工作開展初期,在用戶對文獻計量服務不了解的情況下,這種模式可以讓用戶了解文獻計量服務人員所能做的科研服務內容及服務價值。圖書館可以提供個性化服務,年齡在40歲以上的副教授和教授由于在業界已經有了一定名譽和地位,可以對他們進行團隊學術影響力的分析(包括團隊科研成果的產出情況、被引用情況及影響力、H指數以及與其他團隊合作情況進行分析),同時也關注教授個人在全球、國內、同行中的位置,如某教授本人的科研狀況分析,某教授科研論文發文量和被引情況分析。而對于剛進入科研領域的年輕教師,文獻計量服務就要重點關注學者個人學術影響力的分析和所在學科領域的發展態勢,還可以對教師本人在本學科領域的成就和影響力進行分析評價。文獻計量服務的個性化科研分析,不僅有利于挖掘學科領域中堅力量和有潛力的科研人才,還可以挖掘某一領域的知識淵源、演進脈絡、熱點研究等內容。通過對高校及其內部的各種計量對象進行統計分析,可以為高校管理者的科研決策提供參考。

4文獻計量服務的業務框架

通過分析文獻計量服務的對象、模式及核心業務流程,并將這些流程與服務業務框架有機融合在一起,初步建立起文獻計量服務的業務框架。文獻計量服務工作首先要確定服務對象的層次進而選擇相應的服務模式,然后找出與之相匹配的服務方法,再根據文獻計量服務的核心業務流程進行有效文獻計量產品的創造,最后綜合反饋的結果,進行數據的綜合分析,形成最終的文獻計量服務報告。

5討論

5.1文獻計量服務是圖書館構建主導型服務模式的途徑

近年來,隨著圖書情報事業外部發展環境的不斷變化以及圖書情報學新理論、新思想的不斷呈現,圖情專家開始從廣義的服務視角,思索探討發揮圖書情報機構的文獻計量功能。高校圖書館新時期提升工作水平的一個重要突破口就是著力強化決策服務功能,顯著提升參考咨詢工作水平。高校圖書館特別是研究型高校圖書館擁有豐富的文獻信息資源優勢,又集合了專業學科館員力量,大多具有調研課題的成功經驗,完全有條件建立文獻計量服務部門。圖書館應加快情報服務水平的提升,提供與教學科研相關的信息和情報研究產品,構建主導型服務模式。

5.2文獻計量服務是實現高校圖書館可持續發展的選擇

將文獻計量服務理念引入高校圖書館,更好地實現智慧服務,不僅可以提高圖書館對高校教學和科研的影響力,而且可以為圖書館尋求和發展服務新的生長點提供有力支持。隨著現代信息技術的不斷發展,圖書館情報學的技術含量也相應地提高,賦予其全新內涵,可以說,加強并大力發展圖書情報領域學科化服務必然成為高校圖書館可持續發展的要求。文獻計量服務為高校圖書館在大學中的角色轉變打開一扇新的大門,使圖書館參與到高校的科研發展、政策制定和學科引領之中,轉變其在高校發展中的邊緣角色。通過創新服務,真正迎合用戶科研支持服務需求,探索有效的文獻計量服務模式,建立可持續發展的長效服務機制,真正實現圖書館服務的不可替代性,實現高校圖書館的可持續發展[5]。

5.3文獻計量服務是高校發展的需要

學科建設是高等院校提高教學質量和科研水平的重要基礎,而學科發展策略的制定首先需要對自身的學科發展情況進行客觀準確的評估和分析,進而合理地完善自身的學科體系、加強重點學科的優勢。國內外高校也越來越重視通過各種類型的學科評估把握自身的學科發展態勢、本學科的優勢和劣勢、重點研究方向、資源分配方案等,從而對高校的學科發展戰略提供重要依據和指導意義。通過文獻計量和相關統計數據的分析能幫助科研人員很好地判斷出某一學科的發展現狀、發展趨勢及潛力,同時也能在一定程度上判斷出科研人員的科研能力、學術水平及影響力。隨著文獻計量理論研究和應用的不斷深入,適時在高校圖書館推出文獻計量服務模式是一種必然趨勢。在信息化大環境下,面對新的機遇和挑戰,高校圖書館必須積極分析自己的優勢并加以充分利用與發揮,提升圖書館的軟實力。

參考文獻:

[1]程煥文.實在的圖書館精神與圖書館精神的實在――《圖書館精神》自序[J].大學圖書館學報,2006(4):2-14.

[2]孫浩.關于文獻計量服務的研究[J].現代情報,2008(6):64-66.

[3]孫玉偉,劉昌榮,朱玉強.大學圖書館文獻計量服務實踐探索[J].圖書館雜志,2014(1):56-61.

篇(11)

中圖分類號:F299.2 文獻標識碼:A 文章編號:1672-3198(2010)02-0028-02

1 分部門、分災種的危機管理決策支持系統

我國防震減災系統應用和輔助決策系統的發展是與計算機技術,主要是GIS技術的發展相輔相成的。在20世紀80年代初,我國通過世行貸款開始了有關城市地理信息系統的開發研究。“九五”期間,結合950 項目(大中城市防震減災示范研究與應用),地震系統有關單位在烏魯木齊、天津、大連、合肥、自貢、泰安、福州、廈門等地建立了各自地區的“基于GIS的防震減災信息與輔助決策系統”,利用GIS等工具軟件,姚保華(2002)將區域地震環境、震害預測成果和應急輔助決策模塊等進行集成。云南地震局王景來(1999)將GIS應用到地震災害的評估提出將地震災害評估智能化或半智能化的設想,在此基礎上建立了玉溪地震減災信息系統。上海地震局宋俊高、火恩杰等(2000)將GIS應用到城市防震減災應急研究,以上海市寶山區為試點,建立了上海市防震減災應急決策信息系統。王曉青等(2004)利用現代通訊技術、GIS技術和信息處理技術,構建了基于GIS的地震現場災害損失評估系統,實現破壞性地震發生后地震現場災害損失的快速、動態評估,現場震情和災情信息的顯示以及各種信息的遠程交換。

火災是各種災害中發生最頻繁且具有很強破壞性的一種。謝喚亮(1997)給出了基于GIS的決策支持系統的框架,并在南京市消防指揮中心初步實現。許云,任愛珠(2003)對虛擬現實技術(VR)在基于GIS的城市消防指揮系統中的應用進行了研究。朱霽平(2004)建立城市火災應急決策支持系統,一旦發生火災,信息可以迅速傳遞到指揮中心,并快速模擬災害現場情況、預測災害發展趨勢,綜合各種要素,生成救援方案,有效調度和科學利用消防減災資源。

國內防洪減災決策支持系統的研究起源于20世紀80年代末期,特別是國家在“八五”期間安排的“八五”重點科技攻關項目――長江、黃河、淮河防洪減災DSS研究,出現了很多比較成功的成果,胡四一等(1996)在分析總結長江中下游防洪經驗和防洪決策流程的基礎上,研究防洪決策支持系統建立的開發模式、程序、方法、技術和應用模式,研制和開發了系統中總控管理――人機界面系統、數據庫、知識庫、系統接口和通訊軟件、洪水演進和調度仿真模型、防洪決策風險分析模型等,初步建立了可運行的原型系統,并通過聯機試驗運行、檢驗系統設計、推進分洪決策支持系統的實際應用。到20世紀90年代初,又有翁文斌等開發的安陽市防洪DSS,浙江省洪澇臺風災害預報及省級防洪調度決策系統、黃河防洪調度決策支持系統和長江防洪決策支持系統等投入運行。這些系統都以關系數據庫為核心,系統具有一定的可擴展性、可移植性。余達征等(1999)針對防洪減災DSS的不足和防洪減災決策的特點,將專家系統中的知識處理思想引入防洪減災DSS中以解決其不足之處。設計出智能型的城市防洪減災DSS。

2 城市危機管理決策支持系統

2.1 城市危機管理決策支持系統理論研究

韓燕暉將城市公共危機防范與救助系統分為指揮決策系統這一上位系統與預警系統、預案系統、信息系統、保障系統、動員系統、善后系統等六個下位系統。劉寧認為突發事件應急決策支持系統是用戶通過人機交互與系統主推理機連接,并借助規則、案例、模糊知識推理部分共同完成不同庫間的調用和內部推理求解。朱曉峰等根據政府決策支持系統的信息復雜程度和時效程度將其分為四大類:日常決策支持系統、宏觀決策支持系統、重大活動決策支持系統和危機決策支持系統。惠志斌構造了由危機信息管理預警、危機信息管理知識、危機管理指揮、危機管理反應、危機管理恢復等子系統構成的綜合性危機信息管理系統。谷巖,馮華綜介運用數據倉庫、聯機分析處理(OLAP)、數據挖掘、信息智能推拉等多種信息處理技術,以多種形式靈活地生成各種應急方案。徐志勝等以地理信息系統(G1S)為平臺,集成決策支持系統(DSS),研究開發了“基于G1S的城市公共安全應急決策支持系統”。唐裙裙認為應該采用五級架構,底層是硬件支持層;其次是基礎信息層;基于其上的是決策支撐平臺層;再上層是決策應用平臺層;最上層是用戶界面,需要針對不同類型的用戶進行設計。張茜公共危機管理決策支持系統的主要功能包括機理分析、預警預報、資源優化、綜合評價和決策建議。柳宗偉,景廣軍提出利用信息技術促進我國城市危機管理機制創新的思路,即建立以統一機構(城市危機管理中心)為核心的調度統一、聯動協調、信息共享的城市綜合危機管理機制,研制實用的城市危機管理決策支持系統以支持該模式的高效運作。

2.2 城市危機管理決策支持系統技術支撐

在智能決策支持系統的算法研究方面,研究的焦點集中在GIS路徑優化、案例檢索算法以及數據挖掘等方面:黃詩峰等對災民撤退網絡流模型及其GIS模擬技術進行了深入研究;羅忠良對案例推理系統中案例檢索算法的改進進行了探討;馮興杰等對有關數據挖掘及其關聯規則算法進行了詳細地討論;陶靈皎,孫繼銀等對決策樹的算法進行詳細探討并針對自己的研究對象作了適當優化;王秀坤等設計了改進的EM算法并實現了在防洪決策中的應用。

2.3 城市危機管理決策支持系統工程實踐

2003年“非典”事件后,我國目前許多城市已經開始設置專門的應急管理機構,將應急管理作為政府的一項日常的工作來抓,使城市應急管理逐漸走上正規化和制度化的軌道。已建成的城市應急管理機構有北京市突發公共事件應急委員會、上海市突發公共事件應急管理委員會、深圳市處置緊急事務委員會、廣州110社會聯動中心、武漢市110聯動服務中心、南寧市社會應急聯動中心等。城市危機管理信息系統一般由以下四個子系統,即應急指揮系統、應急業務處理系統、信息與資源共享系統、決策支持系統組成。管理決策支持系統作為城市危機管理信息系統的一個子系統,目前大多城市尚未進行專門建設。但在某些城市危機管理信息系統中包含了初步的輔助決策功能,下面分別對具有代表性的北京、天津、深圳、臺灣的城市危機管理信息系統中所包含的輔助決策功能進行介紹。

北京市危機管理信息系統主要由以下子系統組成:①網絡通信子系統,比如有政府網、應急呼報警網;②信息數據庫子系統,城市地理環境數據庫、城市社會經濟數據庫、災害歷史數據庫;③應急評估數學模型子系統,危機事件潛勢預測模型、社會災變心理分析模型等;④對策預案子系統,綜合應急管理總體預案,單災種專業應急預案,預案實施決策流程;⑤專業救援子系統,比如醫療急救網、消防網自然災害現象救援保障,還有公共設施搶修隊,治安和反恐防爆隊。這里應急評估數學模型子系統和對策預案子系統就包含了初步的輔助決策功能。其應急指揮系統中心設計聯動國家減災中心、水利、氣象、地震、消防社區、單位重點區域,城市生命線系統管理部門,它有一些監測設備,比如現場空中監測,還有現場救援指揮車,對突發公共事件進行災害的動態顯示。還有應急對策的顯示系統,根據專家的意見和對策,進行會商結果,最后形成一個綜合的減災策指令。

天津市負責突發公共事件應急管理的主要部門是防災應急指揮中心,配置有線、無線通信系統、指揮輔助決策系統、指揮辦公自動化系統、遠程圖像傳輸系統、綜合視訊系統、應急供電、供水系統、樓宇保安監控系統等,運用現代通信網絡和高技術手段,實現各類應急信息的收集、處理、整合,為市領導處置重大災害和突發事件實施應急指揮提供了基本平臺和手段。指揮中心在樓設置了專家會商室和相關單位、搶險專業組、應急救援隊工作室,可集中各險種專家和專業組、隊共同會商,為領導提供輔助決策。

深圳市應急指揮系統的輔助決策概況:深圳政府特別重視對預案信息系統的設計和開發。深圳有關部門制定和修改了各項應急預案,明確各類突發事件分級分類定量標準,提高預案的可操作性,并建成預案數據庫,納人應急指揮技術平臺的“預案生成系統”。深圳市發生重特大突發性事件時,市領導不但可以在應急指揮中心通過視頻、音頻系統進行現場指揮,還通過地理信息系統和電子地圖了解事件發生地點的具置及周邊情況。同時,系統還將根據現場和數據庫中的各種數據,自動生成多個應急預案以供領導決策選擇。

臺灣的災害管理決策支持系統研究結合了地理信息系統(GlS)、遙感(RS)、全球定位系統(GPS)以及日益成熟的網絡技術,建立一套整體性的防災救災決策支持系統。該系統使用災害生命周期法來進行決策支持系統整體架構的規劃,將災害從發生前至發生后的整個過程視為一個完整的災害管理循環周期,并進一步分析各階段所需的決策支持需求,運用模組化的概念規劃其中的各項子系統。完整的災害防救決策支持系統資料庫由地理資料庫、氣象水文觀測資料庫、歷史性災害資料庫、趨勢分析與境況模擬成果資料庫、詮釋資料庫等五大資料庫組成。臺灣是多發地震的地區,以該系統的地震知識管理為例,通過“案例式推理”的研究方法,搜集臺灣歷年來都市層級的地震防災救災相關研究(不含地質研究、地震工程)案例一百余例,并利用英國Wales大學所開發的CBR軟件caspian(1999),建置“地震防災救災文獻案例式查詢系統”,探討其應用于都市防災救災的可行性,初步獲得了良好的成果。

參考文獻

[1]姚保華,陶夏新.分布式防震減災系統的可行性[M].南京:東南大學出版社,2002.10.

[2]王曉青,丁香.基于GIS的地震現場災害損失評估系統[J].自然災害學報,2004, 13(1):118-125.

[3]許云,任愛珠,潘國帥.基于GIS和VR的消防指揮系統研究[J].土木工程學報,2003,36(5):92-96.

[4]朱霽平.基于GIS的城市火災應急空間決策支持系統和仿真模型[D].中國科學技術大學博士學位論文,2004.

[5]谷巖,馮華.智能化城市防災救災應急處理支持系統的研究[J].計算機工程與設計,2005,(6): 1503-1505.

主站蜘蛛池模板: 凌源市| 会东县| 大埔县| 芷江| 泰来县| 杨浦区| 华蓥市| 杭锦后旗| 德清县| 铜川市| 吉林省| 洛宁县| 莱西市| 洞头县| 北辰区| 勐海县| 历史| 咸丰县| 班玛县| 华坪县| 武定县| 张家口市| 仁化县| 鲜城| 松桃| 偃师市| 射阳县| 孝感市| 宿州市| 禹州市| 洱源县| 车致| 崇信县| 泸水县| 万源市| 南漳县| 克什克腾旗| 白沙| 沈阳市| 灵武市| 弋阳县|