在哲學界,關于因果關系的爭論已經持續了幾個世紀。爭論的焦點在于:如果因果關系是普遍存在的,每一個果都有一個因和他相對應,世界上的所有事情都有因果的話,我們就沒有決定任何事情的自由了。盡管哲學領域的爭論很熱烈,但并不耽誤人們在日常生活中通過因果關系來思考問題。不僅如此,由于掌握的數據過少,人們還容易從線性關系的角度找尋事物之間的因果關系。在物理學中,有一種處理數據的方式之一就是“化曲為直”,設法找到兩個變量之間的線性因果關系,從而進行定量的描述。事實上,由于很多事情之間的關系是很復雜的,簡單的線性處理容易導致人們對事物本質屬性的誤解。
在大數據時代,相關關系比因果關系重要。2009年甲型H1N1流感發生之后,美國的衛生系統極力想從因果關系上來找到流感的源頭,但信息反饋的速度太慢,讓專家們束手無策。谷歌公司做出了快速反應,把5000萬條美國人最頻繁檢索的詞條和美國疾控中心在2003年至2008年間季節性流感傳播時期的數據進行比較,研究特定檢索詞條的頻繁使用與流感在時間和空間上的傳播之間的聯系,很快就確定了流感是從哪個地方傳播出來的。谷歌采取的就是相關關系分析的方法,而不是因果關系分析的方法。這是大數據時代,對數據進行處理的一種典型方法。
第三,數據化比數字化更加重要
數字化是將模擬數據轉化成0和1的二進制碼,以便電腦進行數據處理的過程。過去的很長時間,我們所做的事情,就是對文本進行數字化。很多書籍包括教材,通過PDF等格式,變成了數字形態的資料,存入了電腦或者網路之中。
但是,這些數字化的資料要查詢起來并不方便。首先你要知道所需的資料在那本書中,其次你還要仔細地去翻閱這些數字化的資源,以便找到你所需要的信息。這和到書本里去找沒有本質的區別。
如果這些數字文本能夠被數據化,文本中的字、詞和段落能夠一一被識別,利用搜索殷勤加以檢索就會方便很多。所謂數據化就是將一種現象轉化為可以制表分析的可量化的過程,量化,是數據化的核心。信息只能被數據化,其巨大的潛在價值才有可能被釋放出來。
數字化帶來了數據化,但數字化不能替代數據化。今天,很多學校都在進行“電子書包”的課程教學實踐,但有不少實踐者認為,所為電子書包,就是將紙質的課本和教輔資料數字化,裝入電腦中讓學生上課中使用,這其實是對電子書包最大的誤解。電子書包的核心在于數據化,要通過對學生學習過程所記錄的大數據分析,把握學生的個性化學習特征,以便給予更有針對性的指導。
三、需要關注的一些問題
從教育的角度看,大數據時代的來臨,對教育的變革將帶來巨大的影響。
首先是教育內容要進行革新。大數據使得傳統的因果思維方式、科學研究方式不再是生活、工作起主導地位的方式,這必然要求我們在教學中要將這些變化和學生講清楚,以便他們能夠在今后走上社會的時候有足夠的能力迎接挑戰。
其次是教學方式要進行革新。過去的教學,因為沒有大量數據的支撐,該教什么全憑教師自己跟著感覺走。今天,我們可以將教師的教學視頻掛在晚上,通過深度分析學生在觀看視頻的過程中在哪些地方停頓或者重放的頻次比較高,來找出學生不明確或者課程吸引人的地方,幫助教師改進教學、確定教學重點。這必然導致教師教學方式的變革。
第三是學習路徑會發生變化。在過去,如果你想成為一個優秀的生物學家,一定要認識很多生物學家。今天,要解決一個生物難題,可能與天體物理學家或者數據視圖設計師聯系就可以實現。
第四是要防止對數據的癡迷。一方面,我們要研究學校長期以來儲存下來的大量數據,同時積累學校每天的教育數據,為進入大數據時代做好充分的思想準備;另一方面,要喚醒學校里沉睡的數據,讓其在學校管理和教師教學中發揮更大的作用;再一方面,也要防止出現另一個極端,那就是對數據的癡迷。能僅僅為了收集數據而收集數據,要讓數據在如何全面反映一個學生的能力、全面反映教師的教育質量等方面做出實踐和探索。