近年來,高通量和高內(nèi)涵分析成為數(shù)字化實驗室分析方法的大趨勢,而這必然導致產(chǎn)生相較于以前幾倍甚至幾十倍的數(shù)據(jù),但要知道大量的數(shù)據(jù)并非就是所謂的大數(shù)據(jù)。幾乎每個行業(yè)都會產(chǎn)生大量的數(shù)據(jù),且隨著時間呈快速增長趨勢。
大量的數(shù)據(jù)本身并非就是大數(shù)據(jù):只有當這些數(shù)據(jù)能夠按照一定的格式保存,并能有效的被查詢、進行綜合分析后可以獲取某種新的相互關系,并從中得到更有用的信息時,這樣的‘大量數(shù)據(jù)’才能被稱之為大數(shù)據(jù)。
能夠使人易于理解的大數(shù)據(jù)實際上都是經(jīng)由實驗得到的,猶如亂麻般的大量過程、結果數(shù)據(jù)。過去,雖然已經(jīng)進行了測試,但得到的這些所謂的源數(shù)據(jù)卻不能被有效的利用起來。此時,非常簡單的大數(shù)據(jù)應用就能讓您節(jié)約時間、金錢和資源。
要把積累的大量數(shù)據(jù)到變成大數(shù)據(jù)還有很多工作要做。許多實驗室數(shù)據(jù)和信息都被存儲在本地的數(shù)據(jù)庫中,更多的是記錄在紙張報告、記錄表中,被分散在一個個文件夾中,這都使得它們不能用于大數(shù)據(jù)分析。
所以如何高效得對試驗原始記錄數(shù)據(jù)進行采集成為了制約發(fā)展的重要因素,目前有些實驗室設備開放了接口可以和網(wǎng)薩實驗室管理軟件進行集成,從而自動化獲取試驗過程的數(shù)據(jù)。但是迄今為止,大多數(shù)實驗室的原始記錄還是被保存在紙質或者格式各異的電腦中。