semaphore提示您:看後求收藏(思兔閱讀sto.ist),接著再看更方便。
數據是指對客觀事件進行記錄並可以鑒彆的符號y
是對客觀事物的性質狀態以及相互關係等進行記
載的物理符號或這些物理符號的組合y是可識彆的
抽象的符號
?數據和信息是兩個不同的概念y信息是較為宏觀
的概念y它由數據的有序排列組合而成y傳達給讀
者某個概念方法等y而數據則是構成信息的基本單
位y離散的數據沒有任何實用價值。
數據也被稱為“未來的石油”
涉及到國家安全等方麵。
計算機係統中的數據組織形式主要有兩種y即文件和
數據庫
?
1?文件x計算機係統中的很多數據都是以文件形式
存在的y比如一個word文件一個文本文件一個
網頁文件一個圖片文件等等
?
2?數據庫x計算機係統中另一種非常重要的數據組
織形式就是數據庫y數據庫已經成為計算機軟件開發
的基礎和核心。
過去x一旦數據的基本用途實現了y往往就會被
刪除y一方麵是由於過去的存儲技術落後y人們
需要刪除舊數據來存儲新數據y另一方麵則是人
們沒有認識到數據的潛在價值
現在x數據的價值不會因為不斷被使用而削減y
反而會因為不斷重組而產生更大的價值
將來x各類收集來的數據都應當被儘可能長時間
地保存下來y同時也應當在一定條件下與全社會
分享y並產生價值。
人類進入信息社會以後y數據以自然方式增長y其產生不以人
的意誌為轉移
從1986年開始到2010年的20年時間裡y全球數據的數量增長
了100倍y今後的數據量增長速度將更快y我們正生活在一個
數據爆炸的時代。
數據分析過程包括x數據采集與預處理數據存儲與管理數據處理與
分析數據可視化等
?
1?數據采集與預處理x采用各種技術手段把外部各種數據源產生的數
據實時或非實時地采集預處理並加以利用
?
2?數據存儲與管理x利用計算機硬件和軟件技術對數據進行有效的存
儲和應用的過程y其目的在於充分有效地發揮數據的作用
?
3?數據處理與分析x數據分析是指用適當的分析方法?來自統計學
機器學習和數據挖掘等領域?y對收集來的數據進行分析y提取有用信
息和形成結論的過程
?
4?數據可視化x將數據集中的數據以圖形圖像形式表示y並利用數據
分析和開發工具發現其中未知信息的處理過程。
數據采集與預處理包含了數據采集和數據預處理兩大任務
數據采集是指從傳感器和智能設備企業在線係統企業離線
係統社交網絡和互聯網平台等獲取數據的過程需要采集的
數據包括rfid數據傳感器數據用戶行為數據社交網絡交
互數據及移動互聯網數據等各種類型的結構化半結構化及非
結構化的海量數據
數據采集技術是大數據技術的重要組成部分y已經廣泛應用於
國民經濟各個領域y隨著大數據技術的發展和普及y大數據采
集技術會迎來更加廣闊的發展前景。
數據預處理目標是為後續的數據分析工作提供可靠和高質量的
數據y減少數據集規模y提高數據抽象程度和數據分析效率