傳統的企業方法
在這種方法中,一個企業將有一個電腦存儲和處理大數據。對於存儲而言,程式員會自己選擇的資料庫廠商,如Oracle,IBM等的幫助下完成,用戶交互使用應用程式進而獲取並處理數據存儲和分析。

局限性
這種方式能完美地處理那些可以由標準的資料庫伺服器來存儲,或直至處理數據的處理器的限制少的大量數據應用程式。但是,當涉及到處理大量的可伸縮數據,這是一個繁忙的任務,只能通過單一的資料庫瓶頸來處理這些數據。
穀歌的解決方案
使用一種稱為MapReduce的演算法穀歌解決了這個問題。這個演算法將任務分成小份,並將它們分配到多臺電腦,並且從這些機器收集結果並綜合,形成了結果數據集。

Hadoop
使用穀歌提供的解決方案,Doug Cutting和他的團隊開發了一個開源專案叫做HADOOP。
Hadoop使用的MapReduce演算法運行,其中數據在使用其他並行處理的應用程式。總之,Hadoop用於開發可以執行完整的統計分析大數據的應用程式。

上一篇:
下一篇:
Hadoop是什麼?