Hadoop HDFS操作

啟動HDFS

首先,格式化配置HDFS檔系統,打開NameNode(HDFS伺服器),然後執行以下命令。

$ hadoop namenode -format

格式化HDFS後,啟動分佈式檔系統。以下命令將啟動名稱節點和數據節點的集群。

$ start-dfs.sh

HDFS的檔列表

加載伺服器資訊後,使用'ls' 可以找出檔列表中的目錄,檔狀態。下麵給出的是ls,可以傳遞一個目錄或檔案名作為參數的語法。

$ $HADOOP_HOME/bin/hadoop fs -ls <args>

將數據插入到HDFS

假設在本地系統,這是所謂的file.txt檔中的數據,應當保存在HDFS檔系統。按照下麵給出插入在Hadoop的檔系統所需要的檔的步驟。

第1步

必須創建一個輸入目錄。

$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/input

第2步

傳輸並使用本地系統put命令,Hadoop檔系統中存儲的數據檔。

$ $HADOOP_HOME/bin/hadoop fs -put /home/file.txt /user/input

第3步

可以使用ls命令驗證檔。

$ $HADOOP_HOME/bin/hadoop fs -ls /user/input

從HDFS中檢索數據

假設在HDFS檔案名為outfile。下麵給出的是一個簡單的演示用於檢索從Hadoop檔系統所需的檔。

第1步

最初,使用cat命令來查看來自HDFS的數據。

$ $HADOOP_HOME/bin/hadoop fs -cat /user/output/outfile

第2步

從HDFS得到檔使用get命令在本地檔系統。

$ $HADOOP_HOME/bin/hadoop fs -get /user/output/ /home/hadoop_tp/

關閉HDFS

可以使用下麵的命令關閉HDFS。

$ stop-dfs.sh 

上一篇: Hadoop HDFS 下一篇: Hadoop命令參考