HDFS file count 조회

HDFS의 특정 디렉토리의 파일 갯수를 알고 싶을 때가 있다.

그럴 때 사용할 수 있는 명령어이다.

hdfs dfs -count {path}
# 1000개를 K 단위로 바꾸어서 보여준다
hdfs dfs -count -h {path}

특정 디렉토리 내 하위 디렉토리들의 정보를 다음과 같이 한번에 조회할 수도 있다.

hdfs dfs -count hdfs://path/to/count/*

조건을 잘 설정하면 특정 문자로 시작하는 디렉토리만 조회하는 등의 응용도 가능하다.