반응형
HDFS의 특정 디렉토리의 파일 갯수를 알고 싶을 때가 있다.
그럴 때 사용할 수 있는 명령어이다.
hdfs dfs -count {path}
# 1000개를 K 단위로 바꾸어서 보여준다
hdfs dfs -count -h {path}
특정 디렉토리 내 하위 디렉토리들의 정보를 다음과 같이 한번에 조회할 수도 있다.
hdfs dfs -count hdfs://path/to/count/*
조건을 잘 설정하면 특정 문자로 시작하는 디렉토리만 조회하는 등의 응용도 가능하다.
반응형
'개발 > Data Engineering' 카테고리의 다른 글
Apache Hudi Hive Sync (0) | 2022.07.08 |
---|---|
Apache Airflow 재수행 방법 정리 (0) | 2022.04.21 |
Apache Airflow DAG 간의 dependency 설정 (0) | 2022.01.25 |
Apache Hudi 소개 - HDFS upsert/delete (0) | 2021.07.11 |
Avro와 Parquet (0) | 2021.06.24 |