spark에서 아무리 파일 명을 설정해서 저장하고 싶어도 특정 패턴으로 파일 명이 생성 된다... 이때 파일명을 가지고 와서 rename 해주면 원하는 파일 명으로 바꿀 수 있다.
import org.apache.hadoop.fs._
val hdfsUrl = "hdfs://nameservice1/user/zeppelin/data/myfolder/"
val file_path = "part*"
val new_fileName = "nevFile.csv"
val fs = FileSystem.get(sc.hadoopConfiguration)
val file = fs.globStatus(new Path(hdfsUrl + file_path))(0).getPath().getName()
fs.rename(new Path(hdfsUrl + file), new Path(hdfsUrl + new_fileName))
반응형
사업자 정보 표시
라울앤알바 | 장수호 | 서울특별시 관악구 봉천로 13나길 58-10, 404호(봉천동) | 사업자 등록번호 : 363-72-00290 | TEL : 010-5790-0933 | Mail : shjang@raulnalba.com | 통신판매신고번호 : 2020-서울관악-0892호 | 사이버몰의 이용약관 바로가기
'programmer > Spark' 카테고리의 다른 글
kafka connect, ms source connector 설치방법 (0) | 2023.07.10 |
---|---|
confluent-hub 설치 방법 (0) | 2023.07.10 |
아파치 카프카 스터디 (0) | 2023.06.26 |
spark query 모음 (0) | 2021.04.13 |
value toDF is not a member of org.apache.spark.rdd.RDD 에러 (0) | 2021.04.08 |