본문 바로가기

programmer/Spark

[파일명] dataFrame을 파일로 저장 시 파일 명 바꾸기

 

spark에서 아무리 파일 명을 설정해서 저장하고 싶어도 특정 패턴으로 파일 명이 생성 된다... 이때 파일명을 가지고 와서 rename 해주면 원하는 파일 명으로 바꿀 수 있다.

import org.apache.hadoop.fs._

val hdfsUrl = "hdfs://nameservice1/user/zeppelin/data/myfolder/"
val file_path = "part*"
val new_fileName = "nevFile.csv"
val fs = FileSystem.get(sc.hadoopConfiguration)
val file = fs.globStatus(new Path(hdfsUrl + file_path))(0).getPath().getName()

fs.rename(new Path(hdfsUrl + file), new Path(hdfsUrl + new_fileName))
반응형
사업자 정보 표시
라울앤알바 | 장수호 | 서울특별시 관악구 봉천로 13나길 58-10, 404호(봉천동) | 사업자 등록번호 : 363-72-00290 | TEL : 010-5790-0933 | Mail : shjang@raulnalba.com | 통신판매신고번호 : 2020-서울관악-0892호 | 사이버몰의 이용약관 바로가기