본문 바로가기

programmer/Databases

python to hive (spark)

spark 환경에 있는 hive DB를 python으로 접속하는 방법이다.

$ pip install impyla
 
from impala.dbapi import connect

conn = connect(host='IP',
               port=10000,
               user='id',
               password='pass',
               auth_mechanism='PLAIN')

cursor = conn.cursor()
cursor.get_databases()

cursor.execute("select * from DB.TABLE limit 10")
results = cursor.fetchall()
for row in results:
    print(row)
 
 

 

 

 

참조.

https://euriion.com/?p=411856 

 

Hive server 2에 python impyla 패키지로 접속하기 - 토탈 데이터과학 - Total Data Science

ipyhton 또는 그냥 python script로 Hive에 접속해서 SQL을 실행하고 결과 데이터를 가져오게 하려면 굉장히 고통스럽습니다. Python에서 사용할 수 있는 Hive 접속관련 패키지들이 상당히 불안하고 버그가

euriion.com

 

반응형
사업자 정보 표시
라울앤알바 | 장수호 | 서울특별시 관악구 봉천로 13나길 58-10, 404호(봉천동) | 사업자 등록번호 : 363-72-00290 | TEL : 010-5790-0933 | Mail : shjang@raulnalba.com | 통신판매신고번호 : 2020-서울관악-0892호 | 사이버몰의 이용약관 바로가기

'programmer > Databases' 카테고리의 다른 글

redis bulk api(java spring boot) 사용법  (0) 2021.12.07
특정 버전 mysql 설치 방법  (0) 2021.07.13
Mysql 필요 쿼리 정리  (0) 2021.03.18
mysql database 기본 명령어  (0) 2020.08.22
mysql Database password 변경  (0) 2020.08.22