티스토리 뷰

몇 일전 회사 팀블로그에 올렸던 글을, 개인 블로그에도 공유합니다.


다음 주에 릴리즈 예정인 아파치 타조(Apache Tajo) 0.10.0 버전의 JDBC 매커니즘과 BI 솔루션 및 SQL 워크벤치툴과 연동하는 방법을 작성해봤습니다.


Tajo의 TSQL, JDBC, 웹 인터페이스는 TajoClient 인터페이스를 이용하여 구현되며, 사용자가 질의를 실행할 경우 TajoClient는 TajoMaster에 질의 실행을 요청합니다. TajoMaster는 각각의 TajoWorker에서 질의를 실행하며, 실행 결과를 스토리지에 저장합니다. 


Tajo는 다양한 스토리지를 지원하기 때문에, HDFS, HBase, AWS의 S3, Openstack의 Swift, 로컬 파일 시스템등에 데이터를 저장할 수 있습니다. TajoClient는 TajoWorker에서 질의 정보를 파악한 후, 스토리지에 저장된 데이터를 직접 접근하게 됩니다. 


이러한 아키텍처는 Tajo가 메모리를 초과하는 대용량 결과를 생성하는 질의나 긴 시간이 소요되는 질의를 다룰 수 있도록 합니다. 


자세한 내용은 아래 사이트에서 확인하실 수 있습니다. ^^


http://teamblog.gruter.com/?p=1427




저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License
댓글
댓글쓰기 폼