티스토리 뷰

"시작하세요! 하둡 프로그래밍"의 개정1판과 개정2판의 수정사항을 정리해봤습니다.


개정 1판 수정 사항

1. 삭제된 내용


초판에서 하둡 적용 사례 중 일부와 부록 부분을 삭제했습니다.

  • 13장 2절 넥스알 하둡 생태계를 활용한 KT 분석 플랫폼 구축 사례

  • 13장 3절 그루터 빅 데이터 기술을 이용한 소셜 네트워크 데이터 분석 서비스 •부록A 윈도우 환경에서 설치하기

  • 부록B 하둡 2.0 소개

2. 추가된 내용


개정 1판에서는 다음과 같은 내용이 새롭게 추가됐습니다.

  • 5장 1절 맵리듀스 잡의 실행 단계

  • 8장 7절 압축 코덱 선택

  • 9장 1절 클러스터 계획하기

  • 9장 11절 셸 스크립트를 이용한 배포 관리

  • 10장 3절 MR유닛

  • 12장 하둡2 소개

  • 13장 하둡2 설치

  • 14장 얀 애플리케이션 개발하기

  • 15장 얀 아키텍처 이해하기

  • 16장 얀 클러스터 운영하기

  • 17장 4절 파티션 테이블

  • 17장 5절 데이터 정렬

  • 17장 6절 데이터 저장 포맷

  • 18장 스쿱

  • 19장 타조 활용하기

  • 20장 2절 아프리카TV의 추천 시스템 구축 사례

  • 20장 3절 타조를 이용한 코호트 분석

  • 부록A 하둡 개발환경 설정하기

3. 수정된 내용

기존 내용을 새롭게 작성했습니다.

  • 3장 2절 HDFS 아키텍처

  • 4장 1절 맵리듀스의 개념

  • 4장 2절 맵리듀스 아키텍처

  • 5장 1절 맵리듀스 잡의 실행 단계

  • 5장 2절 분석용 데이터 준비

4. 예제 코드

기존 예제 코드를 모두 리팩터링했으며, 빌드 방식도 ANT 기반에서 Maven 기반으 로 변경했습니다.

5. 실습 소프트웨어의 버전 변경

  • 하둡 1.0.3 → 하둡 1.2.1, 하둡 2.6.0

  • 하이브 0.8.1 → 하이브 0.14.0


개정 2판 수정 사항

1. 추가된 내용

개정 2판에서는 다음과 같은 내용이 새롭게 추가됐습니다.

  • 9장 12절: 리눅스 서버 커널 설정 중 튜닝이 필요한 요소에 대한 설명을 추가했습니다.

  • 12장 8절: SSD, 메모리 등을 하둡에서 효율적으로 활용할 수 있는 헤테로지니어스 스토리지를 소개합니다.

  • 15장 4절: 얀에서 리소스를 효율적으로 관리하기 위한 프리엠션 기능을 소개합니다.

  • 5장 5절: 얀에서 실행되는 애플리케이션의 이력을 관리하기 위한 타임라인 서비스를 소개합니다.

  • 부록B: HDFS를 온라인 상태에서 업그레이드할 수 있는 롤링 업그레이드를 소개합니다.

2. 수정된 내용

기존 원고를 다음과 같이 보완했습니다.

1장 3절 하둡 에코시스템: 최근 동향에 맞게 다양한 종류의 하둡 에코시스템을 추가했습니다.

2장 7절 단락 조회: “단락"이라는 용어를 “쇼트 서킷"으로 수정했습니다.

16장 3절 맵리듀스 설정: 얀에서 맵리듀스 환경 설정에 대한 상세한 설명을 추가했습니다


3. 실습 소프트웨어의 버전 변경

  • 하둡 2.6.0 → 하둡 2.7.2

  • 하이브 0.14.0 → 하이브 2.0.0

  • 스쿱 1.4.5 → 스쿱 1.4.6

  • 타조 0.9.1 → 타조 0.11.1


저작자 표시 비영리 변경 금지
신고