티스토리 뷰

이번에 출간된 하둡책 개정판의 개정 내용을 공유합니다. 

사실 몇일전에 블로그 공지사항으로 올렸던 글인데요. 

티스트리 공지사항은 모바일에서 조회할 수가 없어서, 부득이하게 일반 포스팅으로 다시 올립니다. ^^;;


===========================================


많은 분들의 성원 덕분에 “시작하세요!하둡 프로그래밍”의 개정판을 출간했습니다.

초판 독자분들 중에서 개정판을 구매하신 분들을 위해서, 새롭게 수정된 내용을 정리해봤습니다.


1.삭제된 원고


초판에서 하둡 적용 사례 중 일부와 부록 부분을 삭제했습니다.


▣ 13장: 하둡 적용 사례

13.2 넥스알: 하둡 생태계를 활용한 KT 분석 플랫폼 구축 사례

13.3 그루터: 빅 데이터 기술을 이용한 소셜 네트워크 데이터 분석 서비스


▣ 부록A: 윈도우 환경에서 설치하기

▣ 부록B: 하둡 2.0 소개



2.신규 원고


개정판에서 새롭게 추가된 내용입니다.


▣ 05장: 맵리듀스 기초 다지기

5.1 맵리듀스 잡의 실행 단계


▣ 08장: 맵리듀스 튜닝하기

8.7 압축 코덱 선택


▣ 09장: 하둡 운영하기

9.1 클러스터 계획하기

9.11 셸 스크립트를 이용한 배포 관리


▣ 10장: 하둡 부가기능 이용하기

10.3 MR유닛


▣ 12장: 하둡2 소개

▣ 13장: 하둡2 설치

▣ 14장: 얀 애플리케이션 개발하기

▣ 15장: 얀 아키텍처 이해하기

▣ 16장: 얀 클러스터 운영하기


▣ 17장: 하이브 활용하기

17.4 파티션 테이블

17.5 데이터 정렬

17.6 데이터 저장 포맷


▣ 18장: 스쿱

▣ 19장: 타조 활용하기


▣ 20장: 하둡 적용 사례

20.2 아프리카TV의 추천 시스템 구축 사례

20.3 타조를 이용한 코호트 분석


▣ 부록A: 하둡 개발환경 설정하기



3.수정된 원고


기존 하둡 파일 시스템과 맵리듀스의 아키텍처 설명을 삭제하고, 새롭게 원고를 작성해봤습니다.


▣ 03장: 하둡 분산 파일 시스템

3.2 HDFS 아키텍처


▣ 04장: 맵리듀스 시작하기

4.1 맵리듀스의 개념

4.2 맵리듀스 아키텍처


▣ 05장: 맵리듀스 기초 다지기 
5.1 맵리듀스 잡의 실행 단계 
5.2 분석용 데이터 준비 

4.예제 코드


기존 예제 코드를 모두 리팩토링했으며, 빌드 방식도 ANT 기반에서 Maven 기반으로 변경했습니다.

참고로 모든 예제 코드는 Github 사이트에 공개했습니다.


맵리듀스 예제 코드

https://github.com/blrunner/hadoop-beginners-example


YARN 예제 코드

https://github.com/blrunner/yarn-beginners-examples



5. 하둡 버전


하둡1: apache hadoop-1.2.1

하둡2: apache hadoop-2.6.0



6.책 정보


http://wikibook.co.kr/beginning-hadoop-programming-2ed/



7. 책 문의


wikibook@wikibook.co.kr, blrunner@naver.com









저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License
댓글
댓글쓰기 폼