시작하세요! 하둡 프로그래밍 책을 보면서 하둡을 공부하고 있다.
이 책에서는 미국 항공편 운항 통계 데이터를 가지고 실습을 하는데
stat-computing.org/dataexpo/2009/the-data.html
The data. Data expo 09. ASA Statistics Computing and Graphics
Data expo ‘09 Get the data The data comes originally from RITA where it is described in detail. You can download the data there, or from the bzipped csv files listed below. These files have derivable variables removed, are packaged in yearly chunks and h
stat-computing.org
책에서 알려준 사이트에 가보니 다운로드 받는 링크가 없다..^^;;
사이트에서 더 이상 제공을 안하는 것 같다.
그렇다고 실습을 안할 수도 없는 노릇이라 구글을 열심히 뒤지다가 해당 데이터를 다운받을 수 있는 다른 사이트를 찾았다.
dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/HG7NV7
Data Expo 2009: Airline on time data
Bi-Annual Data Exposition: Every other year, at the Joint Statistical Meetings, the Graphics Section and the Computing Section join in sponsoring a...
dataverse.harvard.edu
여기서 다운받을 수 있다!
확인해보니 같은 데이터가 맞는 것 같다.
이제 다시 공부를 해야지..