처음이야? 파이썬 데이터 분석
도서+사은품 또는 도서+사은품+교보Only(교보굿즈)
15,000원 미만 시 2,500원 배송비 부과
20,000원 미만 시 2,500원 배송비 부과
15,000원 미만 시 2,500원 배송비 부과
1Box 기준 : 도서 10권
로그아웃 : '서울시 종로구 종로1' 주소 기준
알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.

특히 설치 없이 웹에서 실습 가능한 구글 코랩 환경을 안내하여, 프로그램 설치에 어려움을 느끼는 초보자도 부담 없이 시작할 수 있습니다. 각 장마다 주요 이론과 실습 코드를 연결하고, 예제를 파일 단위로 제공하며, 이해를 돕는 팁과 주석으로 실무에 바로 연결할 수 있도록 돕습니다.
데이터 분석이 처음인 독자도, 엑셀만 써오던 직장인도 이 책 한 권으로 파이썬 기반 데이터 분석의 핵심 흐름을 이해하고 실무에 활용할 수 있습니다.
처음 시작하는 사람에게 가장 친절한 데이터 분석 길잡이, 바로 이 책입니다.
[이 책의 특징]
비개발자의 시선에서 시작하는 데이터 분석 입문서
복잡한 용어나 이론 중심 설명이 아닌, 실무 중심의 문제 해결과 업무 흐름 이해를 바탕으로 파이썬 분석을 쉽고 현실감 있게 소개합니다.
구글 코랩을 기반으로 한 설치 없는 실습 환경 제공
초보자도 환경 설정에 부담 없이 시작할 수 있도록 클라우드 실습 환경(Colab)을 중심으로 구성해 접근성을 높였습니다.
단계별 실습 문제와 코드 파일 제공
각 장마다 실습 문제와 해설 코드를 제공하여 학습 성과를 점검하고, 실무에 필요한 응용력을 키울 수 있습니다.
동영상 강의와 연동된 학습 지원
모든 실습 코드를 동영상으로 따라 하며 학습할 수 있도록 구성되어 있어, 독학이 어려운 분들도 눈으로 보고 손으로 익힐 수 있습니다.
작가정보
현 수제비 정보처리기사 대표 저자이자 수제비 코퍼레이션 대표. 실무와 교육 현장을 넘나들며 수많은 수험생과 개발 지망생들에게 실질적인 도움을 주는 콘텐츠를 제작하고 있다. 정보관리기술사로서의 깊은 전문성을 바탕으로, 자격증과 실무를 연결하는 교육 콘텐츠의 선두주자로 활동 중이다.
현재 핀테크 대기업에서 근무 중이며, 과거 게임, IoT 등 다양한 분야의 스타트업에서 실전 개발 경험을 쌓았다. 소프트웨어 마에스트로 인증을 받은 이력을 바탕으로, 이론과 실무를 아우르는 균형 잡힌 시각으로 독자에게 실질적인 인사이트를 제공한다.
목차
- 1장 데이터 분석 시작하기
1.1 데이터 분석
1.2 개발 환경 구축(구글 코랩)
구글 코랩 개요
구글 코랩 주요 특징
구글 코랩 시작
구글 코랩 환경설정
데이터 불러오기
코드 작성 및 실행
깨짐 오류 해결
마무리 실습문제
마무리 실습문제 정답
2장 NumPy
2.1 NumPy 개요
NumPy 개념
NumPy 특징
NumPy 확인
NumPy와 리스트의 차이점
2.2 배열 생성
np.array( ) 함수
np.zeros( ) 함수
np.ones( ) 함수
np.full( ) 함수
np.empty( ) 함수
np.arange( ) 함수
np.linspace( ) 함수
2.3 배열의 주요 속성
shape 속성
dtype 속성
size 속성
ndim 속성
flat 속성
2.4 배열의 데이터 타입
기본 데이터 타입
데이터 타입 변환 - astype( ) 함수
2.5 배열의 인덱싱
기본 인덱싱
다차원 배열 인덱싱
음수 인덱싱
다차원 배열에서의 음수 인덱싱
Boolean 인덱싱
팬시 인덱싱
다중 팬시 인덱싱
2.6 배열의 슬라이싱
기본 슬라이싱
다차원 배열 슬라이싱
슬라이싱을 이용한 행/열 선택
음수 슬라이싱
Boolean 배열을 사용한 슬라이싱
배열을 사용한 슬라이싱
2.7 배열의 연산
산술 연산
지수 연산
배열의 비교 연산
배열과 스칼라 연산
논리 연산
제곱근
2.8 배열 비교
요소별 비교
배열 간 비교
np.all( )
np.any( )
np.array_equal( )
2.9 배열 병합
2.10 배열 정렬
1차원 배열 정렬
다차원 배열 정렬
내림차순 정렬
원본 배열 정렬 - ndarray.sort( )
다중 조건 정렬 - np.lexsort( )
2.11 배열 필터링
기본 필터링
다차원 배열 필터링
np.where( )를 사용한 필터링
마스크 배열을 이용한 필터링 - ma.array( )
복합 조건을 사용한 필터링
np.extract( )를 사용한 조건 기반 추출
2.12 배열의 통계
최솟값 - np.min( )
최댓값 - np.max( )
데이터 범위 - np.ptp( )
합계(Sum) - np.sum( )
평균(Mean) - np.mean( )
중위수(Median) - np.median( )
분산(Variance) - np.var( )
표준편차(Standard Deviation) - np.std( )
사분위수(Quantiles) - np.percentile( )
마무리 실습문제
마무리 실습문제 정답
3장 Pandas
3.1 Pandas 개요
Pandas 개념
Pandas 특징
Pandas 확인
NumPy와 Pandas
3.2 Series
Series 개념
Series 특징
Series와 리스트의 차이점
Series 생성 방법
Series 구조 확인
데이터 조회
인덱싱 및 슬라이싱
데이터 추가
Series 값 수정
인덱스 이름 변경 - rename( )
데이터 통계 및 요약
고윳값 확인
데이터 필터링 및 조건 선택
Series의 데이터 연결 - concat( )
데이터 정렬
데이터 그룹화 및 집계
3.3 DataFrame
DataFrame 개념
DataFrame과 리스트의 차이점
DataFrame 생성 방법
DataFrame 구조 확인
데이터 조회
인덱싱 및 슬라이싱
데이터 추가
DataFrame 값 수정
열 이름 변경
데이터 통계 및 요약
고윳값 확인
데이터 필터링 및 조건 선택 - 다중 조건 필터링
데이터 병합 및 결합
데이터 정렬
데이터 그룹화 및 집계
3.4 Series와 DataFrame
Series와 DataFrame의 차이점
마무리 실습문제
마무리 실습문제 정답
4장 matplotlib
4.1 matplotlib 개요
matplotlib 개념
matplotlib 설치
4.2 matplotlib 기능
플롯(Plot)
선 그래프(Line Plot)
막대 그래프(Bar Chart)
파이 차트(Pie Chart)
산점도(Scatter Plot)
히스토그램(Histogram)
서브플롯(subplot)
플롯 이미지
4.3 seaborn 개요 및 기능
seaborn 개념
seaborn 설치
히트맵(Heatmap)
클러스터맵(Clustermap)
박스플롯(Boxplot)
카운트플롯(Countplot)
마무리 실습문제
마무리 실습문제 정답
5장 데이터 전처리
5.1 데이터 준비 및 불러오기
CSV 파일 불러오기
엑셀 파일 불러오기
JSON 파일 불러오기
5.2 데이터 탐색
데이터 구조 이해
통계적 요약
5.3 데이터 전처리
데이터 결측값 처리
중복 데이터 제거
5.4 데이터 변환
데이터 형식 변환
범주형 데이터 인코딩
데이터 정규화 및 표준화
데이터 인덱싱
데이터 슬라이싱
데이터 정렬
5.5 데이터 저장
CSV 형식으로 저장
Excel 형식으로 저장
JSON 형식으로 저장
마무리 실습문제
마무리 실습문제 정답
6장 데이터 분석
6.1 마케팅 및 고객 분석
6.2 금융 및 리스크 관리
6.3 의료 및 헬스케어
6.4 제조 및 품질관리
6.5 공공 정책 및 사회 문제 해결
7장 케글(kaggle) 실습
7.1 케글(kaggle) 개요
케글 개념
케글 특징
케글 준비
7.2 케글 실습
타이타닉 생존자 예측 문제(Titanic - Machine Learning from Disaster)
주택 가격 예측 문제(House Prices - Advanced Regression Techniques)
신용카드 사기 탐지 문제(Credit Card Fraud Detection)
8장 공공데이터 실습
8.1 공공데이터 개요
공공데이터 개념
공공데이터 특징
8.2 공공데이터 실습
대기오염 데이터 분석
서울시 자전거 대여 데이터 분석
지역별 인구통계 데이터 분석
별책부록 핵심노트
핵심 필기노트
핵심 용어노트
출판사 서평
파이썬 데이터 분석이 처음이라면, 이 책이 가장 좋은 출발점이 되어줄 것입니다. 『처음이야, 파이썬 데이터 분석』은 저자가 실제 강의와 실습 현장에서 쌓아온 노하우를 바탕으로 구성한 도서로, 단순한 문법 설명을 넘어 동영상과 스터티를 통해 함께 공부해 나갑니다. 구글 코랩 환경을 기반으로 설치 부담 없이 바로 실습할 수 있으며, NumPy와 Pandas의 기초부터 통계 분석과 실무 활용까지 차근차근 따라갈 수 있도록 구성되어 있어 데이터 분석의 흐름을 자연스럽게 익힐 수 있습니다. 숫자와 코드에 낯선 분들도 안심하고 시작할 수 있도록 예제와 해설, 팁을 아낌없이 담았습니다. 데이터를 읽고, 이해하고, 설명하고 싶은 모든 분들께 추천합니다.
[이 책에서 배우는 내용]
데이터 분석의 기본 개념과 환경 구축
데이터 분석이 무엇인지 이해하고, 구글 코랩을 통해 별도 설치 없이 실습 가능한 환경을 설정합니다. 초보자도 클라우드 기반 환경에서 파이썬 분석을 바로 시작할 수 있습니다.
고성능 수치 계산을 위한 NumPy 활용법
다차원 배열을 효율적으로 다루기 위한 NumPy의 주요 함수와 속성, 인덱싱과 슬라이싱 기법, 브로드캐스팅, 통계 계산 등 다양한 기능을 배우며 배열 기반 연산의 기초를 다집니다.
Series와 DataFrame을 활용한 Pandas 실전 분석 기법
Pandas의 핵심 구조인 Series와 DataFrame을 이용해 데이터 조회, 정렬, 필터링, 통계, 그룹화, 결합 등 데이터 분석에 필수적인 기능을 실습 중심으로 익힙니다.
통계와 시각화 기반의 데이터 통찰 도출
value_counts, describe, mean, std, groupby, apply 등 다양한 통계 함수로 데이터를 요약하고, 시각화를 통해 통찰력을 얻는 방법을 학습합니다. 분석 흐름에 맞춘 실전 예제도 함께 제공합니다.
기본정보
ISBN | 9788931478013 |
---|---|
발행(출시)일자 | 2025년 06월 20일 |
쪽수 | 424쪽 |
크기 |
191 * 258
* 25
mm
/ 1190 g
|
총권수 | 1권 |
Klover 리뷰 (7)
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집 (0)
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)
구매 후 리뷰 작성 시, e교환권 100원 적립
-
반품/교환방법
* 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900) -
반품/교환가능 기간
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내 -
반품/교환비용
-
반품/교환 불가 사유
(단지 확인을 위한 포장 훼손은 제외)
2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
3) 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등 -
상품 품절
-
소비자 피해보상 환불 지연에 따른 배상
2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함
상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)