본문 바로가기

데이터 분석 (DA)

[패스트캠퍼스] 데이터 분석 부트캠프 17기 - 1주차 (DA_Excel, Statistics)

안녕하세요. 

데이터 분석가를 꿈꾸는 건설엔지니어 영지니 입니다.

 

평소 관심이 많았던 '데이터 분석가'가 되기 위해 패스트캠퍼스

"데이터 분석 부트캠프" 교육과정에 참여하게 되었습니다. 

 

고지에 도달하도록 최선을 다 할 것입니다.  화이팅......

 

 

I. 교육방식과 커리큘럼.

  1. 패스트 캠퍼스 교육방식은 온라인강의(vod형식)와 zoom을 통한 비대면 실시간 강의를 혼합하여 진행한다.

    온라인 강의를 통해 기초교육을 자체적으로 진행하고, zoom을 통해 실시간 강의를 통해 심화학습을 진행한다.

    ▶ 온라인 강의를 통해 반복학습이 가능하여 비전공자들에게는 아주 좋은 방식이라 판단됨.

 

  2. 커리큘럼 : Excel, Python, SQL, Tableau의 툴을 사용한 분석방법, 빅데이터 이해, 데이터 리터러시 함양하기,

    ChatGPT활용법총 네차례의 프로젝트를 통한 포트폴리오 작성까지 진행되는 과정이다.

 

 

II.  빅데이터 이해 & 데이터 리터러시 함양하기

  1. 데이터 문해력 (Data Literacy) : 데이터를 읽고 이해하고, 데이터에서 유의미한 가치를 창출하고 데이터를

    기반으로 문제를 정의하고 해결하는 능력을 말한다.  

 

  2. 데이터 해석을 위한 필요한 스킬 : 

    분석 툴에 대한 이해 : Excel, Python, SQL, Tableau

    도메인 지식 : 분석하고자 하는 비즈니스에 대한 이해. 그에 따라 가설 설정, 분석지표가 다 다르기 때문 

    문제정의, 문제해결능력 : 데이터분석 프로세스는 문제정의>가설수립>데이터분석>문제해결의 단계로 진행되며,

      데이터분석 전 문제를 정의하고, 해결 방안 제시 능력이 필요하다.

    논리적 사고, 보고서 작성 능력 : 분석한 내용을 논리적으로 설명할 수 있는 능력. 즉 시각화, 보고서 작성능력이

      필요하다.

 

    ▶툴을 이용한 결과물 도출 이후, 최종 결론을 내는 데이터를 해독할 수 있는 '데이터 문해력'이 중요하다.

 

  3. 데이터 분석 직무 취업 준비 :

    a. 프로젝트 중심의 포트폴리오 작성을 위한 정보

        각종 데이터 자료 : kaggle.com/datasets 

        각종 공모전 참여 : bigcontest.or.kr (한국정보통신진흥협회)  ,  dacon.id (커뮤니티)

 

    b. 참고문헌 

   

 

데이터문해력 (저자 카시와기 요시키)

 

 

 

 

 

 

 

 

빅데이터 커리어 가이드북 (저자 조성준, 김현용, 박서영, 안용대, 임성연)

 

 

 

 

 

 

 

 

III. 친근한 엑셀로 실무 엑셀 데이터 분석 시작하기

  1. 우리가 반듯이 알아야 할 엑셀의 기초

    ● 행, 열, 셀의 이해 

 

엑셀은 하나의 행과 하나의 열이 교차하는 지점은 '셀(Cell)'에 데이터를 입력하는 방식의 프로그램이다.

 

 

 

 

 

 

 

 

 

 

    ● 빠른실행도구모음 설정하기

      '빠른실행도구모음'을 통해 엑셀에서 가장 많이 사용하는 기능들을 단축키로 지정하여 사용할 수 있다.

     

[파일] - [옵션] - [빠른실행도구모음] - [명령선택 : 모든명령] 선택후 기존도구모음은 모두 삭제하고 아래기능을 추가한다.

 

'합계', '수식(수식붙여넣기)', '값(값붙여넣기)', '서식(서식붙여넣기)', '화면에 보이는 셀 선택', '틀고정', '병합하고 가운데 맞춤'을 순서대로 선택한 후 저장한다. [그림1. 참조]

 

 

 

[그림1. 빠른실행도구모음 설정]

 

      추가한 빠른실행도구모음 기능들은

         [alt + 1]키   : 합계(sum)

         [alt + 2]키   : 수식 붙여넣기  (서식을 제외한 수식 그대로 붙여넣기)

         [alt + 3]키   : 값 붙여넣기  (서식을 제외하고, 수식을 값으로 변경해서 붙여넣기)

         [alt + 4]키   : 서식 붙여넣기  (값이나 서식을 제외하고 서식만 붙여넣기)

         [alt + 5]키   : 화면에 보이는 셀 선택

         [alt + 6]키   : 틀 고정

         [alt + 7]키   : 병합하고 가운데 맞춤

      으로 단축키을 사용할 수 있다.      

 

    ● 셀 참조방식 알아보기 

      -상대참조 : 셀이 이동할 때 참조되는 셀 주소도 같이 이동하는 셀 참조방식이다.

 

      -절대참조 : 셀이 이동할 때 참조되는 셀 주소는 항상 고정되는 셀 참조방식이다.

 

      -혼합참조 : $(달러기호)가 붙은 위치에 따라 행 또는 열 중에 하나만 고정되는 셀 참조방식이다.    

 

 

$기호가 알파벳 앞에 붙을 경우, 

열(좌-우이동)이 고정됩니다.

 

 

 

 

 

 

 

$기호가 숫자 앞에 붙을 경우,

행(상-하이동)이 고정됩니다.

 

 

 

 

 

( 혼합참조는 행 또는 열 중 하나만 고정하는 참조방식 이다.)

 

    ● 사용자 지정 기호(기본)

      [ctrl + 1]키  -> 셀서식 열기 -> 사용자지정

기호    #

의미    숫자의 대표 값 (의미없는 0은 생략)

예시    001  →  ###  →  1

            0  →  #  →  (빈칸)

 

기호    0

의미    숫자의 대표 값 (의미없는 0도 표시)

예시    001  →  000  →  001

            0  →  0  →  0

 

기호    @

의미    문자의 대표 값 

예시    고객  →  @"님"  →  고객님

 

기호    ,

의미    숫자의 중간 : 1000단위 마다 쉼표 

           숫자의 끝     : 1000단위 반올림

예시    1000500  →  #,##0  →  1,000,500

           1000500  →  #,##0,  →  1,001

 

 

  2. 탐색적 데이터 분석 (EDA, Exploratory Data Analysis)

    기존의 통계학이 정보의 추출 과정에서 가설 검정 등에 치우쳐 자료가 가지고 있는 본연의 의미를 찾는데

    어려움이 있어, 이를 보완하고자 주어진 자료만 가지고도 충분한 정보를 찾울 수 있도록 하는 자료 분석 방법

 

    ● 데이터 분석 도구 추가하기

 

    기술 통계법

 

    ● 피벗 테이블 (Pivot Table)

 

    ● 결측치 (Missing Value)

        데이터에 값이 없는 것

 

    ● 이상치 (Outlier)

        특정 지정된 그룹에 분류되지 못하는 값으로, 정상군의 상한과 하한의 범위를 벗어나 있거나 패턴에서

        벗어난 수치  → 일반적으로 -3σ (표준편차) 미만, +3σ 초과인 값을 이상치로 판정

 

    ● Z-Score

        자료가 평균으로부터 표준편차의 몇 배 만큼 떨어져 있는지를 나타내는 지표

 

    ● 사분의수

        데이터를 4등분하는 값

 

    ● IQR (Inter Quartile Range)

        1사분위수와 3사분위수 간의 거리 = 3사분위수 - 1사분위수

 

    ● Box Plot (상자 도표)

        1사분위수와 3사분위수 간의 거리 = 3사분위수 - 1사분위수

 

    ● 상관 분석

        두 변수가 어떤 선형적 관계를 갖고 있는지를 분석하는 방법