ADsP 준비 2. Part2 데이터 분석 기획

2022. 7. 6. 07:37기타/ADsP 준비


데이터 분석의 이해


1. 분석기획 방향성 도출
01 빅데이터 분석 방법론

빅데이터 분석 방법론의 정의

  • 분석절차
  • 분석방법
  • 도구와 기법
  • 분석 단계별 템플릿과 산출물
  • 위 네가지를 정의한것을 의미

빅데이터 분석방법론의 기존 구조

  • 암묵지 -- (형식화) -- 형식지
    - 빅데이터 분석자의 경험을 문서화하여 정리
  • 형식지 -- (체계화) -- 방법론
    - 절차, 활동, 작업, 산출물 등을 정의
  • 방법론 -- (내재화) -- 암묵지
    - 방법론을 학습하고 훈련하여 내재화함


02 빅데이터 분석 방법론의 적용 모델
폭포수 모델

  • 가장 고전적인 모델이고, 순차적인 단계를 제시
  • 각 단계를 완료해야 다음 단계로 진행되며, 이전단계로 되돌아갈 수 없음
  • 따라서 경험이 많고 위험이 낮은 업무에 적용
  • 고객 요구사항에 대한 확인은 개발이 완료되어야 가능


프로토타이핑 모델

  • 고객 요구사항 수집 후, 프로토타입을 먼저 만들고 고객에게 피드백 받은후에 개발하는 모델
  • 시스템에 대한 이해가 용이하고 소프트웨어 품질 향상
  • 개발 타당성 확인
  • 비경제적, 중간 단계 산출물 문서화가 어려움


반복 점증형 모델

  • 규모가 큰 빅데이터 사업에 적용해야 하는 모델
  • 요구사항, 분석, 설계, 구현, 테스트를 반복적으로 개발하는 모델
  • 반복 수행 후에 만들어지는 소프트웨어에 대해서 버전을 추가하듯이 개발한다.
    즉 점층적으로 소프트웨어를 완성시켜 나간다.


나선형 모델

  • 위험(risk)이 높은 개발 사업에 적용하는 모델
  • 폭포수 모델과 프로토타이핑 모델이 통합된 모델 (반복적으로 개발하는 모델)
  • 반복적으로 위험분석을 수행하여 위험을 관리


2. 분석과제 발굴
01 분석과제 발굴

빅데이터 분석을 위해, 분석과제를 발굴
하향식 접근법

  • 비즈니스 모델 관점 기반 : 기업의 비즈니스 모델을 분석하여 고객,업무,제품단위로 문제를 발굴
  • 외부참조 모델 기반 : 유사업종, 동종기업의 사례를 벤치마킹하여 업무별, 산업별로 문제를 발굴
  • 분석 유즈케이스 정의(이벤트반응분석) : 문제에 대한 상세한 설명과 문제를 해결할 경우의 효과를 명시해서 문제를 발굴

상향식 접근법

  • 데이터 원천으로부터의 접근 : 다양한 원천데이터를 분석
  • 프로토타이핑 접근 : 프로토타입을 활용하여 분석을 시도



3. 분석방법론
01 KDD 분석 방법론
데이터로부터 통계적인 패턴이나 지식을 발견하기 위해서 정리한 데이터마이닝 프로세스

전체과정 : 데이터선정 -> 데이터전처리 -> 데이터 변환 -> 데이터 마이닝 -> 해석 및 평가
1. 데이터 선정
- 계정계 데이터베이스(OLTP)와 정보계 데이터베이스(Data Warehouse)를 분석하여 필요한 원시데이터를 선정
- OLTP : 기업에서 업무를 실시간으로 처리하는 시스템으로 계정계라고도 부른다 (예:회원관리, 항공기옝약,도서구매 등..)
2. 데이터 전처리
- 데이터분석을위한 데이터 정제과정 (변수확인, 원시데이터확인, 결측값 처리, 이상값 처리)
3. 데이터변환
4. 데이터 마이닝
5. 해석 및 평가

02 CRISP-DM 분석 방법론
비즈니스 요구사항에 맞게 데이터마이닝을 반복적으로 수행하는 라이프 사이클
1. 비즈니스 이해
2. 데이터이해
3. 데이터준비
4. 모델링
5. 평가

03 빅데이터 분석 방법론
1. 3단계 빅데이터 분석 방법론
1) 단계 : 빅데이터 분석을 위한 단계
2) 태스크 : 단계별 수행해야 하는 일
3) 스텝 : 1~2주내에 완료가능한 산출물을 의미

2. 5단계 빅데이터 분석 방법론
1) 분석기획
2) 데이터 준비
3) 데이터 분석
4) 시스템 구현
5) 데이터 평가 및 전개


4. 분석 프로젝트 관리방안
01 분석 프로젝트 관리영역
분석프로젝트는 5가지영역이 있다.
1. 데이터사이즈
2. 데이터복잡도 : 수집할수있는 데이터범위와 데이터전처리방법등이 검토 되어야 함
3. 속도 : 비즈니스 변화속도가 빠르므로, 실시간 데이터까지 분석가능필요
4. 분석과 복잡도 : 분석과 복잡도는 trade-off 관계임을 인지
5. 정확도 & 정밀도 : 정확도는 실제값과의 차이를 의미하고 정밀도는 분석모델을 반복적으로 수행할경우 편차 수준의 일관성을 의미




분석 마스터 플랜



빅데이터 과제 플랜 짜기

1. 과제 우선순위 고려시 고려사항
1) 전략적 중요성
2) 비즈니스 성과 및 ROI
3) 실행용이성

2. 과제 우선순위 평가방법
1) 시급성
2) 난이도

3. 빅데이터 분석 거버넌스 체계
1) 분석조직
2) 분석전문 인력
3) 분석개발 및 확산
4) 분석교육
5) 분석수준진단

4. 빅데이터분석 준비도
기업의 빅데이터 분석의 수준을 진단하기위한 방법으로 다음처럼 구성된다.
1) 분석업무
2) 분석 인력 및 조직
3) 분석기법
4) 분석데이터
5) 분석문화
6) 분석인프라

5. 빅데이터분석 성숙도
1) 도입 : 분석시작 및 분석환경과 시스템 구축
2) 활용 : 분석결과를 실제 업무에 적용
3) 확산 : 전사차원에서 분석을 관리하고 공유
4) 최적화 : 분석을 진화시켜서 혁신과 성과에 기여

6. 빅데이터 분석 수준 진단
사분면 분석을 기억
낮은 준비도 & 낮은 성숙도 : 준비형
낮은 준비도 & 높은 성숙도 : 정착형
높은 준비도 & 낮은 성숙도 : 도입형
높은 준비도 & 높은 성숙도 : 확산형

'기타 > ADsP 준비' 카테고리의 다른 글

ADsP 준비 3. Part3 데이터 수집과 정제  (0) 2022.07.21