5.1 소비자 세그먼트 데이터 시뮬레이션 예제로 사용할 데이터셋은 구독 기반 서비스를 이용하는 N=300명의 응답자로부터 연령, 소득, 자녀 수, 주택 소유 or 임대 여부, 현재 제공되는 서비스 가입여부에 대한 데이터 수집 세그먼트의 생성은 휴리스틱(heuristic)에 의해 생성 가능 휴리스틱이란? 합리적인 사고방식을 기반으로 결론을 도출하는 것이 아닌, 경험에 기반하여 문제를 해결하는 방법 (ex) 어림법, 주먹구구법,발견법) 각 응답자를 'Suburb mix', 'Urban hip', 'Travelers', 'Moving up' 네 가지 소비자 세그먼트 중 하나에 할당 세그먼트를 위한 코드는 크게 세 부분으로 분리됨 데이터 구조 정의 : 인구 통계학적 변수(연령, 성별 등)와 세그먼트 이름 및 크..
데이터/마케팅
4.1 소매데이터 4.1.1 데이터 시뮬레이션 다채널 소매업체의 1,000명 고객에 대한 데이터셋 생성 4.1.2 온라인 및 내점 판매 데이터 시뮬레이션 온라인 방문과 거래에 대한 각 고객의 1년 총액 + 총 지출액 음이항 분포로 방문 수 각 온라인 방문마다 주문확률 30% 가정하고 online_trans 변수 생성 로그 정규 분포 변수로 매장 내 판매 데이터 생성 4.1.3 만족도 조사 응답 시뮬레이션 설문 조사 항목에 대해 전반적으로 관찰되지 않은 만족도(halo)와 서비스 및 제품 선택에 대한 특정 만족도 수준 기반 sat_overall, numpy.floor()를 사용하여 연속 임의의 값을 불연속 정수로 변환 상한선 설정 4.1.4 무응답 데이터 시뮬레이션 고령고객은 설문조사에서 응답하지 않을 가..
학습 목표 1. 데이터셋 시뮬레이션 2. 기술통계로 데이터셋 요약 및 탐색 3. 간단한 시각화 방법 및 탐색 3.1 데이터 시뮬레이션 3.1.1 데이터 저장: 구조 설정 매장 체인에서 2개의 경쟁 제품에 대한 주별 총 판매량을 나타내는 데이터셋 만들기 구조, 가격과 함께 2년동안 20개 매장에서 두 제품의 판매 시뮬레이션인 데이터 구조를 생성 shape로 행, 열 수와 데이터 구조 확인 -> NaN값 확인 각 상점 번호에서 해당 상점의 국가로 매핑되는 딕셔너리 생성 astype()메서드로 store_sales.country, store_sales.store_num을 범주형으로 재정의 3.1.2 데이터 저장: 데이터 포인트 시뮬레이션 제품 1에 10%, 제품 2에 15%의 판촉 가능성 확률을 무작위로 할당..