데이터

5.1 소비자 세그먼트 데이터 시뮬레이션 예제로 사용할 데이터셋은 구독 기반 서비스를 이용하는 N=300명의 응답자로부터 연령, 소득, 자녀 수, 주택 소유 or 임대 여부, 현재 제공되는 서비스 가입여부에 대한 데이터 수집 세그먼트의 생성은 휴리스틱(heuristic)에 의해 생성 가능 휴리스틱이란? 합리적인 사고방식을 기반으로 결론을 도출하는 것이 아닌, 경험에 기반하여 문제를 해결하는 방법 (ex) 어림법, 주먹구구법,발견법) 각 응답자를 'Suburb mix', 'Urban hip', 'Travelers', 'Moving up' 네 가지 소비자 세그먼트 중 하나에 할당 세그먼트를 위한 코드는 크게 세 부분으로 분리됨 데이터 구조 정의 : 인구 통계학적 변수(연령, 성별 등)와 세그먼트 이름 및 크..
4.1 소매데이터 4.1.1 데이터 시뮬레이션 다채널 소매업체의 1,000명 고객에 대한 데이터셋 생성 4.1.2 온라인 및 내점 판매 데이터 시뮬레이션 온라인 방문과 거래에 대한 각 고객의 1년 총액 + 총 지출액 음이항 분포로 방문 수 각 온라인 방문마다 주문확률 30% 가정하고 online_trans 변수 생성 로그 정규 분포 변수로 매장 내 판매 데이터 생성 4.1.3 만족도 조사 응답 시뮬레이션 설문 조사 항목에 대해 전반적으로 관찰되지 않은 만족도(halo)와 서비스 및 제품 선택에 대한 특정 만족도 수준 기반 sat_overall, numpy.floor()를 사용하여 연속 임의의 값을 불연속 정수로 변환 상한선 설정 4.1.4 무응답 데이터 시뮬레이션 고령고객은 설문조사에서 응답하지 않을 가..
학습 목표 1. 데이터셋 시뮬레이션 2. 기술통계로 데이터셋 요약 및 탐색 3. 간단한 시각화 방법 및 탐색 3.1 데이터 시뮬레이션 3.1.1 데이터 저장: 구조 설정 매장 체인에서 2개의 경쟁 제품에 대한 주별 총 판매량을 나타내는 데이터셋 만들기 구조, 가격과 함께 2년동안 20개 매장에서 두 제품의 판매 시뮬레이션인 데이터 구조를 생성 shape로 행, 열 수와 데이터 구조 확인 -> NaN값 확인 각 상점 번호에서 해당 상점의 국가로 매핑되는 딕셔너리 생성 astype()메서드로 store_sales.country, store_sales.store_num을 범주형으로 재정의 3.1.2 데이터 저장: 데이터 포인트 시뮬레이션 제품 1에 10%, 제품 2에 15%의 판촉 가능성 확률을 무작위로 할당..
생활코딩 강의(데이터베이스- MySQL) 내용을 바탕으로 작성되었습니다.  1. 관계형데이터베이스의 필요성중복된 데이터 = 개선할 필요성이 있다는 강력한 증거중복된 데이터는 용량, 경제적, 수정의 어려움 등의 문제를 발생시킴중복된 데이터 해결 방법원본 topic 데이터에서  author, profile 칼럼의 egoing-developer 데이터가 1,2,5행에서 중복되고 있음author 테이블을 따로 만들고 topic 테이블에 author_id 칼럼을 부여하면 중복된 데이터가 사라짐author 테이블을 수정하게 되면 이 테이블을 참조하고 있는 모든 행에서 데이터가 수정될 수 있음id 1, 4와 같이 동명이인에 대해 다른 인덱스를 부여함으로써 구분 가능 데이터의 유지보수가 편해짐표를 비교해 가면서 봐야 ..
만서다
'데이터' 카테고리의 글 목록 (4 Page)