프로젝트 16

[kaggle] 이커머스 고객 행동 로그 분석 part 4. (분석 목표 : 매출 증진을 위한 크로스셀링 제안)

간단 개요)해당 분석은 kaggle 의 'eCommerce Behavior Data from Multi-Category Store' 데이터를 기반으로,월 평균 300만 명의 방문 고객을 보유한, 미국 대형 이커머스의 고객 이벤트 로그 데이터를 활용해 해당 이커머스의 핵심 카테고리인 스마트폰의 구매패턴을 분석하고, 전환률을 높이기 위한 액션을 제안하는 프로젝트입니다.     Part 2, Part 3 는 '스마트폰' 구매 고객 대상으로 구매 전환을 높이기 위해서, 즉시 구매고객, 장기 상호작용 고객으로 세분화해 각 고객층별로 구매에 영향을 끼치는 요인들을 포착하는데 중요도를 두었습니다. 즉, 방문 고객중 실제 전환될 가능성이 높은 고객들을 포착하고 구매로 전환시키기 위한 목적의 분석이었다고 볼 수 있습니다..

[kaggle] 이커머스 고객 행동 로그 분석 part 3. (분석 목표 : 방문 후 1시간 이상, Cart를 활용하는 고객들의 구매 요인 분석)

간단 개요)해당 분석은 kaggle 의 'eCommerce Behavior Data from Multi-Category Store' 데이터를 기반으로,월 평균 300만 명의 방문 고객을 보유한, 미국 대형 이커머스의 고객 이벤트 로그 데이터를 활용해 해당 이커머스의 핵심 카테고리인 스마트폰의 구매패턴을 분석하고, 전환률을 높이기 위한 액션을 제안하는 프로젝트입니다.     Part 1 막바지에, 구매/이탈까지의 소요시간을 중심으로 크게 두가지의 고객을 정의했습니다. 1. 즉시 구매 고객 : 이미 상품 구매 결심을 마친 상태로 방문, 가격/조건 비교 후 빠르게 구매를 완료하는 고객.2. 장기 상호작용 고객 : 관심/구매 의지는 있지만 신중하게 고민하며, 구매까지 장기적인 상호작용을 거치는 고객. 그중, 이..

[kaggle] 이커머스 고객 행동 로그 분석 part 2. (분석 목표 : 방문 1시간 이내 즉시 구매고객의 전환 요인 분석)

간단 개요)해당 분석은 kaggle 의 'eCommerce Behavior Data from Multi-Category Store' 데이터를 기반으로,월 평균 300만 명의 방문 고객을 보유한, 미국 대형 이커머스의 고객 이벤트 로그 데이터를 활용해 해당 이커머스의 핵심 카테고리인 스마트폰의 구매패턴을 분석하고, 전환률을 높이기 위한 액션을 제안하는 프로젝트입니다.      Part 1 막바지에, 구매/이탈까지의 소요시간을 중심으로 크게 두가지의 고객 세부 군집을 정의했습니다. 1. 즉시 구매 고객 : 이미 상품 구매 결심을 마친 상태로 방문, 가격/조건 비교 후 빠르게 구매를 완료하는 고객.2. 장기 상호작용 고객 : 관심/구매 의지는 있지만 신중하게 고민하며, 구매까지 장기적인 상호작용을 거치는 고객..

[kaggle] 이커머스 고객 행동 로그 분석 part 1. (분석 목표 : 전환 과정의 pain-point 탐색 및 개선)

0. 분석 데이터 설명  해당 이커머스 데이터 분석은 kaggle 의 'eCommerce behavior data from multi category store' 데이터를 활용,월 평균 285만 명의 Unique User 가 방문하는 미국 대형 이커머스에서 수집된 User_event_log (view, cart, purchase) 데이터를 분석하였습니다. 제공 데이터는, 2019년 10월 ~ 2020년 4월까지 총 7개월의 데이터 중 10월 데이터만을 활용,MySQL, Python 을 활용하여,약 300만명의 개별 방문 고객의, 4500만건의 이벤트 로그를 분석하였습니다. 분석목표로는, (유입 ⮕ 탐색 ⮕ 구매) 로 이어지는 구매 패턴을 파악하고, 전환률 향상을 위한 액션 인사이트를 제안하는 것 을 목표..

[게임 데이터] 벽돌 깨기 게임 로그 분석 - 12개 맵 난이도 분류

0. 개요간단한 플레이 로그데이터를 바탕으로, 각 레벨 스테이지의 난이도를 계산하는 프로젝트를 진행했습니다. 본 테스크는 kaggle - "Arcade Game Stats" 를 기반으로 진행하였으며, 테스크 목적은, 제작된 Level-000 총 19개 스테이지에 대해 오토 봇 플레이를 6,814 번 진행했을 때, 이 플레이 로그를 바탕으로, 19개의 맵의 난이도 순서를 측정하는 테스크입니다.     Date: 게임이 오토 플레이된 날짜와 시간Level: 레벨명 (3자리 숫자는 이전 실행의 난이도 추정치로, 조정 후에는 더 이상 유효하지 않음)NumBlocks: 레벨을 클리어하기 위해 깨야 하는 블록의 수IsWin: 자동 재생이 모든 블록을 깼다면 True(클리어), 공이 패들 밑으로 떨어졌다면 Fals..

[DACON] "이커머스 고객 세분화 아이디어 보고서" - RFM/선호 카테고리/구매 패턴 기반 고객 세분화 전략

대회소개 ) 이커머스 환경에서 발생한 데이터를 통해 새로운 고객 세분화 기법을 활용하여 솔루션을 제시해보자 (링크) Onlinesales_info.csv - 온라인 거래 정보 (고객ID, 거래ID, 거래날짜, 제품ID, 제품카테고리, 수량, 평균금액, 배송료, 쿠폰상태) Customer_info.csv - 고객 정보 (고객ID, 성별, 고객지역, 가입기간(월)) Discount_info.csv - 할인 정보 (월, 제품카테고리, 쿠폰코드, 할인율) Marketing_info.csv - 마케팅 정보 (날짜, 오프라인 비용, 온라인 비용) Tax_info.csv - 제품 카테고리별 세금 정보 (제품카테고리, GST) => 데이터셋 확인 결과, 수집된 이커머스 도메인은 생활 잡화 쇼핑몰 성격을 띄며, 약 53..

[Dacon] "학습 플랫폼 이용자 구독 갱신 예측" .part5 (분석 보고서)

본 프로젝트는, [Dacon] "학습 플랫폼 이용자 구독 갱신 예측" 해커톤을 비지니스적 관점으로 전환하여,  "구독 취소 유저를 예측 및 프로모션을 통한 구독 전환, 이를 통한 학습플랫폼 수익 증대"라는 가상의 목표를 두고 진행한 프로젝트입니다.  실제 많은 학습 플랫폼들은 강의 영상을 개별 가격으로 팔기보다는, 학습 시리즈의 대여/소지권 판매, 월별 컨텐츠 무제한 구독권 판매를 메인 Business Model로 활용하고 있으며, 특가 이벤트, 특별 대상 이벤트, 구독제별 혜택 차등화 등을 통해 판매 프로모션을 진행하고 있습니다.   저는, 구독 취소 유저 예측 및 프로모션을 통한 구독 전환시 발생하는 수익 계산(part1), 유저 특성 파악 및 실제 구독 연장/취소 예측 전략 수립(part2&3), ..

[Dacon] "학습 플랫폼 이용자 구독 갱신 예측" .part4 (소비자 유형 분석)

part 4에서는 비지도학습 군집화 방식을 활용하여 구독 유저들의 특성에 따라 세분화를 진행하고, 각 그룹별 특성을 파악하여 유의미한 비지니스적 결론을 도출해 내보고자 하였다. 유형 분석 방법론으로는, 기존에 공부했던 논문, 고객 리뷰 평점 중심 소비자 유형분석 논문의 분석과정을 다수 차용하여 분석에 활용하였다. 0. 분석 결과 분석 목표 : 고객 세분화를 통한 맞춤형 구독 전환 프로모션 마케팅 전략 수립 분석 설계 군집화에 있어 유의 변수에 있어 class 데이터간의 밀도차이가 존재한다는 가설을 증명하기 위해 DBSCAN을, 연속형&범주형 변수를 모두 활용한 군집화 방식으로 ward linkage 방식을 채택하였음. 유의미한 군집 갯수 선정 및 군집의 유의성 판단을 위해 1) dendrogram을 활용..

[Dacon] "학습 플랫폼 이용자 구독 갱신 예측" .part3 (모델링)

part 1 에서는 분석 목적을 정의하였고, part 2 에서는 EDA를 통해 데이터 분포 특성을 파석하였다. part3에서는 본격적으로 모델링을 통해 구독 연장/취소 여부를 예측해보고, 다음 파트에선 더 나아가 나아가 소비자 유형 분석을 통해 각 유저 군집을 나눠보고 군집 특성을 파악해 보고자 했다. (군집 간 서로다른 특성을 이용해 프로모션에 활용.) 0. 개  요분류 예측을 위해 5개의 모델, 소비자 유형 분류를 위해 2개의 군집화 모델을 활용하였다.Classification Model : Logistic Regression, Random Forest, XGBoost, DNN, K-NNClustering Model : DBscan, Ward Linkage 그 중 XGBoost 하이퍼 파라미터 세팅으..

[Dacon] "학습 플랫폼 이용자 구독 갱신 예측" .part2 (EDA)

part 1에서 "학습 플랫폼 구독 취소 예측 유저를 예측하여 구독을 연장하도록 프로모션을 진행하고, 이를통해 구독 수익을 증대시키자" 라는 목표를 컨셉으로 기대수익을 정의하였고, part 2에서는 본격적인 플랫폼 구독 갱신 유저 예측을 위해 데이터를 살펴보았다. 데이터 수집 경로 : [Dacon] "학습 플랫폼 이용자 구독 갱신 예측 해커톤" 0. 분석결과 요약 구독 연장률은 62%, "구독 연장유저 vs 구독 취소유저" 간의 분포차이는 '평균 학습 세션 시간' 을 제외한 거의 모든 변수에서 차이가 없었다. 독립변수 대부분 균일분포 또는 정규분포에 가까웠고, 일부 변수에서 분포의 치우침, 매우 큰 이상치가 괸측되었다. '3개월간 결제 패턴', '특정 월에 결제를 진행한 유저' 간 통계적 차이가 존재하는..