프로젝트/캐글 경진대회 스터디

[kaggle] 이커머스 고객 행동 로그 분석 part 4. (분석 목표 : 매출 증진을 위한 크로스셀링 제안)

에멜라 2024. 12. 7. 21:39

 

간단 개요)

해당 분석은 kaggle 의 'eCommerce Behavior Data from Multi-Category Store' 데이터를 기반으로,

월 평균 300만 명의 방문 고객을 보유한, 미국 대형 이커머스의 고객 이벤트 로그 데이터를 활용해 해당 이커머스의 핵심 카테고리인 스마트폰의 구매패턴을 분석하고, 전환률을 높이기 위한 액션을 제안하는 프로젝트입니다. 

 

 


 

 

Part 2, Part 3 는 '스마트폰' 구매 고객 대상으로 구매 전환을 높이기 위해서, 시 구매고객, 장기 상호작용 고객으로 세분화해 각 고객층별로 구매에 영향을 끼치는 요인들을 포착하는데 중요도를 두었습니다. 즉, 방문 고객중 실제 전환될 가능성이 높은 고객들을 포착하고 구매로 전환시키기 위한 목적의 분석이었다고 볼 수 있습니다.

 

그러나 이러한 '스마트폰' 제품군은 커머스간 가격 경쟁이 심해 마진을 남기기 힘들 뿐더러, 구매주기가 길어, 고객 전환에 들인 노력만큼 추가 수익을 기대하기 힘듭니다. 따라서, Part 4 에서는, '구매 고객중 중 어떤 고객이 가장 가치있고, 매출 증진을 위해 무엇을, 어떻게 더 팔 수 있을까?'를 고민하는 파트입니다. 

 

 

 

 

 

 

1. 어떤 고객이 가장 가치있을까?

 

먼저 커머스 방문 후 '처음 구매하는 상품'에 따른 <구매력의 차이>를 보겠습니다.

 

전체 고객중 첫 구매상품으로 smartphone을 구매한 사람은 비율 약 55%로, 나머지 제품군을 찾는 고객보다 약 10~20배 이상 많았으며, 평균 소비액(평균 442/$), 타 카테고리 추가 구매액(평균 586/$) 역시 가장 높았습니다.

 

( * 크로스셀링 판매액 : 첫 구매 상품 외 카테고리에서 소비한 금액 (전체 소비액 - 첫 구매 카테고리 소비액))

 

즉, 전체 고객 중 smartphone을 구매할 목적으로 방문한 고객이 가장 많으면서, 또 커머스 내 총 소비액 기대가치도 가장 높기 때문에, 추가 매출 전략(크로 셀링)에 가장 우선시되는 고객군은 'smartphone 구매 고객'으로 볼 수 있습니다. 

 

 

(좌) 커머스 방문 후 첫 구매상품 (count), (우) 첫 구매상품 매출액과 크로스셀링 판매액 (평균)

 

 

 

 

다음으로, 'smartphone구매 고객 중 누가 제일 가치가 높은 고객인가?'를 따져본다면,

 

첫 구매 상품으로 'Samsung(29%)', 'Apple(21%)' 브랜드가 가장 많은 선택을 받았고,

또한, 고객들의 10월 총 매출액 기준, 판매 상위 5개 브랜드 중, 'Samsung', 'Apple' 브랜드 구매 유저가 가장 많은 총 소비액을 보이고 있습니다. 그중에서 특히, 개별 'Apple' 구매유저가 총 매출액에서 압도적으로 높은 가치를 가지고 있는것으로 보입니다.

 

따라서, 본 Part4 에서는, 가장 많은 유입고객들이 찾는 브랜드 'Samsung', 가장 고객 가치가 높은 'Apple' 브랜드 제품 구매 고객에 집중해, 해당 제품을 찾는 고객들 대상으로 어떤 제품을 추가적으로 팔 수 있을지를 고민해보겠습니다.

 

 

 

(좌) 스마트폰 구매 고객의 첫 구매상품 브랜드, (우) 첫 구매상품 브랜드별 10월 총 고객 매출액 분포 (컬러 : 판매량 5위 이내 브랜드)


 

 


 

 

2. 크로스셀링을 언제/얼마나 발생시켜야 할까?

 

'스마트폰 구매자 중, 구매 이후 타 제품까지 같이 구매하는 비율(크로스셀링 전환률)은 얼마나 될까?' 를 계산해보면서 한가지 의문이 들었습니다.

 

<스마트폰 구매 고객 중, 타 제품까지 같이 구매한 고객 비율> 을, 단순히 '조건부 확률' 로 계산할 수 있나? 

 

 

$ P\left ( others | smartphone \right ) = \frac{P\left ( smartphone \bigcap  other \right )}{P\left ( smartphone \right )}$

 

 

위와같이 계산한다면, 이는 단순히 '스마트폰 구매자 중 다른 제품도 같이 구매한 사람 비율'을 계산하게 됩니다.

그러나 우리가 명확하게 알고싶은건, 스마트폰을 구매한 '이후' 타 제품까지 구매한 사람의 비율이므로 이는 적절하지 않습니다.

 

  • '스마트폰 구매 고객' 대상 크로스셀링 정의 : 스마트폰 구매 이후, 타 카테고리 상품을 구매한 경우. 

 

 


 

 

따라서, 명확한 크로스셀링 비율을 계산하기 위해서, 각 유저별로 purchase_path 를 정의했고, 

'smartphone   others' 구매 패턴을 포함하는지 여부를 바탕으로 크로스셀링 비율을 계산하였습니다.

 

 

여기서, 각각의 컬럼이 의미하는바는 아래와 같습니다.

  • N : smartphone 을 구매한 사람 수 
  • n : 'smartphone ⮕  others' 구매 패턴을 보인 사람 수
  • conv_rate : 크로스셀링 전환률 

 

 

 

크로스셀링 전환률 계산

 

 

위 계산 데이터프레임과 같이, 현재 smartphone 제품 구매 후 타 제품군을 구매하는 비율은, 전체 smartphone 구매 고객 중 약 10%로 나타났습니다, 따라서 크로스셀링을 위한 그로스 전략을 짠다면, 최소 10%이상의 전환률을 만들어내야하는 셈입니다.

 


 

 

다음으로, '그럼, 언제 크로스셀링을 진행해야하 할까?' 에 대한 답변으로 아래와 같은 '구매 간격'을 계산해봤습니다.

 

 

크로스셀링 간격

 

 

위 그래프에서 알 수 있듯, 스마트폰 구매 당일, 또는 최소 5일 이내에 유저들이 타 제품을 같이 구매했음을 확인할 수 있습니다.

 

 

결론적으로, 크로스셀링을 진행할때, 최소 10% 이상의 크로스셀링 전환 목표, 첫 구매일 이후 5일 이내에 전환을 시킬 것을 목표로 두는것이 바람직합니다.


 

 


 

 

3. 누구에게 무엇을 팔아야될까? 

 

다음으로 '무엇을 같이 팔아야되는가?' 에 대한 고민입니다.

 

처음에는 단순하게, 카테고리별 구매 패턴의 상관관계를 보면 되지 않을까라고 생각을 했다가,.. 저같은 생각을 가진 사람이 더는 없없으면 해서 실패사례..를 먼저 보여드립니다.

 

아래와 같이, smartphone과 toilet 의 판매량의 상관계수가 0.9 씩이나 나오는 이유는, 상관계수 자체가 두 변수의 선형 관계만을 따지기 때문에 아래와 같이 이상치에 흔들릴 위험이 크기 때문입니다.

 

 

크로스셀링 잘못된 예 (고객별 판매량의 correlation)

 

 

 


 

 

이러한 실수를 방지하고자, 실제 크로스셀링 분석으로, 장바구니 분석 툴인 FP-Growth 알고리즘을 활용했으며,  지지도, 신뢰도, 향상도 지표 중 '신뢰도' (스마트폰 구매시, 타 카테고리를 추가 구매할 조건부확률)을 크로스셀링 지표로 활용했습니다.

 

'신뢰도'만 체크한 이유는, 모든 상품 카테고리 조합별 상대적 전환률을 보고자 하는것이 아닌, '<스마트폰 구매자>만을 대상으로 타 카테고리 제품을 추가로 판매한다 조건'하에서 분석을 진행했기 때문입니다. 

 


 

<Apple 스마트폰 구매자 크로스셀링>

 

Apple 제품 구매자의 경우, 같이 구매되는 제품군으로 headphone, clocks, notebook 이 최상단을 차지하고 있는데, 이는 각각 에어팟, 애플워치, 맥북을 의미하는것으로 판단됩니다.

 

따라서 애플 제품을 구매하는 유저의 추가판매를 유도하기 위해서는, '애플 패밀리 제품 연계 할인 행사'를 대대적으로 진행할 필요가 있습니다.

 

 

애플 스마트폰 구매 고객의 타 제품 카테고리를 구매할 조건부확률

 

 

 

<Samsung 스마트폰 구매자 크로스셀링>

 

Samsung 제품 구매자의 경우, TV, headphone, noteboock, clock 뿐 아니라, washer, vaccum 이 상단을 차지하고 있는데, 이는 삼성의 스마트폰과 함께 삼성 가전을 함께 구매하는 니즈로 사려됩니다.

 

따라서 삼성 제품을 구매하는 고객의 경우에는, 실제 진행하고 있는 '삼.세.페 (삼성 세일 페스티벌)' 와 같이 삼성 가전 전제품을 대상으로 연계 구매시 할인을 유도하는 정책을 시행할 수 있습니다.

 

 

삼성 스마트폰 구매 고객의 타 제품 카테고리를 구매할 조건부확률




 


part4 결론) 

 

part4에서는, 구매 주기가 긴 smartphone 구매 고객을 대상으로, 해당 고객들을 전환시켰다는 가정 하에, 어떻게 추가수익을 낼 수 있을까를 고민하는 파트였습니다. 따라서, 구매자 중 (1) 누구에게 집중해야 하는지, (2) 언제, 얼마나 팔아야 되는지, (3) 무엇을 팔아야 되는지를 집중적으로 고민해봤습니다.

 

다만 아쉬운 점은, 해당 커머스의 정확한 구조도 모르고, 각 product 가 어떤 제품인지 알 수 없기 때문에, product 별 상관성 분석이 아닌, 카테고리별로 상관성을 분석할수밖에 없었고, 그렇기 때문에  '크로스셀링 제품' 분석에서 다소 뻔한 결말이 나왔다는 점입니다.

 

실제 분석에서 니즈를 찾는다면, 사실 상관성이 매우 높은 제품군보다는, 상관성이 중/하위권에 위치한 제품에서 판매 인사이트를 얻는 경우가 많은 것으로 알고 있습니다. 따라서, 실제 커머스환경에서 해당 분석을 진행할 수 있다면 상품별 디테일한 상관관계를 가지고 좀 더 좋은 action 인사이트들을 많이 도전해보고 싶습니다.

 

제가 진행한 분석은 여기까지고, part5 에서는, 프로젝트 회고 및 분석 인사이트를 정리해볼까 합니다.