분류 전체보기 93

[고객 분석법2] 생존분석/RFM/cohort/고객생애가치/장바구니 분석/추천시스템

업 분석 사례 정리0. 공부계기 본 내용은 [DACON] "이커머스 고객 세분화 분석 아이디어" 에 참여하여 공부하며 실제 프로젝트에 적용, 또는, 적용을 위해 공부해온 내용을 정리하고자 작성하게 되었습니다. (2025.01 수정) 다루게 될 내용은 아래와 같습니다.  고객 생존분석법 RFM 분석법 cohort 및 리텐션 분석 고객생애가치 (LTV, CLV) 장바구니분석 (연관성분석) 간단한 추천시스템 방식과 활용사례  또한 앞으로 자주 활용될 비지니스 용어 정리를 해두는 것이 이해에 도움이 될 것 같아 아래와 같이 정리해두겠습니다. CRM - Customer Relationship Management고객 관계 관리 마케팅, 즉 고객 획득보다 기존 고객을 관리하는데 집중..

카테고리 없음 2025.01.09

[kaggle] 이커머스 고객 행동 로그 분석 part 4. (분석 목표 : 매출 증진을 위한 크로스셀링 제안)

간단 개요)해당 분석은 kaggle 의 'eCommerce Behavior Data from Multi-Category Store' 데이터를 기반으로,월 평균 300만 명의 방문 고객을 보유한, 미국 대형 이커머스의 고객 이벤트 로그 데이터를 활용해 해당 이커머스의 핵심 카테고리인 스마트폰의 구매패턴을 분석하고, 전환률을 높이기 위한 액션을 제안하는 프로젝트입니다.     Part 2, Part 3 는 '스마트폰' 구매 고객 대상으로 구매 전환을 높이기 위해서, 즉시 구매고객, 장기 상호작용 고객으로 세분화해 각 고객층별로 구매에 영향을 끼치는 요인들을 포착하는데 중요도를 두었습니다. 즉, 방문 고객중 실제 전환될 가능성이 높은 고객들을 포착하고 구매로 전환시키기 위한 목적의 분석이었다고 볼 수 있습니다..

[kaggle] 이커머스 고객 행동 로그 분석 part 3. (분석 목표 : 방문 후 1시간 이상, Cart를 활용하는 고객들의 구매 요인 분석)

간단 개요)해당 분석은 kaggle 의 'eCommerce Behavior Data from Multi-Category Store' 데이터를 기반으로,월 평균 300만 명의 방문 고객을 보유한, 미국 대형 이커머스의 고객 이벤트 로그 데이터를 활용해 해당 이커머스의 핵심 카테고리인 스마트폰의 구매패턴을 분석하고, 전환률을 높이기 위한 액션을 제안하는 프로젝트입니다.     Part 1 막바지에, 구매/이탈까지의 소요시간을 중심으로 크게 두가지의 고객을 정의했습니다. 1. 즉시 구매 고객 : 이미 상품 구매 결심을 마친 상태로 방문, 가격/조건 비교 후 빠르게 구매를 완료하는 고객.2. 장기 상호작용 고객 : 관심/구매 의지는 있지만 신중하게 고민하며, 구매까지 장기적인 상호작용을 거치는 고객. 그중, 이..

[kaggle] 이커머스 고객 행동 로그 분석 part 2. (분석 목표 : 방문 1시간 이내 즉시 구매고객의 전환 요인 분석)

간단 개요)해당 분석은 kaggle 의 'eCommerce Behavior Data from Multi-Category Store' 데이터를 기반으로,월 평균 300만 명의 방문 고객을 보유한, 미국 대형 이커머스의 고객 이벤트 로그 데이터를 활용해 해당 이커머스의 핵심 카테고리인 스마트폰의 구매패턴을 분석하고, 전환률을 높이기 위한 액션을 제안하는 프로젝트입니다.      Part 1 막바지에, 구매/이탈까지의 소요시간을 중심으로 크게 두가지의 고객 세부 군집을 정의했습니다. 1. 즉시 구매 고객 : 이미 상품 구매 결심을 마친 상태로 방문, 가격/조건 비교 후 빠르게 구매를 완료하는 고객.2. 장기 상호작용 고객 : 관심/구매 의지는 있지만 신중하게 고민하며, 구매까지 장기적인 상호작용을 거치는 고객..

[kaggle] 이커머스 고객 행동 로그 분석 part 1. (분석 목표 : 전환 과정의 pain-point 탐색 및 개선)

0. 분석 데이터 설명  해당 이커머스 데이터 분석은 kaggle 의 'eCommerce behavior data from multi category store' 데이터를 활용,월 평균 285만 명의 Unique User 가 방문하는 미국 대형 이커머스에서 수집된 User_event_log (view, cart, purchase) 데이터를 분석하였습니다. 제공 데이터는, 2019년 10월 ~ 2020년 4월까지 총 7개월의 데이터 중 10월 데이터만을 활용,MySQL, Python 을 활용하여,약 300만명의 개별 방문 고객의, 4500만건의 이벤트 로그를 분석하였습니다. 분석목표로는, (유입 ⮕ 탐색 ⮕ 구매) 로 이어지는 구매 패턴을 파악하고, 전환률 향상을 위한 액션 인사이트를 제안하는 것 을 목표..

[체인지업] 9-10 체인지업을 참여하며 (면접왕 이형 체인지업 리뷰)

체인지업을 6주간 참여하며 느낀점... 인턴을 끝내고 나서면접도 보고, 서류도 쓰고, 포트폴리오도 만들고, 현직자 인터뷰도 하고...그렇게 정신없이 1-2 개월을 후딱 보냈다. 뭔가 많이는 했는데, 그 당시 자기소개서, 포트폴리오, 취업 포트폴리오를 다시 돌아보면 "엥?...나 겨우 이거밖에 안했나?"  싶은 것들이 많다.  특히, 매번 기업마다 쓰는 자기소개서를 돌아보면,분명 나는 이 기업에 대해 며칠간 조사하고, 서비스도 이용해보고, 나만의 특별한 경험은 없나 찾아봐도스스로 적어본 자기소개서는 초라하기 짝이 없었다. 나는 그 산업, 그 직무에 지원하기 위해 정말 많은 노력을 했지만,내용은 그저 뻔한 뉴스 한두개 가져온,, 누군가 예기했던 '회사 이름만 바꾸면 여기저기 다 낼 수 있는' 그런 자기소개서..

대외활동 2024.10.16

[사례 분석] 프로덕트 데이터 분석가란 (with QANDA)

-목차-0. 개요 (작성 목적)1. 프로덕트 데이터 분석가란?2. 프로덕트 분석가 업무(1)     - 작은 사이클 문제 풀기     - 기능 설계 > 실험 설계 > 데이터 수집 > 실험 진행 > 성과 분석 및 후속 대응3. 프로덕트 분석가 업무(2)    - 큰 사이클의 문제 풀기    - 상위 조직 KPI에서 하위 조직 KPI까지 / 분석 조직 문화 만들기4. 느낀점       0. 개요 데이터 분석가 업무를 준비하는 데 있어  '프로덕트' vs '비지니스' 라는 용어를 현직자 인터뷰에서 많이 접했는데,또, 이와 관련해 '이펙트', '액션' 을 만드는 분석 이라는 표현들까지,실무에서 직접 경험하기 전에는 무슨 의미인지 이해하기 어려운 표현들이 많았습니다.그런데, 마침 '데이터야 놀자' 의 유튜브 채널..

[게임 데이터] 벽돌 깨기 게임 로그 분석 - 12개 맵 난이도 분류

0. 개요간단한 플레이 로그데이터를 바탕으로, 각 레벨 스테이지의 난이도를 계산하는 프로젝트를 진행했습니다. 본 테스크는 kaggle - "Arcade Game Stats" 를 기반으로 진행하였으며, 테스크 목적은, 제작된 Level-000 총 19개 스테이지에 대해 오토 봇 플레이를 6,814 번 진행했을 때, 이 플레이 로그를 바탕으로, 19개의 맵의 난이도 순서를 측정하는 테스크입니다.     Date: 게임이 오토 플레이된 날짜와 시간Level: 레벨명 (3자리 숫자는 이전 실행의 난이도 추정치로, 조정 후에는 더 이상 유효하지 않음)NumBlocks: 레벨을 클리어하기 위해 깨야 하는 블록의 수IsWin: 자동 재생이 모든 블록을 깼다면 True(클리어), 공이 패들 밑으로 떨어졌다면 Fals..

[MySQL] 데이터 분석을 위한 SQL 레시피 - part5 유저 액션 /벤다이어그램/지속률 및 정착률/RFM

0. 개요이번 챕터의 내용은 분석법에 집중하기보단, 서비스 운영 과정에서 일반적으로 활용되는 고객 분석법들을 나열하여, 필요 상황에 맞게 활용하도록 구성한 듯 합니다. 따라서, 이 포스팅에는 액션별 집계, 로그인/비로그인 유저 집계, 회원/비회원 유저 집계 , 연령/성별 별 유저 집계, 카테고리/연령, 방문빈도 집계, 벤다이어그램, Decile 분석, RFM, 지속률/정착률, 잔존률(리텐션) 까지만 진행하고 이후 포스팅에서는  MAU 부터 LTV 계산까지 다뤄보는 것으로 목표를 잡았습니다.  데이터셋은 아래와 같이, 사용자 마스터 테이블, 액션 테이블로 구성되어 있고 특징은 다음과 같습니다. (1) 탈퇴 회원의 경우, 마스터 테이블의 withdraw_date에 탈퇴 날짜를 표기한다.  (2) 액션은 모두..

My SQL 2024.06.21

[사례 분석] 이상치 탐지 기업 사례 분석 (시계열/어뷰징/핵)

0. 개요 실시간 모니터링 업종네트워크 침입 탐지 / 의료 탐지 / 이상 금융 거래 / 제조 결함  외부       1. 네이버 클라우드 - 시계열 이상치 탐지 (2023, Transformer)(1) 시계열 이상탐지 개요출처 : https://youtu.be/bg2e60IZ40Q?si=XmMWLRqxeuyTVjdI 시계열 이상치를 일반적으로 탐색하기 힘든 이유로는 크게 아래의 두 가지가 있습니다. (1) 정상데이터 VS 비정상데이터 구분 어려움(2) 정상데이터 VS 비정상데이터 불균형 먼저 첫번째로, 학습 이전에 비정상 데이터 자체를 정의하기 힘든 문제가 있습니다. 예를 들어 아래와 같은 시계열 그래프에서 추세에서 벗어난 모든 점들을 모두 마구잡이로 이상데이터로 취급할 수는 없습니다. 이 중에는 일반적..