데잇걸즈는 실무 수준의 데이터 분석 역량을 키우기 위해 '이터레이션iteration' 단위를 통해 학습하고, 단위마다 분석 프로젝트를 거듭하는 방식으로 학습하고 있습니다. 여기서 이터레이션이란, 특정 목적의 달성이나 원하는 최종값을 얻기 위하여 특정한 알고리듬의 같은 과정을 변수만 달리하여 반복적으로 수행시키는 것을 의미하는 단어로 데잇걸즈에서는 최종 학습 목표에 도달하기 위해 작은 프로젝트를 거듭하도록 하는 회기 하나하나를 의미합니다. 데잇걸즈 구성원들은 이터레이션마다 반복적으로 작은 수준의 실패와 빛나는 성공들을 경험하며 꾸준히 성장해왔습니다!
이터레이션1에서는 1) SQL 이론 강의와 실습이 주를 이루었습니다. 프로그래머스, 해커랭크의 코딩 테스트 문제를 풀고 데이터베이스에서 원하는 데이터를 추출 및 가공하는 쿼리 작성을 연습했습니다. 2) AARRR 마케팅 워크숍을 통해 비즈니스 모델 프레임워크를 활용한 고객 행동 분석을 학습하였습니다.
"야머(Yammer)"는 마이크로소프트 산하의 기업용 소셜 네트워크 서비스 회사입니다. 데잇걸즈에서 본 프로젝트 시리즈를 위해 사용한 데이터가 "야머(Yammer)"사의 데이터이기 때문에, 일명 "야머 프로젝트"라 부르고 있습니다. 또한 사용된 데이터는 데이터 분석 솔루션 업체 "모드(MODE)"에서 받았으며, 이를 활용하여 총 3가지의 현업과 유사한 문제 상황을 가정하고 해결하는 시뮬레이션 프로젝트를 진행했습니다.
🧐비즈니스 문제 상황을 정확하게 파악할 수 있는 능력 기르기
😮 다른 사람이 한 분석의 논리 전개 방식을 파악하기
😁 다른 사람이 짠 쿼리를 읽고 이해하고 리뷰하기
최근 주간 활성 유저(WAU)가 급격히 떨어지는 문제가 발생했습니다. 이에 가상의 동료가 이 문제에 관해 이미 쿼리를 작성하고 분석을 마친 상태입니다. 이에 관한 피드백을 주는 것이 첫 번째 '야머 프로젝트'의 과제입니다.
우리는 이제부터 신입사원의 마음으로 부서의 데이터 파악부터 시작해서 ⇒ 문제 상황의 구체적인 파악 ⇒ 동료가 작성한 쿼리와 분석 과정을 이해 ⇒ 필요시 접근 방법이나 새로운 쿼리까지 제안해보았습니다.
1️⃣ 문제 상황 및 테이블 파악
2️⃣ 동료의 다섯 가지 주장과 쿼리를 해석하고 피드백하기
3️⃣추가 원인을 새 쿼리를 통해 확인해보기
👉 동료의 다섯 가지 주장
1. 신규유저는 원인이 아니다.
2. 기존유저 중에서도 오래된 유저에 주목하자.
3. 디바이스 중 phone에 문제가 있다
4. 이메일에 무언가 있다.
5. 이메일 CTR(Click Through Rate)을 보니 이것이 문제다
역설계(Reverse Engineering)를 통한 비즈니스 파악으로 문제 접근을 시도했습니다. 이를 통해서 집중이 필요한 테이블과 데이터를 먼저 확인했습니다. 동료의 분석과 쿼리를 스텝별로 쪼개어 보면서 동료가 제대로 파악한 것과 놓친 것, 그리고 어떻게 보충할 수 있는지 제안까지 해주었습니다.
ERD로 테이블 구조를 꼼꼼하게 파악하는 것으로 시작했습니다. 동료의 쿼리와 차트가 전달하는 방식이 명확하지 않다고 판단해서, SQL에 한하지 않고 엑셀도 적극적으로 활용하여 시각화를 새롭게 했습니다. 이를 통해 동료의 의견을 더 확실하게 이해하고 피드백과 제안을 할 수 있었습니다.
테이블, 차트, 쿼리로 보이는 결과를 단순히 상관관계로 보지 않고 루트(root)의 루트를 찾으면서 인과관계를 파악하고자 했습니다. 이를 통해서 피드백 과정에서 얻은 인사이트로 데이터 분석가가 서비스 기획자에게 줄 수 있는 제안까지 해보았습니다.
가상의 동료와 조원들이 회의하는 형태의 스토리텔링으로 내용을 구성하였습니다. 동료의 주장과 쿼리에 관해서 계속해서 질문을 주고받는 형식을 취했더니, 놓치는 부분 없이 꼼꼼한 피드백과 다양한 추가 제안을 할 수 있었습니다.
동료의 가설과 결론은 대부분 적절하다고 판단했지만, 그 가설에서 결론에 이르는 과정에 관해 집중적인 피드백을 진행했습니다. 특히 명확하지 않은 변수명 정의부터 새로운 논리와 쿼리를 짜서 근거를 보충할 수 있도록 했고, 한 번에 이해하기 어려운 복잡한 쿼리나 그래프를 쉽게 알아볼 수 있도록 다듬었습니다.
프로그래머스 등에서 'SQL을 풀어야 할 문제'로만 다루다가, '비즈니스 문제를 풀기 위한 도구'로 SQL을 다루었습니다. 특히 문제 정의부터 결론까지 무엇이든 "틀릴 수 있다", "정답은 없다"를 전제로 다양한 접근을 시도했습니다. 또한 공통으로 공감했던 것은, 분석 결과를 '전달'하는 일의 중요성이었습니다. 피드백을 위한 접근을 할 때조차 동료의 분석이 자연스럽게 이해되지 않는 부분들을 많이 발견하였는데, 현업에서 다양한 이해관계자들과 커뮤니케이션 하는 상황을 생각했을 때를 늘 염두에 둬야겠다고 느꼈습니다. 이다음에는 의사결정을 위한 분석 프로젝트, "2️⃣검색 기능 개선 방안을 제시하라" 편을 기대해주세요!
코로나 분석 프로젝트: 2020 소상공인을 위한 서울 상권 분석 2️⃣ (0) | 2020.12.15 |
---|---|
코로나 분석 프로젝트: 2020년 소상공인을 위한 서울 상권 분석 1️⃣ (0) | 2020.12.14 |
생활데이터 프로젝트: 취업하려는 자, JD를 분석하라! (0) | 2020.12.13 |
야머 프로젝트3️⃣: A/B테스트 결과를 분석해라 (0) | 2020.12.04 |
야머 프로젝트2️⃣ 검색 기능 개선 방안을 제시하라! (0) | 2020.12.01 |
댓글 영역