전 글에서 저희는 라이더 운영팀이 목표로 잡았던 활동률을 달성하지 못했다는 걸 파악하였고, 활동률을 올리기 위한 서비스 목표를 정했습니다.(근면성실한 라이더와 계약을 진행) 이제 회사에 수집한 라이더 활동 데이터를 통해서 근면성실한 라이더의 특성을 파악해 보겠습니다~ 데이터 변수 선정 하기 전 근면성실한 라이더에 대한 정의를 정하고 진행하겠습니다. 계약 기간 동안 활동률 95% 이상 인 라이더 평균 배달건이 1.5 이상 하는 라이더 위 기준은 라이더 운영팀에서 목표로 했던 KPI를 기반으로 설정하였으며, 빠르게 분석을 진행하겠습니다. 저는 먼저 라이더 당 활동 수, 계약(혹은 배달) 기간, 배달 수 등을 추출하겠습니다. 먼저 라이더당 배달 건수를 만들겠습니다. delivery_count = df['Del..
전 글에서 코호트 분석을 통해 주 단위로 라이더들과 계약해서 배달을 진행하고 있다는 걸 확인했습니다. 1 ~ 2 주차는 599 ~ 600명, 4 ~ 9 주차는 720명과 계약을 진행하였습니다. 저희는 599, 720명 라이더 계약이 효과적인 계약이었는지 파악해 보겠습니다. 라이더 운영팀에게 문의해서 계약 라이더 수를 어떻게 선정하였는지를 문의하였습니다. 1 ~ 2주 차 때는 하루 800건의 배달이 발생할 거라고 가정하고, 라이더 활동률은 95% 이상, 라이더 1명당 배달을 1 ~ 1.5건 수행할 거라고 예상해 599 ~ 600명을 계약 진행 했으며, 지속적인 배달 증가로 4주 차부터는 하루 배달 건수 1000건을 예상하고 라이더 활동률과 라이더 1명당 배달 수행 건수는 전에 와 똑같이 정했다고 답변이 왔..
전처리를 한 데이터를 기반으로 비즈니스 인사이트를 도출하고 타 부서에게 제안하는 프로세스를 진행해볼게요. 저는 비즈니스 데이터 분석을 사업 기획 방향 및 타당성과 사업 관리를 데이터로 찾고, 검증하는 분야라고 정의하였어요. 각자 생각하는 정의가 있을 텐데 프로젝트 진행 시에는 팀원들과 비즈니스 정의도 통일해서 하는 게 좋겠죠? 상황을 가정해 볼 건데, 우리가 받은 데이터는 라이더가 레스토랑에서 음식을 픽업해서 고객(주문자)에게 전달하는 과정이 담긴 데이터입니다. 즉, 라이더 운영팀이 분석팀에게 요청을 한 거라고 볼 수 있겠죠? 라이더 운영팀은 라이더가 음식 픽업 및 배달을 어떻게 하면 더 효과적으로 할 수 있을지 연구하고, 라이더를 관리하는 팀이라고 하겠습니다. 그럼 라이더 운영팀 요청 사항을 보겠습니다..
이제 기다리고 기다리던 데이터를 보고 우리가 분석하기 좋게 데이터를 전처리하고 새로운 변수를 만들어 볼게요. 먼저 데이터부터 볼게요~ 데이터 정보를 봤을 때 null 값은 없는 걸로 나왔습니다. 그럼 Delivery_person_Age, Delivery_person_Ratings 등은 float64로 Order_Date. Time_Orderd 등은 datetime은로 타입을 변경시켜 보겠습니다. 어...?🤷♀️🤷♂️ NaN 값이 존재하네요?? Delivery_person_Age에서 NaN 값이 존재하는지 보겠습니다. 데이터 정보에서는 없다고 했는데 NaN이 떡하니 있네요... 이런 경우에는 NaN 값이 str으로 취급되어서 그런 겁니다. 그래서 NaN 타입을 float로 변경한 다음에 다시 null ..
전 글(배달 비즈니스 이해)에서 우리는 배달의 정의와 배달 플랫폼 프로세스를 통일하고 적용했어요. 본격적으로 데이터를 볼게요. 기업 내에 존재하는 데이터를 추출했고, 추출한 데이터 외에는 데이터가 존재하지 않다고 가정할게요. 데이터를 받고 컬럼과 타입 등을 확인해볼게요. 컬럼 20개, 데이터 45593개, TIME, STRING, INT 가 혼합되어 있는 걸 파악했습니다. 각 컬럼의 의미를 확인해보겠습니다. 컬럼명 설명 ID 주문 발생시 부여되는 ID(데이터에 중복이 존재 하지 않음) Delivery_person_ID 라이더 ID Delivery_person_Age 라이더 나이 Delivery_person_Ratings 라이더 평점 Restaurant_latitude 레스토랑 위도 Restaurant_l..
제가 경험한 분석 경험을 토대로 분석 프로세스를 진행해 볼 예정입니다.(조언과 팁은 언제나 환영~🙌) 현재 저희는 배달 플랫폼을 운영하는 기업(A 기업이라고 부를게요)에서 데이터 분석가로 일 하고 있다고 가정할게요. 그리고 배달 데이터를 기반으로 서비스를 고도화시켜야 하는 미션을 받았죠. 빡센 프로젝트가 될 거란 생각이 드네요...😢 프로젝트를 들어가기 전 배달의 정의를 제대로 잡고 배달 플랫폼의 비즈니스를 이해를 해볼게요. 왜 배달의 정의를 정해야 해? 당연히 알고 있잖아! 그럴 수도 있지만 팀을 꾸려서 프로젝트를 진행하게 되면 같은 단어를 말해도 서로가 생각하는 의미는 미세하게 다를 수도 있어요.(같으면 땡큐 😁) 미세한 차이는 이슈 처리, 분석 결과 도출에서 생각지 못한 문제를 발생시킬 수 있고 서..
데이터 분석의 시작은 분석하는 분야를 이해하는 거라고 생각합니다.(그 이유는 분석한 인사이트를 이해할 수 있기 때문) 그렇기에 분석 프로젝트를 진행하면 두 가지 상황이 발생할 수 있죠. 1. 분석가가 도메인 지식을 전혀 모르는 상황 2. 분석가가 도메인 지식을 알고 있는 상황 1번인 경우에는 도메인 전문가와 인터뷰, EDA를 통해 지식을 쌓고 현상을 이해하는 과정이 발생할 것이고, 2번인 경우에는 EDA를 진행하면서 도메인 가설들을 검증하면서 분석을 진행하게 되죠. 이번 음식 배달 데이터 분석은 2번인 경우라고 생각하고 분석을 진행할게요~(다음엔 1번인 경우를 가정하고 진행해 보겠습니다. :D) 분석 데이터는 https://www.kaggle.com/datasets/gauravmalik26/food-de..
- Total
- Today
- Yesterday
- 라스트마일분석
- 데이터분석
- 데이터
- BeautifulSoup
- 음식배달
- 음식
- OpenAPI
- 환율
- 라스트마일 분석
- Investing
- maplestory
- 비즈니스 데이터분석
- 크롤링
- 비즈니스분석
- Requests
- 배달
- 비즈니스 분석
- 무릉도장
- Lastmile
- 메이플API
- NEXONAPI
- 포지션매트릭스
- Crawling
- 코호트분석
- 라스트마일
- 음식 배달
- 메이플
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |