
안녕하세요~ 오랜만에 인사드리겠습니다. 어떤 글을 써야 할지 몰라 방황하고 있었습니다....최근에 넥슨에서 게임 데이터 API를 제공해 준다는 소식을 듣고 슬쩍 가서 보니까 메이플스토리 API가 존재하더라고요~ 어릴 때 메이플스토리를 생각하고 봤지만, 하이퍼 스탯, 어빌리티, 장착심볼 등등.... 제가 알던 메이플은 이제 없는 거 같아요...😥😥그래도 제 눈에 띄었던 건 무릉도장 랭킹 API였습니다. 무릉도장 랭킹에 등재된 캐릭터 능력치를 예측 모델에 학습해 도착 층수를 예측할 수 있지 않을까 싶어 무릉도장랭킹 API를 기반으로 필요한 데이터들을 추출해 보겠습니다.그리고 API 활용에 조금이나마 도움이 될 수 있게 코드도 공유해 보았습니다~제가 생각한 프로세스는 아래와 같습니다.무릉도장에..
안녕하세요 정말 오랜만에 글을 쓰는 거 같습니다. 이런저런 일이 있으면서 글을 안 쓰다 보니 점점 더 게을러지는 거 같네요....😓😓 다시 정신 차리고 열심히 살아보겠습니다. 최근에 이탈리아로 여행을 가게 되었는데 유럽 환율이 어질어질하더라고요.... (저는 1,435원 정도에 환전을 했는데 이탈리아 여행 중에는 1,470원을 넘더라고요😮) 1원이라도 아끼고 싶은 마음이 생겨 환율 사이트를 찾고 시간 날 때마다 접속하여 유럽 환율을 체크하였는데 시간이 흐르니 유럽 환율을 확인하는 과정도 귀찮아지더라고요... 그래서 일정 시간이 되면 유럽 환율을 알려주는 프로그램을 만들어야겠다고 생각을 하게 되었습니다. 프로세스의 변화는 아래와 같습니다. 프로그램 개발 전 프로세스는 즐겨찾기나 인터넷만 종료하지 않으면 프..
전 글에서 저희는 라이더 운영팀이 목표로 잡았던 활동률을 달성하지 못했다는 걸 파악하였고, 활동률을 올리기 위한 서비스 목표를 정했습니다.(근면성실한 라이더와 계약을 진행) 이제 회사에 수집한 라이더 활동 데이터를 통해서 근면성실한 라이더의 특성을 파악해 보겠습니다~ 데이터 변수 선정 하기 전 근면성실한 라이더에 대한 정의를 정하고 진행하겠습니다. 계약 기간 동안 활동률 95% 이상 인 라이더 평균 배달건이 1.5 이상 하는 라이더 위 기준은 라이더 운영팀에서 목표로 했던 KPI를 기반으로 설정하였으며, 빠르게 분석을 진행하겠습니다. 저는 먼저 라이더 당 활동 수, 계약(혹은 배달) 기간, 배달 수 등을 추출하겠습니다. 먼저 라이더당 배달 건수를 만들겠습니다. delivery_count = df['Del..
전 글에서 코호트 분석을 통해 주 단위로 라이더들과 계약해서 배달을 진행하고 있다는 걸 확인했습니다. 1 ~ 2 주차는 599 ~ 600명, 4 ~ 9 주차는 720명과 계약을 진행하였습니다. 저희는 599, 720명 라이더 계약이 효과적인 계약이었는지 파악해 보겠습니다. 라이더 운영팀에게 문의해서 계약 라이더 수를 어떻게 선정하였는지를 문의하였습니다. 1 ~ 2주 차 때는 하루 800건의 배달이 발생할 거라고 가정하고, 라이더 활동률은 95% 이상, 라이더 1명당 배달을 1 ~ 1.5건 수행할 거라고 예상해 599 ~ 600명을 계약 진행 했으며, 지속적인 배달 증가로 4주 차부터는 하루 배달 건수 1000건을 예상하고 라이더 활동률과 라이더 1명당 배달 수행 건수는 전에 와 똑같이 정했다고 답변이 왔..
전처리를 한 데이터를 기반으로 비즈니스 인사이트를 도출하고 타 부서에게 제안하는 프로세스를 진행해볼게요. 저는 비즈니스 데이터 분석을 사업 기획 방향 및 타당성과 사업 관리를 데이터로 찾고, 검증하는 분야라고 정의하였어요. 각자 생각하는 정의가 있을 텐데 프로젝트 진행 시에는 팀원들과 비즈니스 정의도 통일해서 하는 게 좋겠죠? 상황을 가정해 볼 건데, 우리가 받은 데이터는 라이더가 레스토랑에서 음식을 픽업해서 고객(주문자)에게 전달하는 과정이 담긴 데이터입니다. 즉, 라이더 운영팀이 분석팀에게 요청을 한 거라고 볼 수 있겠죠? 라이더 운영팀은 라이더가 음식 픽업 및 배달을 어떻게 하면 더 효과적으로 할 수 있을지 연구하고, 라이더를 관리하는 팀이라고 하겠습니다. 그럼 라이더 운영팀 요청 사항을 보겠습니다..
이제 기다리고 기다리던 데이터를 보고 우리가 분석하기 좋게 데이터를 전처리하고 새로운 변수를 만들어 볼게요. 먼저 데이터부터 볼게요~ 데이터 정보를 봤을 때 null 값은 없는 걸로 나왔습니다. 그럼 Delivery_person_Age, Delivery_person_Ratings 등은 float64로 Order_Date. Time_Orderd 등은 datetime은로 타입을 변경시켜 보겠습니다. 어...?🤷♀️🤷♂️ NaN 값이 존재하네요?? Delivery_person_Age에서 NaN 값이 존재하는지 보겠습니다. 데이터 정보에서는 없다고 했는데 NaN이 떡하니 있네요... 이런 경우에는 NaN 값이 str으로 취급되어서 그런 겁니다. 그래서 NaN 타입을 float로 변경한 다음에 다시 null ..
전 글(배달 비즈니스 이해)에서 우리는 배달의 정의와 배달 플랫폼 프로세스를 통일하고 적용했어요. 본격적으로 데이터를 볼게요. 기업 내에 존재하는 데이터를 추출했고, 추출한 데이터 외에는 데이터가 존재하지 않다고 가정할게요. 데이터를 받고 컬럼과 타입 등을 확인해볼게요. 컬럼 20개, 데이터 45593개, TIME, STRING, INT 가 혼합되어 있는 걸 파악했습니다. 각 컬럼의 의미를 확인해보겠습니다. 컬럼명 설명 ID 주문 발생시 부여되는 ID(데이터에 중복이 존재 하지 않음) Delivery_person_ID 라이더 ID Delivery_person_Age 라이더 나이 Delivery_person_Ratings 라이더 평점 Restaurant_latitude 레스토랑 위도 Restaurant_l..
제가 경험한 분석 경험을 토대로 분석 프로세스를 진행해 볼 예정입니다.(조언과 팁은 언제나 환영~🙌) 현재 저희는 배달 플랫폼을 운영하는 기업(A 기업이라고 부를게요)에서 데이터 분석가로 일 하고 있다고 가정할게요. 그리고 배달 데이터를 기반으로 서비스를 고도화시켜야 하는 미션을 받았죠. 빡센 프로젝트가 될 거란 생각이 드네요...😢 프로젝트를 들어가기 전 배달의 정의를 제대로 잡고 배달 플랫폼의 비즈니스를 이해를 해볼게요. 왜 배달의 정의를 정해야 해? 당연히 알고 있잖아! 그럴 수도 있지만 팀을 꾸려서 프로젝트를 진행하게 되면 같은 단어를 말해도 서로가 생각하는 의미는 미세하게 다를 수도 있어요.(같으면 땡큐 😁) 미세한 차이는 이슈 처리, 분석 결과 도출에서 생각지 못한 문제를 발생시킬 수 있고 서..
데이터 분석의 시작은 분석하는 분야를 이해하는 거라고 생각합니다.(그 이유는 분석한 인사이트를 이해할 수 있기 때문) 그렇기에 분석 프로젝트를 진행하면 두 가지 상황이 발생할 수 있죠. 1. 분석가가 도메인 지식을 전혀 모르는 상황 2. 분석가가 도메인 지식을 알고 있는 상황 1번인 경우에는 도메인 전문가와 인터뷰, EDA를 통해 지식을 쌓고 현상을 이해하는 과정이 발생할 것이고, 2번인 경우에는 EDA를 진행하면서 도메인 가설들을 검증하면서 분석을 진행하게 되죠. 이번 음식 배달 데이터 분석은 2번인 경우라고 생각하고 분석을 진행할게요~(다음엔 1번인 경우를 가정하고 진행해 보겠습니다. :D) 분석 데이터는 https://www.kaggle.com/datasets/gauravmalik26/food-de..
- Total
- Today
- Yesterday
- 비즈니스분석
- 라스트마일
- 데이터
- maplestory
- Lastmile
- 메이플API
- 음식 배달
- 코호트분석
- Crawling
- Requests
- 배달
- OpenAPI
- 포지션매트릭스
- 무릉도장
- 데이터분석
- 라스트마일 분석
- 라스트마일분석
- 비즈니스 데이터분석
- 크롤링
- BeautifulSoup
- 비즈니스 분석
- 환율
- NEXONAPI
- 메이플
- 음식
- Investing
- 음식배달
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |