Для участия в конкурсе на позицию предлагаем вам решить следующие задания.
Каждое задание направлено на проверку вашего уровня определенных компетенций, важных для аналитика.
**Проверяемая компетенция:**
аналитическое мышление
**Формат решения:**
опишите логику решения
- На какие наши метрики, на ваш взгляд, могли повлиять закрытие конкурента?
- Вам необходимо оценить эффект в рублях на нашу выручку от закрытия конкурента. Опишите, какую методологию бы использовали, чтобы рассчитать эффект.
- Какие общедоступные данные по Макдональдсам можно было бы использовать для ответа на второй вопрос? Опишите, как бы вы их использовали.|
Ваше решение: |
---|
**Проверяемая компетенция:**
основы статистики/проверка гипотез
**Формат решения:**
приложить ipynb/ссылку на colab
Вопросы:
- На какие метрики мог повлиять тест?
- Сделайте визуальный анализ датасета. Как ведут себя метрики в динамике? Какие распределения в данных?
- Как можно оценить эффект от теста? Если знаете несколько способов, реализуйте один, а другие опишите письменно.
- Порассуждайте письменно, какие метрики можно было бы еще оценить, если бы вам были доступны все данные компании.
Тестовый период: 7 апреля - 19 мая
Тестовые города: Пенза, Уфа, Курск, Нижний Тагил, Новокуйбышевск, Орск
Описание датасета:
Date
: датаCityName
: городOrderSource
: источник заказа - mp: мобильное приложение, web: веб-сайт, other - другоеCategory
: категория товараrto
: выручка после скидокrto_do
: выручка до скидокcost
: затраты на себестоимость товаровtickets
: кол-во заказовqty
: кол-во продуктовclients_qty
: уникальное кол-во клиентовavg_time
: среднее время сессии (только по тем, кто оформил заказ)avg_price
: средняя цена
! В исходном датасете данные уже сгруппированы по Date
, CityName
, OrderSource
, Category
.
Ссылка на датасет: Датасет |
---|
Ваше решение: |
---|
**Проверяемая компетенция:**
знание SQL
**Формат решения:**
вставьте текст запроса в рамку
Допустим у вас есть таблица с чековыми данными по двум городам со следующими полями:
cityname
- наименование городаdate
- дата чекаorderid
- id чекаclientid
- id клиентаsales
- сумма чека в рублях
Данные в таблице с 2022-01-01 по 2022-06-30.
Посчитайте подневную динамику 30-дневной активной базы по каждому городу, отсортируйте по городу и дате по возрастанию.
Пример результирующей таблицы:
cityname | date | active_base |
---|---|---|
city1 | 2022-02-01 | 534 |
... | ... | ... |
city1 | 2022-06-30 | 976 |
city2 | 2022-02-01 | 3450 |
... | ... | ... |
city2 | 2022-06-30 | 4210 |
Ссылка на датасет: Датасет |
---|
Любой — документ, презентация, а может быть что-то еще. Будем рады, если ответ будет на Google-диске. Проверьте, пожалуйста, доступ к документу - нужен «доступен всем по ссылке».
Также, вместе с результатами можете поделиться, насколько вам было интересно выполнять задание.
Желаем успешного выполнения!