表: Steps
+-------------+------+ | Column Name | Type | +-------------+------+ | user_id | int | | steps_count | int | | steps_date | date | +-------------+------+ (user_id, steps_date) 是此表的主键。 该表的每一行包含 user_id、steps_count 和 steps_date。
编写一个解决方案,计算出每个用户的 3-day
滚动平均步数 。
计算 n-day
滚动平均值 的计算方式如下:
- 对于每一天,如果有可用数据的情况下,我们会计算以该天为结束的
n
天连续步数的平均值,否则,对于该天来说,n
天滚动平均步数是未定义的。
输出 user_id
、 steps_date
和滚动平均值。并将滚动平均值四舍五入到 两位小数。
返回结果表以user_id
和 steps_date
升序 排序。
结果的格式如下示例。
示例 1:
输入: Steps table: +---------+-------------+------------+ | user_id | steps_count | steps_date | +---------+-------------+------------+ | 1 | 687 | 2021-09-02 | | 1 | 395 | 2021-09-04 | | 1 | 499 | 2021-09-05 | | 1 | 712 | 2021-09-06 | | 1 | 576 | 2021-09-07 | | 2 | 153 | 2021-09-06 | | 2 | 171 | 2021-09-07 | | 2 | 530 | 2021-09-08 | | 3 | 945 | 2021-09-04 | | 3 | 120 | 2021-09-07 | | 3 | 557 | 2021-09-08 | | 3 | 840 | 2021-09-09 | | 3 | 627 | 2021-09-10 | | 5 | 382 | 2021-09-05 | | 6 | 480 | 2021-09-01 | | 6 | 191 | 2021-09-02 | | 6 | 303 | 2021-09-05 | +---------+-------------+------------+ 输出: +---------+------------+-----------------+ | user_id | steps_date | rolling_average | +---------+------------+-----------------+ | 1 | 2021-09-06 | 535.33 | | 1 | 2021-09-07 | 595.67 | | 2 | 2021-09-08 | 284.67 | | 3 | 2021-09-09 | 505.67 | | 3 | 2021-09-10 | 674.67 | +---------+------------+-----------------+ 解释: - 对于 ID 为 1 的用户,截止到 2021-09-06 的三天连续的步数可用。因此,该日期的滚动平均值计算为 (395 + 499 + 712) / 3 = 535.33。 - 对于 ID 为 1 的用户,截止到 2021-09-07 的三天连续的步数可用。因此,该日期的滚动平均值计算为 (499 + 712 + 576) / 3 = 595.67。 - 对于 ID 为 2 的用户,截止到 2021-09-08 的三天连续的步数可用。因此,该日期的滚动平均值计算为 (153 + 171 + 530) / 3 = 284.67。 - 对于 ID 为 3 的用户,截止到 2021-09-09 的三天连续的步数可用。因此,该日期的滚动平均值计算为 (120 + 557 + 840) / 3 = 505.67。 - 对于 ID 为 3 的用户,截止到 2021-09-10 的三天连续的步数可用。因此,该日期的滚动平均值计算为 (557 + 840 + 627) / 3 = 674.67。 - 对于 ID 为 4 和 5 的用户,由于连续三天的数据不足,无法计算滚动平均值。结果表按 user_id 和 steps_date 升序排序。
方法一:窗口函数
我们用窗口函数 LAG() OVER()
来计算每个用户当前日期与上上个日期之间的天数差,如果为 AVG() OVER()
来计算这
# Write your MySQL query statement below
WITH
T AS (
SELECT
user_id,
steps_date,
ROUND(
AVG(steps_count) OVER (
PARTITION BY user_id
ORDER BY steps_date
ROWS 2 PRECEDING
),
2
) AS rolling_average,
DATEDIFF(
steps_date,
LAG(steps_date, 2) OVER (
PARTITION BY user_id
ORDER BY steps_date
)
) = 2 AS st
FROM Steps
)
SELECT
user_id,
steps_date,
rolling_average
FROM T
WHERE st = 1
ORDER BY 1, 2;