如何使用简单的 SQL 查询在 MySQL 中计算中位数">如何使用简单的 SQL 查询在 MySQL 中计算中位数

什么是中位数?

数值型数组的中位数是在数据排序后位于数组中间项的值。如果数组有偶数个元素,中位数就是 最中间的两个数值的平均数。

中位数对于了解“我的值是否位于中间?”非常有用。比如,我在学校的最后一次考试中得了 D (或 80),那么我的在全班同学中的排名是否在前 50%?

举一个具体的例子,我们看看从学校的这些测试分数中找到中位数的过程: [55, 80, 95, 100, 99, 70, 60]

  1. 首先,对数组排序:[55, 80, 95, 100, 99, 70, 60]  ===> [55, 60, 70, 80, 95, 99, 100].

  2. 这个数组包含 7 个元素,不是偶数,所以中位数是 (7 / 2 + 1),即第 4 项的值 => 80。

mysql 中计算某列数据的中位数

很不幸,MySQL 并未内置计算列数据中位数的函数。因此,我们需要自己创建查询。

假如我们想从“grades”列中查找中位数。来看看我们要创建的查询是什么算法:

  1. 对“grades”排序并为排序后的每一行附加序号(行号)

  2. 如果总行数是奇数,找到位于有序列表中间位置的值。

  3. 如果总行数是偶数,找到位于有序列表中间两个位置的值。

  4. 计算上面第 (3) 步和第 (4) 取得值的平均值。

  5. 返回这个平均值,它就是中位数。

那么这样的查询该怎么写?

SET @rownum := -1;
 
SELECT
   AVG(g.grade)
FROM
   (SELECT @rowindex:=@rowindex + 1 AS rowindex,
           grades.grade AS grade
    FROM grades
    ORDER BY grades.grade) AS g
WHERE
t.rowindex IN (FLOOR(@rowindex / 2) , CEIL(@rowindex / 2));

解释一下:

  1. 先从内部的一个子查询开始 —— 为 @rowindex 赋值的子查询会为每个成绩赋予一个自增后的序号,并对 grades 排序 [译者注:按逻辑和代码是先排序再赋予序号]。

  2. 有了排好序的成绩列表之后,外层查询会获取位中间位置的值。如果数组元素是奇数个,两个值都是取的位于正中那个值。

  3. 然后,外层查询的 SELECT 子句返回上述两个值的平均值作为中位数。

你看,这并不是简单的运行 MEDIAN(column_name),但它可行。我们期待 MySQL 会决定将这一功能添加到内置产品中,这将简化获取中位数的查询。

赞 (0) 评论 分享 ()