畅谈关于常用数据类型一二三
发布时间:2021-06-03 18:10:39 所属栏目:大数据 来源:互联网
导读:1.数据的分类 由于事物有简单和复杂的,如用户的外貌高矮等特征较直观,用户的偏好则不直观;有的差异可以用数量度量,有的则只能用分类度量。所以统计量就有定性、定量之分,对统计数据的属性、特征进行分类、标示和计算叫度量,分类见下图: (1)定性数据,
1.数据的分类
由于事物有简单和复杂的,如用户的外貌高矮等特征较直观,用户的偏好则不直观;有的差异可以用数量度量,有的则只能用分类度量。所以统计量就有定性、定量之分,对统计数据的属性、特征进行分类、标示和计算叫度量,分类见下图:
(1)定性数据,又叫分类数据。它用于确定数据的属性,不支持算术运算,只用于说明事物的品质,可能是文字或数字,可以细分为两类:
①无序数据。如:人的性别可以分为:男,女,未知3类,也可以把它们记为0,1,2;学生的成绩可以分为:及格,不及格……为了便于理解,一般可按惯例来定义,也可以按具体的业务需求等。该类数据的用数字表示时仅表示不同类别的品质是什么,而不表示量的顺序或大小,该类数据尺度的数学特征是“=”或“≠”。
②顺序数据,无序分类数据不要求有顺序,顺序数据是有序的。如:空气污染可以分为:优,良,轻度污染,中度污染,重度污染,其中后面一级都比前面一级的程度更严重,也可以用1,2,3,4,5来标识这几种分类;学生的成绩也可以分为:优秀,良好,及格,不及格,后面一级的数据也都比前面的更差。此时的尺度不能表明级别的量,仅能表明其等级差异,该类数据尺度的数学特征是“>”或“<”。
(2)定量数据,又称为数值型数据,用于说明事物的数量,形式是数字,也可以分为两类,主要按数值是否连续划分:
①离散型数据,离散型是通过计数得到的,增长量不固定,比如:北京市上月的空气质量有20天是优,本月共10天优;北京市去年净流出200万人,今年净流出100万人。它不仅能对事物区分不同的类型,还能对其排序,做数学运算。
②连续型数据,这是一直叠加上去的,增长量可以划分为固定的单位。如:人的年龄是1岁,1.2岁,1.5岁,2岁......人的身高1.5米,1.51,1.52......
![]() (编辑:无锡站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |