数据处理与分析
|
数据提取简称取数,就是根据数据分析的目的或业务方的需求,从数据库中提取所需数据的过程,可以算是正式数据分析流程的第一步。但公司的大数据平台或者数据仓库建设不完善,数据基础建设不规范、或者对业务库表的不熟悉等等因素,都会导致数据提取效率较低,再加上频繁来自业务方高频的取数需求,这就导致很多人会陷入到取数的工作中,大家是否听说过sql boy、茶(查)树(数)菇(姑)的称呼,其实就是对陷入取数怪圈的数据人的一种戏称。有些新人虽然挂着数据分析的title,但每天80%都干的是取数的工作。工作第一年经常取数无需忧虑,但是这个状态保持3年以上,就一定要争取转变了。
数据处理是指对初步收集到的数据进行加工、整理,可能是数据分析过程中最耗费时间的,尤其取决于数据质量。中小型公司和小数据量的情况下,数据分析师们通常会用Excel来处理数据,在大数据量的情况下,SQL和python的使用更为常见。 明确好分析目的和分析方法,准备好数据后,就可以着手开始分析了。分析师们需要通过分析工具、分析方法对数据进行探索,从中发现因果关系、内容联系和业务规律等,为商业目的提供参考。 对于懂业务的分析师来说,数据分析的过程其实不占用太多时间,面对业务提出来的需求和存在问题,基本能快速明确分析思路 (编辑:无锡站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |

