0%

# 数据清洗

# 重复数据的处理

# 函数法

  countif(统计区域,统计内容)函数:如果想统计countif统计是重复的第几个项目,可以使用countif(初始单元格到当前统计单元格区域,统计内容)统计是第几次重复,例如countif($A$1A2:A2)。

# 高级筛选法

  数据选项卡->排序和筛选->高级筛选->选择不重复的数据

# 条件格式法

  开始->条件格式->突出单元格规则->重复值

阅读全文 »

# 数据的构造

# 字段与记录

  字段是事务或现象的某种特征。比如成绩表中的“学号”,“姓名”,“总分”等都是字段,在统计学中成为变量

  记录是事务或现象等具体表现,比如沉寂表中的“性别”可以是男或女,“总分”可以是“237”或“230”等,记录也成为数据或量值。

# 数据类型

  数据类型一般分为字符型和数值型数据

  字符型数据是不具备计算能力等文字型数据,包括中文英文、数字字符(例如订单编号这类非数值型数据)等字符。例如成绩表中的“姓名”,“性别”,“总评”三个变量均为字符型数据。

阅读全文 »

  在进行数据之前,首先应该明确分析的目标和思路。只有明确的目标和思路才能为后续的数据收集,数据处理及数据分析题提供清晰的指引方向。针对各式各样的数据分析的需求,往往会有以下问题:

  • 不知到从何入手
  • 分析的指标常常被人质疑不合理,不完整
  • 自己也不明白分析出的结果有什么意义

  分析方法论的作用就是知道数据分析人员对数据进行一次完整的数据分析。只有在营销、管理等方法和理论的知道下,结合实际业务才能确保数据分析的纬度的完整性,就像建筑设计为建筑工人提供建设思路一样,只有明确的设计图纸,建筑工人才能根据图纸,使用各种各样的工具和材料,建设出满足施工需求的房屋建筑来。

阅读全文 »