《大数据时代》读书笔记(二)
更多:不是随机样本,而是全体数据
全数据模式,样本=总体。
大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。
更杂:不是精确性,而是混杂性
大数据通常用概率说话
大数据的简单算法比小数据的复杂算法更有效
海量数据创造了更好的结果
更好:不是因果关系,而是相关关系
关联物,预测的关键。通过找到一个现象的良好的关联物,相关关系可以帮助捕捉现在和预测未来。
大数据的相关关系分析法更准确、更快而且不易受偏见的影响。
建立在相关关系分析法基础上的预测是大数据的核心。
评论(0)