动手学数据分析(5)——数据建模与评估

本文为Datawhale8月组队学习——动手学数据分析课程的系列学习笔记(5),主要介绍了数据建模与评估的相关内容。数据建模部分主要涉及模型的选择和评估方法,实际上这部分的内容已经超出了数据分析入门课程的范畴,数据建模涉及另外一套完整的理论体系,仅仅两天学习是完全不够的,需要后续的补充完善。
阅读更多

动手学数据分析(3)——数据重构

本文为Datawhale8月组队学习——动手学数据分析课程的系列学习笔记(3),主要介绍了数据重构包含的内容:数据的合并、变形和分组以及相应的python实现。
阅读更多

动手学数据分析(2)——数据清洗及特征处理

本文为Datawhale8月组队学习——动手学数据分析课程的系列学习笔记(2),主要介绍了数据的清洗(缺失值/重复值)以及数据特征的处理——连续型数据的离散化(数据分箱)以及类别数据的几种编码方式。
阅读更多

动手学数据分析(1)——数据加载与探索性分析(EDA)

本文为Datawhale8月组队学习——动手学数据分析课程的系列学习笔记(1)。数据分析包含数据加载、探索性数据分析、数据清洗、特征处理、数据建模、模型评估等多个步骤。在进行数据分析之前,需要载入我们获取的数据集,并通过探索性分析初步了解数据的结构、组成和特征。
阅读更多