数据分析实践1
大数据 , 笔记 / 2019年1月2日

整个机器学习的流程主要分如下几个主要过程: 业务理解 数据分析理解  数据预处理 建模 模型效果评估 使用合格的模型做预测 数据分析理解是机器学习建模的基础,目的是分析挖掘数据维度中和预测目标强相关的因素, 剔除不相关或者弱相关的因素, 用于后续的机器学习; Python ,spark框架中常用dataframe结构处理数据集,下面使用python+银行营销数据做数据分析实践: 1 理解分析数据 …

特征提取场景与常见方法
AI , 笔记 / 2019年1月1日

新年第一篇, 先做个机器学习实践总结—几种常见场景下的特征提取方法: 机器学习中最重要的一环就是特征工程,特征工程的好坏直接影响模型的效果,如果做得不好大概率会出现“garbage in,garbage out ”的情况; 特征的提取主要指特征信息的数值化,向量化的过程,下面仅仅根据个人实践经验和理解简要总结常见应用场景下的特征提取方法:   1.特征提取的场景&常见…