机器学习实践-信用卡欺诈检测-imbalanced-datasets
大数据 / 2018年6月17日

项目介绍:信用卡欺诈检测—imbalanced-datasets 欺诈行为是小概率事件,因此数据集中欺诈标签的数据比例会比较少,本案例主要介绍标签分布不均衡场景下的数据建模 处于隐私考虑,下面部分数据特征的名字和含义没有,但不影响数据分析; Time:Number of seconds elapsed between this transaction and the first tra…

机器学习实践–疾病分类
大数据 / 2018年6月17日

项目说明: 根据用户诊断信息数据判断泌尿系统的疾病–肾炎症还是膀胱炎症? 这是一个典型的分类问题   数据集: http://archive.ics.uci.edu/ml/machine-learning-databases/acute/ a1 病人的体温 { 35C-42C } a2 有恶心反胃症状 { yes, no } a3 是否腰疼 { yes, no } a4 排尿…

机器学习实践–blackFriday
未分类 / 2018年6月16日

项目说明:  根据用户购物行为发现一些特征相关性,并做一些分类预测或者聚类; 比如预测客户的年龄,预测用户购买物品的种类,比如基于用户的聚类等   数据源 来自零售商店的事物数据 User_ID: Unique identifier of shopper. Product_ID: Unique identifier of product. (No key given) Gender: S…

机器学习实践—心脏疾病预测
大数据 / 2018年6月6日

项目说明:  心脏疾病预测   数据源 https://www.kaggle.com/sarubhai56/heart-disease > 1. age  > 2. sex  > 3. chest pain type (4 values)  > 4. resting blood pressure  > 5. serum cholestoral in mg/d…