1. 问题分析 基于房屋的各种纬度特征,预测房屋价格 2.原始数据扒取 从http://hz.ganji.com/fang5 网站上扒取 杭州市房屋特征数据: 'Address':div.find('span',class_=re.compile('area')).text.strip().replace(' ','').replace('\n',''), 'Rooms': div.find('d......
无法提供摘要。这是一篇受保护的文章。...
无法提供摘要。这是一篇受保护的文章。...
项目介绍:信用卡欺诈检测—imbalanced-datasets 欺诈行为是小概率事件,因此数据集中欺诈标签的数据比例会比较少,本案例主要介绍标签分布不均衡场景下的数据建模 处于隐私考虑,下面部分数据特征的名字和含义没有,但不影响数据分析; Time:Number of seconds elapsed between this transaction and the first tra......
项目说明: 根据用户诊断信息数据判断泌尿系统的疾病–肾炎症还是膀胱炎症? 这是一个典型的分类问题 数据集: http://archive.ics.uci.edu/ml/machine-learning-databases/acute/ a1 病人的体温 { 35C-42C } a2 有恶心反胃症状 { yes, no } a3 是否腰疼 { yes, no } a4 排尿......
项目说明: 根据用户购物行为发现一些特征相关性,并做一些分类预测或者聚类; 比如预测客户的年龄,预测用户购买物品的种类,比如基于用户的聚类等 数据源 来自零售商店的事物数据 User_ID: Unique identifier of shopper. Product_ID: Unique identifier of product. (No key given) Gender: S......
项目说明: 心脏疾病预测 数据源 https://www.kaggle.com/sarubhai56/heart-disease > 1. age > 2. sex > 3. chest pain type (4 values) > 4. resting blood pressure > 5. serum cholestoral in mg/d......
大数据产品,从系统性和体系思路上来做,主要分为五步: 针对前端不同渠道进行数据埋点,然后根据不同渠道的采集多维数据,也就是做大数据的第一步,没有全量数据,何谈大数据分析; 第二步,基于采集回来的多维度数据,采用ETL对其各类数据进行结构化处理及加载; 然后第三步,对于ETL处理后的标准化结构数据,建立数...
项目说明: 通过实时检测室内光,温度,湿度,二氧化碳来判断是否有人,一个典型的二元分类问题 数据源 http://archive.ics.uci.edu/ml/machine-learning-databases/00357/ "date": 日期 "Temperature": 温度 "Humidity": 湿度 "Light": 光线 "CO2": 二氧化碳 "HumidityR......
https://blog.csdn.net/u013733326/article/details/79827273 1. 神经网络和深度学习 – 第二周作业 – 具有神经网络思维的Logistic回归 目标: 搭建一个能够【识别猫】 的简单的神经网络 引入的库: numpy :是用Python进行科学计算的基本软件包。 h5py:是与H5文件中存储的数据集进行交互......