性能 – margaret 学习笔记

0

Elasticsearch日志监控–自定义flume-elasticsearch-sink

大数据 , 性能 / 2018年11月27日

为了方便监控 ES 的慢查询日志, 采用方案:flume+elasticsearch+kibana方式, 但是我们ES版本是6.*, 而Flume官方版本只兼容ES1.7… 所以需要自定义flume 对接ES的 Sink代码 Flume 原理&架构 flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方，用于收集…

0

ActiveMQ 理解1–原理与网络IO模式

微服务 , 性能 / 2018年11月11日

MQ 是很常见的分布式中间件，被测系统和测试工具中也经常用到它们，使用它们的时候要遇到很多概念： JMS，AMQP , Producer，consumer等等，它们之间是神马关系？ MQ的实现原理又是什么？性能指标有哪些？可以通过哪些配置参数提升传输性能？ MQ基础–协议常见的MQ有 activemq, rabbitmq, rocketmq, kafka等，常用消息队列协议的基本原…

0

常见网络IO模型原理 & JAVA NIO模型

性能 , 笔记 / 2018年11月7日

网络IO传输模式和编解码方案对系统的性能影响至关重要, 作为HTTP Server, 为什么Nginx 的网络IO性能很高, 而Tomcat 之类的Web Server 网络IO 性能相对较低 ? 系统选择的网络IO模型不同, Nginx使用的poll/epoll属于多路复用型网络模型; Tomcat 6 之前的版本都是用的阻塞式IO模型 (6版本之后支持 NIO模式了,网络IO有所提升) , …

0

性能测试问题初步定位方法&样例–DB

性能 / 2018年10月6日

1.DB服务常见问题 1、慢SQL，查询语句不好，没有优化，如：没有索引或者没有用到索引等 2、I/O吞吐量小，形成了瓶颈效应。 3、内存不足 4、网络速度慢 5、锁或者死锁(这也是查询慢最常见的问题，是程序设计的缺陷)sp_lock,sp_who,活动的用户查看,原因是读写竞争资源。 2. DB监控指标&工具：资源层：和其他软件一样业务层： …

0

性能测试问题初步定位方法&样例–java应用

性能 / 2018年10月5日

1. 性能问题发现 1.1 用户体验 a. RT : 超时 b. TPS 率：达不到预期值 c. 错误率：比预期值高以上数据来源为压测工具端的统计监控 1.2 被测端监控告警资源层：系统 load 值、内存使用率、磁盘使用率、网络带宽等超过阈值业务层：连接数满，full GC频率过高等 2.性能问题定位流程 3. Java 类问题定位常用工具&…

0

笔记：Mysql BTree索引原理理解1

性能 / 2018年10月4日

一般一个项目质量活动中，性能测试经常发现一些RT时间过长问题和DB服务有关，通常慢查询类问题比较多，一般影响查询时间长短的主要是对DB索引的理解和使用问题，比如没有索引或者没有用到索引(这是查询慢最常见的问题，是程序设计的缺陷)，当然也有一些其他类型的原因，比如查询出的数据量过大（可以采用多次查询或其他的方法降低数据量），锁或者死锁(这也是查询慢最常见的问题，是程序设计的缺陷)sp_lock,s…

0

flink实践–dataset-ML

性能 / 2018年4月16日

Flink也支持ML库，但不太成熟： flink 比spark 支持的ML算法少很多 flink中只有dataset 类型的数据才能使用ML，datastream类型数据没有专门的ML库； flink 中dateset 不能转换成dataframe结构…特征数据处理感觉不是很方便 flink dateset ML库中的算法类似乎没有提供模型评估方法一个简单的线性回归算…

0

机器学习实践–Titanic 乘客生还率预测

性能 / 2018年4月5日

1.业务分析: 根据乘客的各维度特征预Titanic乘客生还概率框架选择: 数据分析–pandas 机器学习–sklearn 2.数据分析: 导入数据分析维度和类型: df = pd.read_csv(‘D:/code/sparkProject/sparkInput/titanic-data.csv’) print(train_df.head()) 结果显示…