margaret 学习笔记

早睡早起

笔记 / 2018年12月7日

一. 简单实践spark 日志挖掘: 1. 日志是通过flume读取并且保存在ES中的 , 所以需要从ES中读取,需要引入 elasticsearch_spark 的Jar包(Jar版本要和ES版本一致) 2. 日志所在索引内容简单分析: 统计分析带有“RED”字符串的日志的产生日期和 IP地址个数的Map关系 scala代码: import org.apache.spark…