spark简单实践—日志挖掘& SVM算法
笔记 / 2018年12月7日

一.  简单实践spark 日志挖掘: 1.  日志是通过flume读取并且保存在ES中的 , 所以需要从ES中读取,需要引入 elasticsearch_spark 的Jar包(Jar版本要和ES版本一致) 2. 日志所在索引内容简单分析: 统计分析 带有“RED”字符串的日志的产生日期和 IP地址个数 的Map关系   scala代码: import org.apache.spark…