Metis当前0.3.0版本开源的时间序列异常检测学件,是从机器学习的角度来解决时序数据的异常检测问题。 目前Metis有为三张表: 进行时间序列异常检测是需要使用历史数据的。一般情况下可以选择历史14天的数据,或者历史一周的数据。或者选择其中的一个时间序列切片。 数据存储,即海量的运维数据。一般是对接大数据平台,是经过ETL后的数据,这块是不在Metis开源项目里面。 寻找异常样本的时候,就相当于在海量时间序列里面捞一根针,这个成本很高。Metis通过用无监督或者统计判别的方法,可以把范围大大的缩小。通过算法过滤到大量的正态样本,剩下的就是疑似异常。进而通过Metis人工标注模块打标,再通过有监督学习算法对这些样本进行训练。 这块Metis源码其实也有,但是方法属于在线模块下,需要自行抽出。 通过上一步输出的疑似异常,将写入异常表里,进而可以通过Metis提供的页面进行打标。 经过打标后的数据,进入样本表。可以通过Metis提供的训练模块,先通过特征工程模块提取拟合、统计、分类的特征,再通过xgboost生成模型。 即在线预测,要把离线训练生成的模型加载到线上。再根据在线预测出的异常写入异常表,再打标,进而不断迭代模型。 目前Metis提供2个接口,量值检测(KPI指标的检测)和率值检测(成功率的检测)。接口只能针对一个数据点做异常检测。 即上述离线模块统计算法&无监督算法输出疑似异常的内容。 如果请求参数带有taskId,则使用对应taskid的检测模型,如不传,则采用系统默认模型。 通过特征工程模块提取拟合、统计、分类的特征 通过2.2.3 加载的xgboost有监督模型,判断数据点是否异常,这里需要注意的是,通过Metis的量值检测和率值检测接口发现的异常,会把异常数据写入异常表,待人工标注。 拟合特征提取包含移动平均、加权移动平均、周期性特征、指数平滑、双指数加权移动平均、周期性特征。 分类特征提取包含均值、方差、标准差、中位数、自相关、变异系数以及 统计特征提取包含最大值、最小值、均值、方差、标准差、偏度、峰度、中位数、时间序列的平方和、返回序列x的连续变化的绝对值之和、方差是否大于标准差、大于均值的数的个数等30个特征。 Metis打标是针对疑似异常做打标,即针对anomaly表内容。 先通过第一层statistic(3西格玛准测)、ewma(指数加权移动平均)、polynomial(degree的多项式特征结合上岭回归)、iforest(孤立森林)四种算法检测,如果第一层任意一个算法检测出异常,则使用xgboost再次进行预测输出xgboost的结果,如果四中算法预测都正常,则返回正常。 详情参考系列文章 2019年人工智能热门案例精讲之歌词生成器腾讯织云Metis异常检测原理刨析
1. 基础介绍
1.1 表说明
1.2 数据集说明
Metis里,当前检测时间窗口选取的是为3小时,每分钟1个数据点,即窗口值为180。数据集data_c,data_b,data_a, 代表的含义如下图的一周前、一天前、当天,对应数据库sample_dataset表的三个字段data_c,data_b,data_a:
需要说明的是Metis默认180窗口下,一个样本有903个数据点,即一周前:1(待判断点)+180+180,前一天1+180+180,当天1+180。2. 技术架构
2.1 离线模块
2.1.1 数据存储
2.1.2 统计算法&无监督算法输出疑似异常
统计算法通过3西格玛准测、基于指数移动平均算法(EWMA)
无监督算法通过孤立森林
通过这些算法可以输出疑似异常。2.1.3 样本库人工打标
2.1.4 特征工程和有监督算法
2.2 在线模块
2.2.1 数据提取
2.2.2 统计算法&无监督算法输出疑似异常
2.2.3 加载有监督模型
taskid的检测模型是通过样本训练生成的模型。2.2.4 特征工程
2.2.5 有监督算法
3. 特征工程
3.1 拟合特征
3.2 分类特征
3.3 统计特征
4. 打标工程
目前anomaly表的数据来源:量值检测和率值检测接口发现的异常之后,把数据写入此表。
5. 两层判决
Metis异常检测初体验
Metis异常检测算法源码
Metis异常检测数据集训练源码深入刨析
Metis异常检测算法率值检测和量值检测源码刨析
Metis异常检测样本管理源码分析
本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器 下载并得到。
ImovieBox网页视频下载器 下载地址: ImovieBox网页视频下载器-最新版本下载
本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.
阅读和此文章类似的: 全球云计算