应用高斯分布开发异常检测算法,这个比较简单,高斯分布也叫做正态分布,高中就学过,如果我们的数据符合高斯分布或者比较像高斯分布的时候可以使用这个算法,通过训练集计算高斯分布函数,与交叉验证集比较设置合适的Σ,当测试数据小于Σ时则为异常
1 | #!/usr/bin/python |
这是我们的训练集合,明显有六个是异常数据
画出连个特征的高斯函数,比较像高斯分布
通过我自己写的高斯密度函数计算,有些过拟合,多拟合到了两个点,不知道为什么。
调用scipy的高斯函数库计算后完美的检测到了异常数据
应用高斯分布开发异常检测算法,这个比较简单,高斯分布也叫做正态分布,高中就学过,如果我们的数据符合高斯分布或者比较像高斯分布的时候可以使用这个算法,通过训练集计算高斯分布函数,与交叉验证集比较设置合适的Σ,当测试数据小于Σ时则为异常
1 | #!/usr/bin/python |
这是我们的训练集合,明显有六个是异常数据
画出连个特征的高斯函数,比较像高斯分布
通过我自己写的高斯密度函数计算,有些过拟合,多拟合到了两个点,不知道为什么。
调用scipy的高斯函数库计算后完美的检测到了异常数据