在 Matlab 中,异常值是指数据集中明显偏离其他数据点的数据。常见的识别*有基于统计的*,如 3σ 原则(正态分布数据)和箱线图法。
3σ 原则:对于正态分布的数据,数据点落在区间内的概率约为 99.7%。其中是均值,是标准差。在 Matlab 中,可以通过以下步骤来识别异常值:
计算数据的均值和标准差。假设数据存储在向量x
中,可以使用mean
和std
函数,代码如下:
x = [1,2,3,4,5,100]; % 示例数据,其中100可能是异常值 mu = mean(x); sigma = std(x);