如何从数据集中删除离群值

我有一些关于年龄与年龄的多元数据。年龄范围为20至40,间隔为2(20,22,24 .... 40),对于每条数据记录,年龄和美容等级均为1-5。当我对这些数据进行箱形图绘制(X轴上的年龄,Y轴上的美容等级)时,每个框的晶须外都绘制了一些离群值。

我想从数据框本身中删除这些离群值,但不确定R如何计算其箱形图的离群值。以下是我的数据的示例


一只斗牛犬
浏览 1458回答 3
3回答

慕斯709654

boxplot函数返回用于进行绘图的值(实际上是由bxp()完成:bstats <- boxplot(count ~ spray, data = InsectSprays, col = "lightgray")&nbsp;#need to "waste" this plotbstats$out <- NULLbstats$group <- NULLbxp(bstats)&nbsp; # this will plot without any outlier points我故意不回答具体问题,因为我认为删除“异常值”是统计错误。我认为不将它们绘制在箱线图中是可以接受的做法,但是仅由于它们超出了一些标准偏差或一定数量的四分位数宽度而将其删除是对观测记录的系统性和不科学的处理。
打开App,查看更多内容
随时随地看视频慕课网APP