Saturday 13 June 2020

Cómo rechazar valores atípicos en los datos

Cómo rechazar valores atípicos en los datos

Los Outliers son puntos de datos que están fuera del rango normal de datos. Son números mucho más altos o mucho más bajos que el resto de sus datos. Con el fin de sacar conclusiones significativas de los datos experimentales, usted debe examinar sus datos en busca de valores atípicos y decidir si desea eliminarlos o no.

Rechaza el valor atípico. Elimine este número de sus datos. De ahora en adelante, haga sus cálculos sin este número.

Determine si tiene un valor atípico más allá de su límite inferior. El proceso es similar a encontrar valores atípicos más allá del límite superior, pero la fórmula es un poco diferente.

Determine si tiene un valor atípico más allá de su límite superior. Los valores atípicos son cualquier número que sea mayor que Q3 1.5(IQR) o menor que Q1-1.5(IQR). Comience con su límite superior.

Encuentra e! l primer cuartil, o Q1. Para encontrar Q1, determine el número medio en la primera mitad de sus datos. La mediana es el número que cae en el medio de los datos.

Defiende tu decisión. Rechazar los valores atípicos hace que sus datos sean «impuros». Sólo debe rechazar puntos de datos si tiene un motivo muy bueno. Si necesita escribir un informe de sus datos, esté preparado para explicar por qué rechazó los valores atípicos utilizando las fórmulas Q3 1.5(IQR) y Q1-1.5(IQR).

Decida si desea eliminar o no sus valores atípicos. Basa tu decisión en si incluir el número en tu conjunto de datos te da información útil o no.

Determine la causa de sus valores atípicos. Si el error humano causó un número muy alto o muy bajo (como lo hizo en el ejemplo del girasol), este punto de datos no es muy útil para usted. Pregúntese si este número es realmente una parte del conjunto de datos que desea estudiar.

Encuentra el tercer cuartil, o Q3. Para ! encontrar Q3, determine el número medio en la segunda mitad d! e sus datos.

Réstale Q1 a Q3. Este número es el rango intercuartil (IQR).

Haz algunos cálculos rápidos. Esto le ayudará a determinar si los valores atípicos están causando problemas con sus datos.

Encuentre el punto medio de sus datos. Para el ejemplo del girasol, el punto medio está entre 33 y 34.

Escriba sus datos en orden. Esto le ayudará a encontrar la mediana o el punto medio más tarde.

Observe sus datos. Busque números que sean mucho más altos o mucho más bajos que la mayoría de sus puntos de datos.

No comments:

Post a Comment