Los Outliers son puntos de datos que están fuera del rango normal de datos. Son números mucho más altos o mucho más bajos que el resto de sus datos. Con el fin de sacar conclusiones significativas de los datos experimentales, usted debe examinar sus datos en busca de valores atÃpicos y decidir si desea eliminarlos o no.
Rechaza el valor atÃpico. Elimine este número de sus datos. De ahora en adelante, haga sus cálculos sin este número.
Determine si tiene un valor atÃpico más allá de su lÃmite inferior. El proceso es similar a encontrar valores atÃpicos más allá del lÃmite superior, pero la fórmula es un poco diferente.
Determine si tiene un valor atÃpico más allá de su lÃmite superior. Los valores atÃpicos son cualquier número que sea mayor que Q3 1.5(IQR) o menor que Q1-1.5(IQR). Comience con su lÃmite superior.
Encuentra e! l primer cuartil, o Q1. Para encontrar Q1, determine el número medio en la primera mitad de sus datos. La mediana es el número que cae en el medio de los datos.
Defiende tu decisión. Rechazar los valores atÃpicos hace que sus datos sean «impuros». Sólo debe rechazar puntos de datos si tiene un motivo muy bueno. Si necesita escribir un informe de sus datos, esté preparado para explicar por qué rechazó los valores atÃpicos utilizando las fórmulas Q3 1.5(IQR) y Q1-1.5(IQR).
Decida si desea eliminar o no sus valores atÃpicos. Basa tu decisión en si incluir el número en tu conjunto de datos te da información útil o no.
Determine la causa de sus valores atÃpicos. Si el error humano causó un número muy alto o muy bajo (como lo hizo en el ejemplo del girasol), este punto de datos no es muy útil para usted. Pregúntese si este número es realmente una parte del conjunto de datos que desea estudiar.
Encuentra el tercer cuartil, o Q3. Para ! encontrar Q3, determine el número medio en la segunda mitad d! e sus datos.
Réstale Q1 a Q3. Este número es el rango intercuartil (IQR).
Haz algunos cálculos rápidos. Esto le ayudará a determinar si los valores atÃpicos están causando problemas con sus datos.
Encuentre el punto medio de sus datos. Para el ejemplo del girasol, el punto medio está entre 33 y 34.
Escriba sus datos en orden. Esto le ayudará a encontrar la mediana o el punto medio más tarde.
Observe sus datos. Busque números que sean mucho más altos o mucho más bajos que la mayorÃa de sus puntos de datos.
No comments:
Post a Comment