La estadística descriptiva constituye una de las herramientas más fundamentales del análisis de datos, ya que permite organizar, resumir y describir las características esenciales de un conjunto de observaciones. Esta rama de la estadística es clave para el análisis preliminar de información y para la comunicación clara de resultados en contextos académicos, clínicos, sociales y organizacionales. Su utilidad se apoya en cuatro tipos principales de medidas: tendencia central, dispersión, posición y distribución, cada una con funciones y aplicaciones específicas que permiten una comprensión detallada de los datos.

Medidas de tendencia central

Las medidas de tendencia central tienen como objetivo identificar el valor representativo o promedio de un conjunto de datos. Las tres más comunes son la media, la mediana y la moda. La media aritmética se obtiene al sumar todos los valores del conjunto y dividir el total entre el número de observaciones. Esta medida es útil en distribuciones simétricas, aunque es sensible a valores atípicos (Field, 2013). Se utiliza, por ejemplo, para evaluar síntomas depresivos o la eficacia de intervenciones terapéuticas.

La mediana, por su parte, divide los datos ordenados en dos partes iguales. Es más robusta frente a valores extremos, por lo que se recomienda en distribuciones asimétricas. Tiene aplicaciones frecuentes en la medición de ingresos o la duración de procesos clínicos, como las sesiones de psicoterapia (Gravetter & Wallnau, 2014). La moda, en cambio, representa el valor que aparece con mayor frecuencia y es particularmente útil en variables categóricas o discretas, donde se quiere identificar la opción más común, como en diagnósticos prevalentes o preferencias de tratamiento.

Medidas de dispersión

Las medidas de dispersión indican el grado de variabilidad o dispersión que presentan los datos respecto a una medida de tendencia central. El rango es la diferencia entre el valor máximo y mínimo; es simple de calcular pero extremadamente sensible a los valores atípicos. La varianza mide la media de las diferencias al cuadrado entre cada valor y la media del conjunto. Aunque su interpretación directa puede no ser intuitiva, resulta clave para cálculos posteriores y es sensible a los valores extremos (Moore, McCabe & Craig, 2017).

La desviación estándar, definida como la raíz cuadrada de la varianza, es una medida más interpretable y comparativa, ideal para analizar datos cuantitativos en distintos contextos, como la autoestima en adolescentes. Mientras que la varianza y la desviación estándar se utilizan con frecuencia en distribuciones normales, para datos asimétricos o con presencia de outliers pueden preferirse otras medidas más robustas como el rango intercuartílico (aunque no se aborde en esta presentación).

Medidas de posición

Las medidas de posición dividen los datos en partes iguales y permiten ubicar valores individuales dentro de un conjunto, facilitando comparaciones relativas. Estas incluyen los percentiles, deciles y cuartiles. Los percentiles dividen los datos en cien partes iguales, siendo ampliamente usados en educación y salud para interpretar puntajes en pruebas de inteligencia o rendimiento (Kline, 2013). Los deciles, por su parte, dividen los datos en diez partes, y son útiles para evaluar niveles de estrés u otros indicadores en poblaciones clínicas. Finalmente, los cuartiles dividen los datos en cuatro partes iguales y se utilizan, por ejemplo, para analizar niveles de satisfacción laboral.

Estas medidas complementan a las medidas de tendencia central, ya que permiten observar no solo cuál es el promedio de un conjunto de datos, sino también cómo se distribuyen y posicionan los casos dentro del mismo.

Medidas de distribución

Las medidas de distribución analizan la forma general que adoptan los datos, describiendo aspectos como la simetría y el grado de concentración en torno a la media. Dos conceptos clave en este grupo son la asimetría y la curtosis. La asimetría indica si los datos están sesgados hacia la izquierda o la derecha: una asimetría positiva implica una cola extendida hacia la derecha (concentración de datos a la izquierda), mientras que una asimetría negativa indica lo contrario (concentración a la derecha). Una asimetría cercana a cero sugiere una distribución simétrica.

La curtosis, por su parte, mide la "agudeza" de la distribución. Una distribución leptocúrtica posee picos altos y colas largas, lo que indica una mayor concentración de datos cerca de la media, junto con valores extremos significativos. Una distribución platicúrtica es más plana, con datos menos concentrados, y una mesocúrtica tiene una forma intermedia que corresponde a la distribución normal (De Veaux, Velleman & Bock, 2018). Estas medidas son fundamentales para evaluar la adecuación de los datos a ciertos modelos estadísticos y para elegir pruebas estadísticas apropiadas.

Referencias

De Veaux, R. D., Velleman, P. F., & Bock, D. E. (2018). Intro Stats (5th ed.). Pearson.

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics (4th ed.). Sage Publications.

Gravetter, F. J., & Wallnau, L. B. (2014). Statistics for the Behavioral Sciences (9th ed.). Cengage Learning.

Kline, T. J. B. (2013). Psychological Testing: A Practical Approach to Design and Evaluation. SAGE Publications.

Moore, D. S., McCabe, G. P., & Craig, B. A. (2017). Introduction to the Practice of Statistics (9th ed.). W.H. Freeman and Company.