Significado de los intervalos de confianza

Es una estimación de un rango utilizado en las estadísticas, que contiene un parámetro de población. Este parámetro de población desconocido se encuentra a través de un modelo de muestra calculado a partir de los datos recogidos.

Ejemplo: el promedio de una muestra recolectada x̅ puede o no coincidir con el promedio real de la población μ Para ello, es posible considerar un rango de promedios de la muestra donde se puede contener este promedio de la población. Cuanto mayor sea este rango, mayor será la probabilidad de que esto ocurra.

El intervalo de confianza se expresa en porcentaje, denominado por nivel de confianza, siendo el 90%, 95% y 99% el más indicado. En la siguiente imagen, por ejemplo, tenemos un intervalo de confianza del 90% entre sus límites superior e inferior (a y -a).

Ejemplo de intervalo de confianza del 90% entre sus límites superior (a) e inferior (-a).

El Intervalo de Confianza es uno de los conceptos más importantes dentro de las pruebas de hipótesis en estadística, ya que se utiliza como medida de incertidumbre. El término fue introducido por el matemático y estadístico polaco Jerzy Neyman en 1937.

¿Cuál es la relevancia de un intervalo de confianza?

El intervalo de confianza es importante para indicar el margen de incertidumbre (o inexactitud) antes de realizar un cálculo. Este cálculo utiliza la muestra del estudio para estimar el tamaño real del resultado en la población fuente.

El cálculo de un intervalo de confianza es una estrategia que considera el muestreo de errores. El tamaño del resultado de su estudio y su intervalo de confianza caracterizan los valores asumidos para la población original.

Cuanto más estrecho sea el intervalo de confianza, mayor será la probabilidad de que el porcentaje de la población del estudio represente el número real de la población fuente, lo que dará mayor certeza sobre el resultado del objeto de estudio.

¿Cómo interpretar un intervalo de confianza?

La interpretación correcta del intervalo de confianza es probablemente el aspecto más desafiante de este concepto estadístico. Un ejemplo de la interpretación más común del concepto es el siguiente:

Existe un 95% de probabilidad de que, en el futuro, el valor real del parámetro de población (por ejemplo, la media) caiga en el rango X (límite inferior) e Y (límite superior).

Por lo tanto, el intervalo de confianza se interpreta de la siguiente manera: es 95% seguro de que el intervalo entre X (límite inferior) e Y (límite superior) contiene el valor verdadero del parámetro de población.

Sería totalmente incorrecto afirmar que: existe un 95% de probabilidad de que el intervalo entre X (límite inferior) e Y (límite superior) contenga el valor real del parámetro población.

La afirmación anterior es el concepto erróneo más común sobre el intervalo de confianza. Una vez calculado el intervalo estadístico, éste puede contener o no sólo el parámetro población.

Sin embargo, los intervalos pueden variar entre muestras, mientras que el parámetro de población real es el mismo independientemente de la muestra.

Por lo tanto, la declaración de probabilidad para el intervalo de confianza sólo puede hacerse en el caso de que los intervalos de confianza se vuelvan a calcular para el número de muestras.

Los pasos para calcular el intervalo de confianza

El intervalo se calcula siguiendo los siguientes pasos:

  • Recopilar los datos de la muestra: n;
  • Calcular la muestra promedio x̅;
  • Determinar si una desviación estándar de la población (σ) es conocida o desconocida;
  • Si se conoce una desviación estándar de la población, puede utilizar un punto z para el nivel de confianza correspondiente;
  • Si se desconoce una desviación estándar de la población, podemos usar una estadística t para el nivel de confianza correspondiente;
  • Por lo tanto, los límites inferior y superior del intervalo de confianza se encuentran utilizando las siguientes fórmulas:

(a) Desviación estándar de una población conocida:

Fórmula para calcular la desviación estándar de una población conocida.

b) desviación típica de una población desconocida:

Fórmula para calcular la desviación estándar de una población desconocida.

Ejemplo práctico de un intervalo de confianza

Un estudio clínico evaluó la asociación entre la presencia de asma y el riesgo de desarrollar apnea obstructiva del sueño en adultos.

Algunos adultos fueron reclutados al azar, dentro de una lista de funcionarios del Estado, para ser acompañados durante cuatro años.

Los participantes con asma, en comparación con los que no lo tenían, tuvieron un mayor riesgo de desarrollar apnea en cuatro años.

Cuando se lleva a cabo una investigación clínica como la de este ejemplo, se suele reclutar un subgrupo de la población de interés para aumentar la eficiencia del estudio (menos costes y menos tiempo).

Este subgrupo de individuos, la población estudiada, consiste en aquellos que cumplen con los criterios de inclusión y están de acuerdo en participar en el estudio.

Luego se completa el estudio y se calcula el tamaño del efecto (por ejemplo, la diferencia de medias o el riesgo relativo) para responder a la pregunta de la encuesta.

Este proceso, llamado inferencia, implica el uso de datos recolectados de la población del estudio para estimar el tamaño del efecto real sobre la población de interés, es decir, la población fuente.

En el ejemplo dado, los investigadores reclutaron una muestra aleatoria de empleados estatales (población fuente) que eran elegibles y estuvieron de acuerdo en participar en el estudio (población del estudio) e informaron que el asma aumenta el riesgo de desarrollar apnea en la población del estudio.

Para tener en cuenta un error de muestreo debido al reclutamiento de sólo un subgrupo de la población de interés, también calcularon un intervalo de confianza del 95% (alrededor de la estimación) de 1,06 a 1,82, lo que indica una probabilidad del 95% de que el verdadero riesgo relativo en la población de origen esté entre 1,06 y 1,82.

Intervalo de confianza para el promedio

Cuando se dispone de información sobre la desviación estándar de una población, se puede calcular un intervalo de confianza para la media o la media de esa población.

Cuando una característica estadística que se mide (como los ingresos, el coeficiente intelectual, el precio, la altura, la cantidad o el peso) es numérica, en la mayoría de los casos se estima el valor medio de la población.

Así, buscamos encontrar la media de población (μ) utilizando una media de muestra (x̅), con un margen de error. El resultado de este cálculo se denomina intervalo de confianza para la media de la población.

Cuando se conoce la desviación estándar de la población, la fórmula para un intervalo de confianza (IC) para una media de población es:

Dónde:

  • x̅ es la muestra promedio;
  • σ es la desviación estándar de la población;
  • n es el tamaño de la muestra;
  • Ζ* representa el valor apropiado de la distribución normal estándar para su nivel de confianza deseado.

A continuación se presentan los valores de los distintos niveles de confianza (Ζ*):

Nivel de confianzaValor de Z*-80%1.2890%1.645 (convencional)95%1.9698%2.3399%2.58

La tabla anterior muestra valores z* para los niveles de confianza proporcionados. Tenga en cuenta que estos valores se toman de la distribución normal estándar (Z-).

El área entre cada valor z* y el negativo de ese valor es el porcentaje de confianza (aproximado). Por ejemplo, el área entre z * = 1.28 y z = -1.28 es aproximadamente 0.80. Por lo tanto, esta tabla también puede ampliarse a otros porcentajes de confianza. La tabla muestra sólo los porcentajes de confianza más utilizados.

Deja un comentario