Estimación
En inferencia estadística se llama estimación al
conjunto de técnicas que permiten dar un valor aproximado de un parametro de una población a partir de los datos
proporcionados por una muestra. Por
ejemplo, una estimación de la media de
una determinada característica de una población de tamaño N podría ser la media de esa
misma característica para una muestra de tamaño n.1
La estimación se divide en tres grandes bloques, cada uno
de los cuales tiene distintos métodos que se usan en función de las
características y propósitos del estudio:
Estimación puntual
Consiste
en la estimación del valor del parámetro mediante
un sólo valor, obtenido de una fórmula determinada.
Por
ejemplo, si se pretende estimar la talla media de un determinado grupo de
individuos, puede extraerse una muestra y ofrecer como estimación puntual la
talla media de los individuos. Lo más importante de un estimador, es que sea un
estimador eficiente. Es
decir, que sea insesgado (ausencia de sesgos) y estable en el muestreo o
eficiente (varianza mínima) Estimación puntual Sea X una variable poblacional
con distribución Fθ , siendo θ desconocido.
Estimación por intervalos
Consiste
en la obtención de un intervalo dentro del cual estará el valor del parámetro
estimado con una cierta probabilidad. En la estimación por intervalos se usan
los siguientes conceptos:
Intervalo de confianza:
El intervalo
de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro a estimar. Este
intervalo contiene al parámetro estimado con un determinado nivel de confianza.
Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un
axioma o un equivalente circunstancial.
Variabilidad del parámetro:
Si no
se conoce, puede obtenerse una aproximación en los datos aportados por la
literatura científica o en un estudio piloto. También hay métodos para calcular
el tamaño de la muestra que prescinde de este aspecto. Habitualmente se usa
como medida de esta variabilidad la desviación típica poblacional y se denota σ.
Error de la estimación:
Es una
medida de su precisión que se corresponde con la amplitud del intervalo
de confianza. Cuanta más precisión se desee en la estimación
de un parámetro, más estrecho deberá ser el intervalo de confianza y, si se
quiere mantener o disminuir el error, más ocurrencias deberán incluirse en la
muestra estudiada. En caso de no incluir nuevas observaciones para la muestra,
más error se comete al aumentar la precisión. Se suele llamar E, según la fórmula E = (θ2 - θ1)/2.
Limite de confianza:
Es la
probabilidad de que el verdadero valor del parámetro estimado en la población
se sitúe en el intervalo de confianza obtenido. El nivel de confianza se denota
por (1-α), aunque habitualmente suele expresarse con un porcentaje
((1-α)·100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se
corresponden con valores α de 0,05 y 0,01 respectivamente.
Valor (a):
También
llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar
en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel
de confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza
del 95%, el valor α es (100-95)/100 = 0,05
Valor critico:
Se
representa por Zα/2. Es el valor de la abscisa en una determinada
distribución que deja a su derecha un área igual a α/2, siendo 1-α el nivel de
confianza. Normalmente los valores críticos están tabulados o pueden calcularse
en función de la distribución de la población. Por ejemplo, para una distribución normal,
de media 0 y desviación típica 1, el valor crítico para α = 0,1 se calcularía
del siguiente modo: se busca en la tabla de la distribución ese valor (o el más aproximado), bajo
la columna "Área"; se observa que se corresponde con -1,28. Entonces
Zα/2 = 1,64. Si la
media o desviación típica de la distribución normal no coinciden con las de la
tabla, se puede realizar el cambio de variable t =(X-μ)/σ para su cálculo.
Con estas definiciones, si tras la extracción de una
muestra se dice que "3 es una estimación de la media con un margen de
error de 0,6 y un nivel de confianza del 99%", podemos interpretar que el
verdadero valor de la media se encuentra entre 2,7 y 3,3, con una probabilidad
del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando, respectivamente,
la mitad del error, para obtener el intervalo de confianza según las
definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error
y nivel de confianza van relacionados. Si admitimos un error mayor, esto es,
aumentamos el tamaño del intervalo de confianza, tenemos también una mayor probabilidad
de éxito en nuestra estimación, es decir, un mayor nivel de confianza.
Ejercicio :
Intervalo de confianza.
En un hospital se ha tomado la
temperatura a una muestra de 64 pacientes para estimar la temperatura media de
sus
enfermos. La media de la
muestra ha sido 37,1 ºC y se sabe que la desviación típica de toda la población
es 1,04 ºC.
a)
Obtenga un
intervalo de confianza, al 90 %, para la media poblacional.
a)
X = temperatura ; n = 64 ; X = 37,1 ; X → N(µ ;
1,04) , es decir σ = 1,04
a) Nivel de
confianza = 1 – a = 0,9 ; a = 0,1; Intervalo
de confianza I = ( X - E , x +E) , siendo E = Za/2 .
Sabemos que φ(Za/2) = 1 = a/2 = 0.1/2 = 0,95 usando
la tabla de la distribución Z → N( = 0,1) , obtenemos Zα/2 = 1,645
36,89 ; 37,31 E = 1,645 . 1,04/ 64 = 0,21385 ; I
= (37,1 – 0,21385; 37,1 + 0,21385); I =