
Que sea insesgado o que esté lo más cerca del verdadero o real valor del parámetro desconocido. Formalmente será insesgado si el valor esperado del estimador (media de la distribución de probabilidades del \hat{\theta }, o la media de la distribución muestral del \hat{\theta }) es igual al parámetro estimado:
Entonces, en términos del estimador insesgado:
Lo anterior conduce a plantear que entonces, la distribución muestral del estimador debe estar centrada en el parámetro a estimar. Por ejemplo, en la distribución muestral de la media, se tiene que:
Por eso decimos entonces que la media muestral es un estimador insesgado de la media poblacional. De igual forma, se puede demostrar que:
En cambio, la desviación estándar muestral s es un estimador sesgado de la desviación estándar poblacional σ, sesgo que en el caso de muestras grandes es despreciable o insignificante.
Como no hay un estimador insesgado único, la propiedad anterior sola no es suficiente, sobre todo si se trabaja con distribuciones normales. ¿Cuál estimador seleccionar?
El que sea eficiente, o sea que tenga la varianza mínima, o sea aquel que tenga una distribución muestral con menor varianza. Así:
Propiedades de un buen estimador
(Para ampliar la imagen haga clic sobre ella)
En resumen, entre todos los estimadores insesgados de \hat{\theta }, aquel de menor varianza es el mejor. (EIMV = Estimación insesgada de mínima varianza) por ser el que ofrece las mayores posibilidades de dar una estimación \hat{\theta } próxima o cercana al valor verdadero o real de \theta.
Sí {{x}_{1}},~\text{ }\!\!~\!\!\text{ }{{x}_{2}},~\text{ }\!\!~\!\!\text{ }{{x}_{3}}\ldots .~\text{ }\!\!~\!\!\text{ }{{x}_{n~}} es muestra aleatoria de tamaño n de una distribución normal con media \mu y varianza {{\sigma }^{2}}, entonces \bar{x} será EIMV de \mu.
La precisión de una estimación puntual se determina generalmente con el error estándar del estimador usado (o sea la desviación estándar del estimador) cuando el estimador sigue una distribución normal puede tenerse una seguridad razonable de que real valor del parámetro está entre dos errores estándar de la estimación.
Hay ocasiones en que no se puede usar o lograr la falta de sesgo y la mínima varianza en un mismo estimador. Por lo tanto, es necesario usar un estimador sesgado, es importante entonces considerar el error cuadrático medio (E.C.M) definido como: el cuadrado esperado de la diferencia entre el estimador y el parámetro (valor esperado de diferencia al cuadrado entre \hat{\theta } y \theta.
Se puede demostrar que:
De acuerdo a lo anterior, el E.C.M puede describirse así:
Que sí \hat{\theta } es insesgado:
Se deberá entonces seleccionar al estimador sesgado con menor E.C.M (también aplicable para insesgados).
Un estimador \hat{\theta } que tiene un E.C.M menor o igual que el E.C.M de cualquier otro estimador, se llama estimador óptimo.
En algunas ocasiones se acude al concepto de eficiencia relativa al comparar dos estimadores \hat{\theta }, y {{\hat{\theta }}_{2}} y ver cuál es más adecuado. Entonces:
Sean los estimadores {{\hat{\theta }}_{1}},~{{\hat{\theta }}_{2}},~{{\hat{\theta }}_{3}} estimadores de \hat{\theta }.  Si se sabe que:
¿Cuál estimador se debe seleccionar?
Es de esperar que un buen estimador de un parámetro \theta ~ sea mejor conforme crezca el tamaño de la muestra base de su cuantificación. O sea, cuanto mayor sea el tamaño de la muestra que aporta al estimador, tanto más cercano será su valor al del parámetro pues su distribución muestral será más concentrada alrededor del \theta ~. Por ello, \bar{x} y {{s}^{2}} serán más consistente como estimadores.
Que sea suficiente. Es el estimador que para su definición numérica utiliza toda la información muestral con respecto a \theta ~.
Sea ({{x}_{1}},~\text{ }\!\!~\!\!\text{ }{{x}_{2}},~\text{ }\!\!~\!\!\text{ }{{x}_{3}},~\text{ }\!\!~\!\!\text{ }{{x}_{4}}) muestra de una población de densidad de probabilidad con media \mu y desviación estándar ~\sigma .
Sean:
Si de estos estimadores insesgados se preguntara cuál es el más eficiente, la respuesta seria ECM \left( {{{\hat{\theta }}}_{4}} \right) ya que es el menor valor y por ello será más eficiente.