Error cuadratico medio
Las estadísticas tienen que ver con la organización y el análisis de datos numéricos que, por lo general, están relacionados con alguna investigación o encuesta estadística. Las estadísticas pueden definirse como un análisis matemático que utiliza modelos cuantificados y representaciones, así como resúmenes sobre un conjunto dado de datos u observaciones de alguna situación del mundo real.
El proceso de recopilación y observación de datos y su posterior resumen y análisis mediante fórmulas numéricas y cálculos se conoce como análisis estadístico. Para un análisis estadístico adecuado, un analista primero necesita una población de la cual se elige una muestra o un conjunto de muestras para comenzar con la investigación. Si nuestro conjunto de datos pertenece a una muestra de una población más grande, entonces el analista puede ampliar las inferencias sobre la población sobre la base de los resultados estadísticos.
Pocas medidas estadísticas más útiles son media, varianza, mediana, análisis de regresión, curtosis, análisis de varianza, asimetría, etc. La media, la mediana y el modo son las medidas de tendencia central que son la medida de la posición central de la distribución dada. Estas medidas generalmente están asociadas con algún tipo de error. Este error puede ocurrir durante la recopilación de datos o la recopilación de la muestra o al hacer los cálculos sobre los datos dados. Una forma de cuantificar este error se conoce como método de error cuadrado medio. En esta página, discutiremos el error cuadrático medio y el concepto relacionado con él en detalle.
Definición
En estadística, el concepto de error cuadrático medio es un criterio importante que se utiliza para medir el rendimiento de un estimador. El error cuadrático medio, abreviado como MSE, es bastante importante para transmitir los conceptos de precisión, sesgo y precisión durante la estimación estadística.
La medida del error cuadrático medio requiere un objetivo de predicción o estimación junto con un predictor o estimador que se dice que es la función de los datos dados. MSE se define como el promedio de cuadrados de los “errores”.
Aquí, se dice que el error es la diferencia entre el atributo que se debe estimar y el estimador. El error cuadrático medio se puede llamar una función de riesgo que corresponde al valor esperado de la pérdida de error al cuadrado. Esta diferencia o pérdida podría desarrollarse debido a la aleatoriedad o debido a que el estimador no representa la información que podría proporcionar una estimación más precisa.
El error cuadrático medio puede referirse al segundo momento del error medido sobre el origen. Incorpora tanto la varianza como el sesgo del estimador. Si un estimador es un estimador insesgado, entonces su error cuadrático medio es igual a la varianza del estimador. La unidad de MSE es la misma que la unidad de medida para la cantidad que se está estimando.
Fórmula
Supongamos que Xi ^ sea el vector que denota valores de n predicciones. Además, Xi sea un vector que represente n número de valores verdaderos
Luego, la fórmula para el error cuadrático medio se da a continuación:
MSE = 1n Σni = 1 (Xi ^ -Xi) 2
En un lenguaje más general, si θ es un parámetro desconocido y θ ^ el estimador correspondiente, entonces la fórmula para el error cuadrático medio del estimador dado es:
MSE (θ ^) = E [(θ ^ -θ) 2]
Cabe señalar que técnicamente MSE no es una variable aleatoria, porque es una expectativa. Está sujeto al error de estimación para determinado estimador de θ con respecto al valor verdadero desconocido. Por lo tanto, la estimación del error cuadrático medio de un parámetro estimado es en realidad una variable aleatoria.