REGRESIÓN LINEAL, ESTIMACIÓN Y MÍNIMOS CUADRADOS
Análisis de regresión:
En términos
generales, el análisis de Regresión trata sobre El estudio de la
dependencia de un fenómeno económico Respecto de una o
varias variables explicativas, con el
Objetivo de
explorar o cuantificar la media o valor promedio Poblacional de la
primera a partir de un conjunto de valores Conocidos o fijos de la/s segunda/s.
Características:
1-Estudiar y
predecir el valor Promedio de una
variable Sobre la base de
valores Fijos de otras
variables.
2-Existe una
asimetría en el tratamiento que se
les da a las variables.
3-La variable
dependiente es aleatoria o
estocástica: su valor depende de
una distribución de probabilidades.
Regresión de la Fórmula:
La ecuación de regresión(y) = a + bx
Pendiente(b) = (NΣXY - (ΣX)(ΣY)) / (NΣX2 - (ΣX)2)
Interceptar(a) = (ΣY - b(ΣX)) / N
donde
x e y son las variables.
b =La pendiente de la recta de regresión
a =El punto de intersección de la recta de regresión y el eje Y.
N =Número de valores o elementos
X = Primera puntuación
Y =La puntuación de Segunda
ΣXY = Suma del producto de las puntuaciones primero y segundo
ΣX =La suma de las puntuaciones Primera
ΣY = Suma de las puntuaciones de segunda
ΣX2 = Suma de cuadrados Puntuación Primero
Ejemplo de regresión: Para encontrar la simple / Regresión lineal de
X Valores | Y Valores |
60 | 3.1 |
61 | 3.6 |
62 | 3.8 |
63 | 4 |
65 | 4.1 |
Para encontrar la ecuación de regresión, lo primero que se encuentra pendiente, intersección y usarla para formar la ecuación de regresión..
Paso 1:Cuente el número de valores.
N = 5
Paso 2:Buscar XY, X2
Consulte la tabla siguiente
X Valor | Y Relación | X*Y | X*X |
60 | 3.1 | 60 * 3.1 = 186 | 60 * 60 = 3600 |
61 | 3.6 | 61 * 3.6 = 219.6 | 61 * 61 = 3721 |
62 | 3.8 | 62 * 3.8 = 235.6 | 62 * 62 = 3844 |
63 | 4 | 63 * 4 = 252 | 63 * 63 = 3969 |
65 | 4.1 | 65 * 4.1 = 266.5 | 65 * 65 = 4225 |
Paso 3:Buscar ΣX, ΣY, ΣXY, ΣX2.
ΣX = 311
ΣY = 18.6
ΣXY = 1159.7
ΣX2 = 19359
Paso 4:Suplente en la fórmula de la pendiente por encima de determinado.
Slope(b) = (NΣXY - (ΣX)(ΣY)) / (NΣX2 - (ΣX)2)
= ((5)*(1159.7)-(311)*(18.6))/((5)*(19359)-(311)2)
= (5798.5 - 5784.6)/(96795 - 96721)
= 13.9/74
= 0.19
Paso 5:Ahora, de nuevo suplente en la fórmula anterior interceptar dado.
Interceptar(a) = (ΣY - b(ΣX)) / N
= (18.6 - 0.19(311))/5
= (18.6 - 59.09)/5
= -40.49/5
= -8.098
Paso 6:A continuación, sustituir estos valores en la ecuación de regresión fórmula
La ecuación de regresión(y) = a + bx
= -8.098 + 0.19x.
Supongo que si queremos saber el valor y aproximada de la variable x = 64. Entonces podemos sustituir el valor en la ecuación anterior.
La ecuación de regresión(y) = a + bx
= -8.098 + 0.19(64).
= -8.098 + 12.16
= 4.06
Este ejemplo le guía para encontrar la relación entre dos variables mediante el cálculo de la regresión de los pasos anteriores.
´´EJERCICIO PROPUESTO´´
1.
En
1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la
revista Field Crops Research, los datos usados en la investigación son:
Duración
|
92
|
92
|
96
|
100
|
98
|
100
|
99
|
102
|
102
|
106
|
Rendimiento
|
1,7
|
2,3
|
1,9
|
2,0
|
1,8
|
2,0
|
1.7
|
1,5
|
1,7
|
1,6
|
Con
x = la duración de la cosecha de porotos de soya en días, y = rendimiento de la
cosecha en toneladas por hectárea.
·
Estime
la recta de regresión mediante el método de mínimos cuadrados. Interprete los
estimadores en el contexto de la pregunta.
·
¿Existe
una relación lineal significativa entre la duración y el rendimiento de la
cosecha?
·
Verifique
los supuestos. α=10%.
·
Estime
el rendimiento si la duración de la cosecha fue de 104 días.
ELABORACIÓN DE TABLAS SEGÚN MÉTODO DE MÍNIMOS CUADRADOS SACANDO SUMATORIAS Y PROMEDIO A BASE DE LAS FORMULAS DADAS. |
EN LA GRÁFICA SE PUEDE LLEGAR A CONCLUIR QUE EXISTE UNA RELACIÓN LINEAL SIMPLE CON PENDIENTE NEGATIVA ESTO QUIERE DECIR QUE : A MEDIDA QUE LOS VALORES DE X AUMENTEN "Y" VA A TENDER A DECRECER. |
Si comparamos la gráfica del ejercicio y vemos los modelos de regresiones lineal simple llegamos a que la mas relacionada es la numero "C".
En a) hay ausencia de relación (independencia)
En b) existe asociación lineal positiva (varían en general en el mismo sentido).
En c) existe asociación lineal negativa (varían en sentido contrario).
En d) existe fuerte asociación, pero no lineal.
Ingresamos a la pagina de la calculadora easy.calculator para poder sacar los datos de la formula de regresión debemos colocar las variables independientes en la columna X y las Dependientes en al columna Y para poder obtener los resultados, cuando ya esten todos los datos en sus respectivas celdas, le damos al boton de calcular y listo.
CALULADORA ONLINE DE EL SIGUIENTE LINK http://es.easycalculation.com/statistics/regression.php QUE SE UTILIZO PARA COMPROBAR DATOS DE EL EJERCICIO. |
Si se desea saber mas al respecto recomiendo consultar el siguiente vídeo que nos mostrara como resolver ejercicios de regresión lineal con método de mínimos cuadrados.
link del video: http://www.youtube.com/watch?v=oMf98NVlYfU
Daniel Gonzalez.
Richard Lugo.
Andrea Rondon.
UGMA ESTADÍSTICA II (INTENSIVOS)
23 de agosto del 2013 Puerto Ordaz
Profesor: Ing. Ricardo Guevara
Muy buena participación, modifique los aspecto que le señale en el blog, recuerden que la idea es explicar como se utiliza la calculadora que le fue asignada.
ResponderEliminarAnexamos, el proceso de introducir los datos en la calculadora online al final. Saludos
ResponderEliminarQuita la imagen del enunciado del ejercicio que no se entiende las preguntas
ResponderEliminarListo.
ResponderEliminarya no se ven las fotos :(
ResponderEliminar