Regresion Lineal Simple

Description

Estadística para la Administración II (Unidad 2) Note on Regresion Lineal Simple, created by Guillermo Quiñones on 11/02/2014.
Guillermo Quiñones
Note by Guillermo Quiñones, updated more than 1 year ago
Guillermo Quiñones
Created by Guillermo Quiñones about 10 years ago
2013
0

Resource summary

Page 1

En la administración, las decisiones suelen basarse en la relación entre dos o más variables. Por ejemplo, observar la relación entre el gasto en publicidad y las ventas puede permitir a un gerente de mercadotecnia tratar de predecir las ventas correspondientes a un determinado gasto en publicidad. O, una empresa de servicios públicos puede emplear la relación entre la temperatura diaria y la demanda de electricidad para predecir la demanda de electricidad considerando las temperaturas diarias que se esperan el mes siguiente. Algunas veces los directivos se apoyan en la intuición para juzgar la relación entre dos variables. Sin embargo, cuando es posible tener datos, puede emplearse un procedimiento estadístico llamado análisis de regresión para obtener una ecuación que indique cuál es la relación entre las variables. En la terminología que se emplea en regresión, a la variable que se va a predecir se le llama variable dependiente. A la variable o variables que se usan para predecir el valor de la variable dependiente se les llama variables independientes. Por ejemplo, al analizar el efecto de los gastos en publicidad sobre las ventas, como lo que busca el gerente de mercadotecnia es predecir las ventas, esto indica que las ventas serán la variable dependiente. En este capítulo se estudia el tipo más sencillo de análisis de regresión en el que interviene una variable independiente y una variable dependiente y en el que la relación entre estas variables es aproximada mediante una línea recta. A este tipo de análisis de regresión se le conoce como regresión lineal simple. Al análisis de regresión en el que intervienen dos o más variables independientes se le llama análisis de regresión múltipleModelo de regresión lineal simple Armand’s Pizza Parlors es una cadena de restaurantes de comida italiana. Sus mejores ubicaciones son las que se encuentran cerca de los campus de las universidades. Los gerentes creen que las ventas trimestrales de estos restaurantes (que se denotan por y) están directamente relacionadas con el tamaño de la población estudiantil (que se denota x); es decir, en los restaurantes que están cerca de campus que tienen una población estudiantil grande se generan más ventas que en los restaurantes situados cerca de campus con una población estudiantil pequeña. Empleando el análisis de regresión, se puede obtener una ecuación que muestre cuál es la relación entre la variable dependiente y y la variable dependiente x.Modelo de regresión y ecuación de regresiónA la ecuación con que se describe cómo se relaciona y con x y en la que se da un término para el error, se le llama modelo de regresión. El siguiente es el modelo que se emplea en la regresión lineal simple.

B0 y B1 se conocen como los parámetros del modelo, y E (la letra griega épsilón) es una variable aleatoria que se conoce como término del error. El término del error da cuenta de la variabilidad de y que no puede ser explicada por la relación lineal entre x y y.La población de los restaurantes Armand’s puede verse también como una colección de subpoblaciones, una para cada uno de los valores de x. Por ejemplo, una subpoblación está formada por todos los campus universitarios de 8000 estudiantes; otra subpoblación consta de todos los restaurantes Armand’s localizados cerca de los campus universitarios de 9000 estudiantes; etc. Para cada subpoblación hay una distribución de valores y. Así, hay una distribución de valores y que corresponde a los restaurantes localizados cerca de los campus de 8000 estudiantes; hay otra distribución de valores y que corresponde a los restaurantes ubicados cerca de los campus de 9000 estudiantes, y así sucesivamente. Cada una de estas distribuciones de valores y tiene su propia media o valor esperado. A la ecuación que describe la relación entre el valor esperado de y, que se denota E(x), y x se le llama ecuación de regresión. La siguiente es la ecuación de regresión para la regresión lineal simple.

Ecuación de regresión estimada Si se conocieran los valores de los parámetros poblacionales B0 y B1, se podría emplear la ecuación anterior para calcular el valor medio de y para un valor dado de x. Sin embargo, en la práctica no se conocen los valores de estos parámetros y es necesario estimarlos usando datos muestrales. Se calculan estadísticos muestrales (que se denotan b0 y b1) como estimaciones de los parámetros poblacionales B0 y B1. Sustituyendo en la ecuación de regresión b0 y b1 por los valores de los estadísticos muestrales B0 y B1, se obtiene la ecuación de regresión estimada. La ecuación de regresión estimada de la regresión lineal simple se da a continuación.

Método de mínimos cuadrados El método de mínimos cuadrados es un método en el que se usan los datos muestrales para hallar la ecuación de regresión estimada. Para ilustrar el método de mínimos cuadrados, supóngase que se recolectan datos de una muestra de 10 restaurantes Armand’s Pizza Parlors ubicados todos cerca de campus universitarios. Para la observación i o el restaurante i de la muestra, xi es el tamaño de la población de estudiantes (en miles) en el campus y yi son las ventas trimestrales (en miles de dólares). En la tabla se presentan los valores de xi y yi en esta muestra de 10 restaurantes. Como se ve, el restaurante 1, para el que x1 = 2 y y1 = 58, está cerca de un campus de 2000 estudiantes y sus ventas trimestrales son de $58 000. El restaurante 2, para el que x2 = 6 y y2 = 105, está cerca de un campus de 6000 estudiantes y sus ventas trimestrales son de $105,000. El valor mayor es el que corresponde a ventas del restaurante 10, el cual está cerca de un campus de 26 000 estudiantes y sus ventas trimestrales son de $202 000.

La figura siguiente es el diagrama de dispersión de los datos de la tabla anterior. La población de estudiantes se indica en el eje horizontal y las ventas trimestrales en el eje vertical. Los diagramas de dispersión para el análisis de regresión se trazan colocando la variable independiente x en el eje horizontal y la variable dependiente y en el eje vertical. El diagrama de dispersión permite observar gráficamente los datos y obtener conclusiones acerca de la relación entre las variables. ¿Qué conclusión preliminar se puede obtener del diagrama? Las ventas trimestrales parecen ser mayores cerca de campus en los que la población de estudiantes es mayor. Además, en estos datos se observa que la relación entre el tamaño de la población de estudiantes y las ventas trimestrales parece poder aproximarse mediante una línea recta; en efecto, se observa que hay una relación lineal positiva entre x y y. Por tanto, para representar la relación entre ventas trimestrales y la población de estudiantes, se elige el modelo de regresión lineal simple.

Decidido esto, la tarea siguiente es usar los datos muestrales de la tabla 14.1 para determinar los valores de b0 y b1 en la ecuación de regresión lineal simple. Para el restaurante i, la ecuación de regresión simple estimada es:

Como para el restaurante i, yi denota ventas observadas (reales) y yi (con ^ encima) denota ventas estimadas mediante la ecuación anterior, para cada uno de los restaurantes de la muestra habrá un valor de ventas observadas yi y un valor de ventas estimadas yi (con ^ encima)  Para que la recta de regresión estimada proporcione un buen ajuste a los datos, las diferencias entre los valores observados y los valores estimados deben ser pequeñas. En el método de mínimos cuadrados se usan los datos maestrales para obtener los valores de b0 y b1 que minimicen la suma de los cuadrados de las desviaciones (diferencias) entre los valores observados de la variable dependiente yi y los valores estimados de la variable dependiente. El criterio que se emplea en el método de mínimos cuadrados es el de la expresión siguiente.

En la tabla se presentan los cálculos necesarios para obtener la ecuación de regresión estimada en el ejemplo de Armand’s Pizza Parlors. Como la muestra es de 10 restaurantes, tenemos 10 observaciones. 

La pendiente de la ecuación de regresión estimada (b1 = 5) es positiva, lo que implica que a medida que aumenta el tamaño de la población de estudiantes, aumentan las ventas. Se concluye (basándose en las ventas dadas en miles de $ y en el tamaño de la población de estudiantes en miles) que un aumento de 1000 en el tamaño de la población de estudiantes corresponde a un aumento esperado de $5000 en las ventas; es decir, se espera que las ventas trimestrales aumenten $5 por cada aumento de un estudiante. Si se considera que la ecuación de regresión estimada obtenida por el método de mínimos cuadrados describe adecuadamente la relación entre x y y, parecerá razonable usar esta ecuación de regresión estimada para estimar el valor de y para un valor dado de x. Por ejemplo, si se quisieran predecir las ventas trimestrales de un restaurante ubicado cerca de un campus de 16 000 estudiantes, se calcularía

De manera que las ventas trimestrales pronosticadas para este restaurante serían de $140 000.

Introduccion

Método de Mínimos Cuadrados

Método de Mínimos Cuadrados 2

Videos

Show full summary Hide full summary

Similar

Regresion linal Multiple
Guillermo Quiñones
Retro Alimentación Estructura Física y Lógica de la PC Unidad 2
Alejandro Alonso
COSTOS INDIRECTOS DE FABRICACIÓN (C.I.F)
Martha Karina Santander Guerrero
Avances más representativos en la Historia de la Ingeniería Industrial
Fernanda Melo6090
Análisis de alternativas de inversión
victor_0992
Prueba de Hipotesis
Guillermo Quiñones
Unidad 2. Dibujo Proyectivo 1. Fundamentos CAD
Mariana Cardozo
Análisis de regresión lineal y múltiple
Guillermo Quiñones
U.2 - LA PLANIFICACIÓN Y SUS ELEMENTOS
DANIEL ESTIGARRIBIA
Unidad 2: Dibujo proyectivo
El Javier