Aprenda qué es la regresión lineal simple y cómo funciona

Un enfoque de estadísticas básicas para analizar datos cuantitativos

Cortesía de Colin Broug, fotógrafo. © 10 de junio de 2010 Stock.xchng

Los modelos de regresión lineal se utilizan para mostrar o predecir la relación entre dos variables o factores . El factor que se está prediciendo (el factor por el cual la ecuación resuelve ) se llama variable dependiente. Los factores que se utilizan para predecir el valor de la variable dependiente se llaman variables independientes.

Los buenos datos no siempre cuentan la historia completa. El análisis de regresión se usa comúnmente en investigación ya que establece que existe una correlación entre las variables.

Pero la correlación no es lo mismo que la causalidad . Incluso una línea en una regresión lineal simple que se ajusta bien a los datos puede no decir algo definitivo sobre una relación de causa y efecto.

En la regresión lineal simple, cada observación consta de dos valores. Un valor es para la variable dependiente y un valor para la variable independiente.

Modelo simple de regresión lineal

El modelo de regresión lineal simple se representa así: y = ( β 0 + β 1 + Ε

Por convención matemática, los dos factores que están involucrados en un análisis de regresión lineal simple se designan x e y .

La ecuación que describe cómo y está relacionada con x se conoce como el modelo de regresión . El modelo de regresión lineal también contiene un término de error que se representa con Ε , o la letra griega épsilon. El término de error se usa para explicar la variabilidad en y que no puede explicarse por la relación lineal entre x e y .

También hay parámetros que representan la población estudiada. Estos parámetros del modelo que están representados por ( β 0+ β 1 x ).

Modelo simple de regresión lineal

La ecuación de regresión lineal simple se representa así: Ε ( y ) = ( β 0 + β 1 x ).

La ecuación de regresión lineal simple se representa gráficamente como una línea recta.

( β 0 es la intersección y de la línea de regresión.

β1 es la pendiente.

Ε ( y ) es el valor medio o esperado de y para un valor dado de x .

Una línea de regresión puede mostrar una relación lineal positiva, una relación lineal negativa o ninguna relación. Si la línea graficada en una regresión lineal simple es plana (no inclinada), no hay relación entre las dos variables. Si la línea de regresión se inclina hacia arriba con el extremo inferior de la línea en la intersección y (eje) del gráfico, y el extremo superior de la línea se extiende hacia arriba en el campo del gráfico, lejos de la intersección x (eje) existe una relación lineal positiva . Si la línea de regresión se inclina hacia abajo con el extremo superior de la línea en la intersección y (eje) del gráfico, y el extremo inferior de la línea se extiende hacia abajo en el campo del gráfico, hacia la intersección x (eje) existe una relación lineal negativa.

Estimación de la ecuación de regresión lineal

Si se conocieran los parámetros de la población, se podría usar la ecuación de regresión lineal simple (que se muestra a continuación) para calcular el valor medio de y para un valor conocido de x .

Ε ( y ) = ( β 0 + β 1 x ).

Sin embargo, en la práctica, los valores de los parámetros no se conocen, por lo que deben estimarse utilizando datos de una muestra de la población. Los parámetros de población se estiman mediante el uso de estadísticas de muestra . Las estadísticas de muestra están representadas por b 0 + b 1. Cuando las estadísticas de muestra se sustituyen por los parámetros de población, se forma la ecuación de regresión estimada.

La ecuación de regresión estimada se muestra a continuación.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) se pronuncia y hat .

El gráfico de la ecuación de regresión simple estimada se denomina línea de regresión estimada.

El b 0 es la intersección y.

El b 1 es la pendiente.

El ŷ ) es el valor estimado de y para un valor dado de x .

Nota importante: El análisis de regresión no se usa para interpretar las relaciones de causa y efecto entre las variables. Sin embargo, el análisis de regresión puede indicar cómo se relacionan las variables o en qué medida las variables se asocian entre sí.

Al hacerlo, el análisis de regresión tiende a establecer relaciones destacadas que justifican que un investigador con conocimiento lo mire más de cerca .

También conocido como: regresión bivariada, análisis de regresión

Ejemplos: El método de mínimos cuadrados es un procedimiento estadístico para usar datos de muestra para hallar el valor de la ecuación de regresión estimada. El método de mínimos cuadrados fue propuesto por Carl Friedrich Gauss, quien nació en el año 1777 y murió en 1855. El método de los mínimos cuadrados todavía se usa ampliamente.

Fuentes:

Anderson, DR, Sweeney, DJ y Williams, TA (2003). Fundamentos de las estadísticas para los negocios y la economía (3ª ed.) Mason, Ohio: Southwestern, Thompson Learning.

______. (2010). Explicado: análisis de regresión. MIT Noticias.

McIntyre, L. (1994). Uso de datos de cigarrillos para una introducción a la regresión múltiple. Revista de Educación Estadística, 2 (1).

Mendenhall, W. y Sincich, T. (1992). Estadísticas para Engineering and the Sciences (3ª ed.), Nueva York, NY: Dellen Publishing Co.

Panchenko, D. 18.443 Estadísticas para aplicaciones, otoño de 2006, sección 14, Regresión lineal simple. (Instituto Tecnológico de Massachusetts: MIT OpenCourseWare)