TEMA 12: CONCORDANCIA Y CORRELACIÓN
Relaciones entre variables y regresión
El término regresión fue introducido por Galton refiriéndose a la "ley de la regresión universal". Hoy en día el sentido de regresión es el de predicción de una medida basándonos en el conocimiento de otra.
Estudio conjunto de 2 variables
Para dos variables cuantitativas. Dichas observaciones pueden ser representadas en un diagrama de dispersión. En ellos, cada individuo es un punto cuya coordenada son los valores de las variables.
Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables,de qué tipo,y si es posible predecir el valor de una de ellas en función de la otra.
Diagrama de dispersión o nube de puntos
Tenemos las aluras y los pesos de 3o individuos representados en un diagrama de dispersión.
Relación directa e inversa
Regresión lineal simple: correlación y determinación
• Se trata de estudiar la asociación lineal entre dos variables cuantitativas
• Ejemplo: influencia de la edad en las cifras de Tensión arterial Sistólica
• Regresión lineal simple: una sóla variable independiente
• Regresión lineal múltiple: más de una variable independiente
• Ecuación de la recta: y = ax + b (ej: TAS=a· edad +b)
• Pendiente de la recta a = β1
• Punto de intersección con el eje de coordenadas b=β0
• Pendiente de la recta a = β1
• Punto de intersección con el eje de coordenadas b=β0
• Β1 expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio de la variable independiente
• Β0 expresa cuál es el valor de la variable dependiente cuando la independiente vale cero
• Modelos lineales deterministas: la variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente sólo habría un valor de la dependiente
• Modelos lineales probabilísticos: Para cada valor de la variable independiente existe una distribución de probabilidad de valores de la dependiente, con una probabilidad entre 0 y 1.
• La recta a determinar es aquélla con la menor distancia de cada punto a ella.
Coeficientes de correlación
El término regresión fue introducido por Galton refiriéndose a la "ley de la regresión universal". Hoy en día el sentido de regresión es el de predicción de una medida basándonos en el conocimiento de otra.
Estudio conjunto de 2 variables
Para dos variables cuantitativas. Dichas observaciones pueden ser representadas en un diagrama de dispersión. En ellos, cada individuo es un punto cuya coordenada son los valores de las variables.
Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables,de qué tipo,y si es posible predecir el valor de una de ellas en función de la otra.
Diagrama de dispersión o nube de puntos
Tenemos las aluras y los pesos de 3o individuos representados en un diagrama de dispersión.
Relación directa e inversa
- Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares=Incorrelación
- Para valores de X mayores que la media corresponden valores de Y mayores también.
- Para valores de X menores que la media corresponden valores de Y menores también
- Esto se llama relación directa.
- Para valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente.
Regresión lineal simple: correlación y determinación
• Se trata de estudiar la asociación lineal entre dos variables cuantitativas
• Ejemplo: influencia de la edad en las cifras de Tensión arterial Sistólica
• Regresión lineal simple: una sóla variable independiente
• Regresión lineal múltiple: más de una variable independiente
• Ecuación de la recta: y = ax + b (ej: TAS=a· edad +b)
• Pendiente de la recta a = β1
• Punto de intersección con el eje de coordenadas b=β0
• Pendiente de la recta a = β1
• Punto de intersección con el eje de coordenadas b=β0
• Β1 expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio de la variable independiente
• Β0 expresa cuál es el valor de la variable dependiente cuando la independiente vale cero
• Modelos lineales deterministas: la variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente sólo habría un valor de la dependiente
• Modelos lineales probabilísticos: Para cada valor de la variable independiente existe una distribución de probabilidad de valores de la dependiente, con una probabilidad entre 0 y 1.
• La recta a determinar es aquélla con la menor distancia de cada punto a ella.
Coeficientes de correlación
- Coeficiente de correlación de Pearson: Paramétricas,por lo que requiere que la distribución siga la normalidad
- Coeficiente de correlación de Sperman: No paramétricas,no sigue la normalidad
Coeficiente de Correlación r de Pearson (r), (Rxy): Es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables (x,y), cuyos valores van desde –1, correspondiente a una correlación negativa perfecta, hasta 1, correspondiente a una correlación positiva perfecta.
- Kolmogorov(n>50)
- Shapiro(n<50)
- si p<0,05 no sigue normalidad
- si p>0,05 sigue normalidad
Regresión lineal simple: correlación y determinación
• Y = β1 · x + β0
• Yi= β1 · x + β0 + ei
• Y sería la media de la variable dependiente en un grupo con el mismo valor de la variable independiente Yi= y + ei
• Para construir un modelo de regresión lineal hace falta conocer: Punto de intersección con el eje de coordenadas=β0 y la Pendiente de la recta a = β1
• No hay un modelo determinista: hay una nube de puntos y buscamos la recta que mejor explica el comportamiento de la variable dependiente en función de la variable independiente
• Coeficiente de correlación (Pearson y Spearman): Número adimensional (entre -1 y 1) que mide la fuerza y el sentido de la relación lineal entre dos variables.
• r= β1 • sx /sy
• Coeficiente de determinación: número adimensional (entre 0 y 1) que dá idea de la relación entre las variables relacionadas linealmente. Es r2
Comentarios
Publicar un comentario