Introducción al Modelo de Regresión Múltiple para Victorias Deportivas
Este documento detalla la aplicación y el análisis de un modelo de regresión múltiple diseñado para predecir el número de victorias de un equipo deportivo, basándose en variables clave de rendimiento.
Establecimiento de la Ecuación de Regresión Múltiple
Para construir la fórmula de la ecuación de regresión, se utilizaron los siguientes coeficientes:
Variable | Coeficiente |
Intercepción | 22,7744 |
Puntos promedio (X1) | 1,0847 |
Porcentaje de tiro % (X2) | 3,2799 |
Porcentaje de tiro rival % (X3) | -5,1764 |
Ecuación del Modelo
La ecuación de regresión múltiple establecida es:
Y = 22,7744 + 1,0847 * Puntos Promedio (X1) + 3,2799 * Porcentaje de Tiro (X2) – 5,1764 * Porcentaje de Tiro Rival (X3)
Interpretación de los Coeficientes
- Para B1 (Puntos Promedio): Si el equipo aumenta en 1 punto promedio por partido, se espera que el número de victorias aumente en aproximadamente 1,0847, manteniendo las otras variables constantes.
- Para B2 (Porcentaje de Tiro): Si el equipo aumenta en 1 punto porcentual su porcentaje de tiros, se espera que el número de victorias aumente en aproximadamente 3,2799, manteniendo las otras variables constantes.
- Para B3 (Porcentaje de Tiro Rival): Si el equipo rival aumenta en 1 punto porcentual su porcentaje de tiros, se espera que el número de victorias disminuya en aproximadamente 5,1764, manteniendo las otras variables constantes.
Pronóstico del Número de Victorias
Se elabora un pronóstico del número de victorias para un equipo con las siguientes características:
- Porcentaje de tiros realizados: 45%
- Porcentaje de tiros del oponente: 44%
- Promedio de puntos por partido: 90
Cálculo del Pronóstico
Sustituyendo los valores en la ecuación de regresión:
Y = 22,7744 + 1,0847 * 90 + 3,2799 * 45 – 5,1764 * 44
Resultado del Pronóstico
Y = 40,23641
Se espera aproximadamente 40 victorias para este equipo.
Análisis Residual y Validez del Modelo
Los gráficos residuales muestran una distribución aleatoria de los puntos o residuos. Por lo tanto, el modelo de regresión se considera idóneo, válido y adecuado para los datos.
Significación Global del Modelo (Prueba ANOVA)
Se evalúa si existe una relación significativa entre el número de victorias y las tres variables independientes (porcentaje de tiros del equipo, del oponente y el promedio de puntos por partido), con un nivel de significancia de 0,05.
Dado que el valor F calculado es mayor que el valor crítico, se rechaza la hipótesis nula (H0). Esto indica que existe una relación significativa entre el número de victorias y al menos una de las tres variables independientes (porcentaje de tiros del equipo, del oponente y el promedio de puntos por partido).
Contribución Individual de las Variables al Modelo
Se determina, con un nivel de significancia de 0,05, si cada una de las variables independientes, incluida la intercepción, hace una contribución significativa al modelo de regresión.
Variable | Coeficiente | Valor p |
Intercepción | 22,7744 | 0,761305941 |
Puntos promedio | 1,0847 | 0,094782012 |
Porcentaje de tiro % | 3,2799 | 0,076782791 |
Porcentaje de tiro rival % | -5,1764 | 0,000431121 |
Interpretación de la Significación Individual
Al comparar los valores p con el nivel de significancia (α = 0,05):
- Los puntos promedio (valor p = 0,0948) y el porcentaje de tiro del equipo (valor p = 0,0768) tienen valores p mayores que α. Esto significa que no hacen una contribución estadísticamente significativa al modelo de regresión a este nivel de significancia.
- La intercepción (valor p = 0,7613) tampoco es significativa.
- La variable porcentaje de tiro rival % (valor p = 0,0004) tiene un valor p menor que α. Esto indica que sí hace una contribución estadísticamente significativa al modelo de regresión.
Este resultado sugiere que, para predecir victorias futuras, el factor más influyente y en el que se debería trabajar es la defensa (reflejada en el porcentaje de tiro del rival), ya que las otras variables no muestran una incidencia significativa en este modelo.
Modelo Más Adecuado
Considerando la significancia individual, un modelo más adecuado podría centrarse en la variable significativa. Sin embargo, el texto original propone una ecuación simplificada que solo incluye la variable significativa, lo cual es una simplificación extrema y no es el modelo de regresión original. Si se busca un modelo más parsimonioso, se debería considerar la eliminación de las variables no significativas y reajustar el modelo. La ecuación original es la que se ha trabajado, y la simplificación «Y = 5,1764 * Rival(44)» es un ejemplo de cómo se usaría solo esa variable, no el modelo final.
Nota: La ecuación «Y = 5,1764 * Rival(44)» es una simplificación que solo considera la variable significativa para un cálculo específico, no el modelo de regresión completo.
Interpretación del Coeficiente de Correlación Múltiple (R)
Estadísticas de la Regresión | |
Coeficiente de correlación múltiple (R) | 0,8170 |
El coeficiente de correlación múltiple (R) es 0,8170. Este valor, al estar en el intervalo de 0,5 < R < 1, indica una correlación intensa y positiva entre el número de victorias y el conjunto de las variables independientes.
Interpretación del Coeficiente de Determinación Múltiple (R²)
La interpretación del coeficiente de determinación (R²) depende de la significancia de las variables:
- Si al menos una variable no es significativa, se interpreta el coeficiente de R² ajustado.
- Si todas las variables son significativas, se interpreta el coeficiente de determinación R² no ajustado.
Coeficiente de determinación R² | 0,6675 |
R² ajustado | 0,6277 |
Variable dependiente: Número de victorias
Dado que no todas las variables independientes son significativas, se interpreta el R² ajustado.
El 62,77% de la variabilidad en el número de victorias (variable dependiente) puede ser explicada por la variabilidad conjunta de las variables independientes (puntos promedio por partido, porcentaje de tiro del equipo y porcentaje de tiro del rival).
Estimación e Interpretación del Intervalo de Confianza (95%) para las Pendientes Poblacionales
Se determina e interpreta una estimación del intervalo de confianza del 95% para la pendiente poblacional que existe entre el número de victorias y el promedio de puntos por partido, y entre el número de victorias y el porcentaje de tiros efectuados por el equipo.
Variable | Límite Inferior 95% | Límite Superior 95% |
Puntos promedio | -0,20 | 2,37 |
Porcentaje de tiro % | -0,37 | 6,93 |
Interpretación de los Rangos Esperados
Estos intervalos de confianza representan el rango en el que se espera que se encuentren los verdaderos coeficientes de la población para estas variables.
- Para la variable «Puntos promedio»: Si se incrementa en una unidad los puntos promedio por partido, se espera que el número de victorias se encuentre en un rango de entre -0,20 y 2,37. Dado que el intervalo incluye el cero, esto refuerza la idea de que esta variable no es estadísticamente significativa en el modelo.
- Para la variable «Porcentaje de tiro %»: Si se incrementa en una unidad el porcentaje de tiros por partido, se espera que el número de victorias se encuentre en un rango de entre -0,37 y 6,93. Similarmente, al incluir el cero, esto también sugiere que esta variable no es estadísticamente significativa.