Estadística Descriptiva: Concepto y Objetivos
La Estadística Descriptiva describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Trata de describir algo, pero no de cualquier forma, sino de manera cuantitativa. Tiene como objetivo presentar la información de forma útil y comprensible.
Origen Etimológico y Relación con el Estado
La palabra «Estadística» se derivó de la palabra «Estado». Se dice que es la ciencia del estado porque en sus orígenes se utilizaba exclusivamente con fines estatales. Los gobiernos de las distintas naciones tenían la necesidad, por razones de organización, de conocer las características de su población para gestionar:
- El pago de impuestos.
- El reclutamiento de soldados.
- El reparto de tierras o bienes.
- La prestación de servicios públicos, etc.
Esta necesidad llevó a los gobernantes a establecer sistemas para recoger y procesar la información obtenida, es decir, a hacer estadísticas sobre la población.
Descripción de Datos en Estadística Descriptiva
Dentro de la Estadística Descriptiva, los datos se describen mediante:
- Medidas Numéricas:
- Tendencia Central: La media y la mediana.
- Dispersión: La desviación estándar y el rango.
- Representaciones Gráficas y Tabulares: Tablas de distribución de frecuencias, diagramas de barras e histogramas.
Población, Muestra y Muestreo
Población: Concepto y Tipos
La Población es el agregado de unidades elementales que poseen alguna característica o propiedades comunes. El estudio de toda la población constituye un Censo. Una población puede ser finita o infinita.
El Individuo
El individuo dentro de la población es cada unidad de observación o elemento particular que se estudia.
Relación entre Población y Muestra
El tamaño de la muestra es siempre menor que el de la población. Debido a que muchas veces es imposible estudiar a toda la población, se toma una muestra, es decir, una parte representativa de la población para poder obtener una conclusión final.
Muestra y Muestra Aleatoria
Una Muestra es una parte de la población. Se espera que la muestra sea representativa de la población, es decir, que reproduzca sus características más importantes. El proceso de obtener la muestra se denomina muestreo.
Muestra Aleatoria y Diferencia Clave
Una Muestra Aleatoria es aquella que ha sido obtenida empleando algún procedimiento al azar: sorteo, extracción al azar, números aleatorios, etc. En una muestra aleatoria, cada unidad elemental tiene una determinada posibilidad de pertenecer a la muestra.
La diferencia entre ambas es que la muestra puede obtenerse de cualquier manera, mientras que la muestra aleatoria tiene como requisito que la selección sea totalmente al azar.
Muestreo
El Muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población.
Variables Estadísticas: Clasificación y Tipos
Una variable hace referencia a un símbolo (X, Y, A, B,…) que puede tomar cualquier modalidad (valor) de un conjunto determinado, llamado dominio o rango.
En función del tipo de dominio, las variables se clasifican en:
A) Variables Cualitativas (Atributos)
Corresponden a atributos de la unidad estadística. Se dividen en:
- Nominal: Cada valor de la variable se asigna a una categoría diferente. Entre los valores de las categorías no existe ninguna relación de orden o numérica.
- Ordinal: Surge de ordenar todas las categorías de la variable de acuerdo con algún criterio.
B) Variables Cuantitativas (Valores Numéricos)
Son aquellas que asumen valores numéricos. Se clasifican en:
- Discretas: Asume una cantidad finita o infinita numerable de valores posibles.
- Continuas: Asume infinitos valores posibles en un intervalo real.
Parámetros y Medidas de Tendencia Central
Parámetro Estadístico
El parámetro es una constante que describe una característica de una población. Para poder calcular el valor de un parámetro, se requiere conocer a ciencia cierta el estado de naturaleza de la población o realizar un censo.
Medidas de Tendencia Central
Las Medidas de Tendencia Central son valores que representan o resumen el centro de un conjunto de datos. Sirven para identificar el valor «típico» o más representativo de una distribución.
Los principales tipos de parámetros y medidas de tendencia central son:
Media o Promedio
Es el valor que se obtiene al sumar todos los datos y dividir el resultado entre la cantidad total de datos.
Mediana
Es el valor central de los datos ordenados de menor a mayor. Divide al conjunto en dos partes iguales.
Moda
Es el valor que más se repite en un conjunto de datos. Indica el dato más frecuente o más común.
El Dato como Valor
Un Dato es una información concreta o un número específico que se obtiene al observar o medir una característica en un estudio o investigación. Es decir, el dato es el valor que toma una variable en un caso particular.
Ejemplo de Dato
Si la variable es «edad de los alumnos», los datos como valores podrían ser 15, 16, 17, 16, 18. Cada uno de esos números es un dato que representa el valor de la variable edad para cada alumno.