El objetivo básico de la Estadística es extraer la información de una población o muestra en estudio. Resumir los datos es un procedimiento útil para conseguirlo y puede hacerse mediante tablas, gráficos o valores numéricos, permitiendo describir una característica de interés observada en una población, poniendo en realce sus rasgos más importantes.
Organización de datos
Tablas de frecuencias:
En las tablas de frecuencias se recogen los distintos valores (números o categorías) que toma la variable junto con sus correspondientes frecuencias de aparición.
Asumamos que hemos medido una variable X (numérica) sobre un conjunto de N individuos.
Llamamos xi al valor que presenta el individuo i en la variable X, con i = 1, ..., N. Si observamos entre ellos k valores distintos, diremos que X toma valores x1, x2, ..., xk y determinaremos la frecuencia asociada a cada uno de ellos.
Para un valor xi, i = 1, ..., k, definimos las siguientes frecuencias:
Frecuencia absoluta, ni : Número de individuos que presentan el valor xi.
Frecuencia relativa, fi : Proporción de individuos que presentan el valor xi.
Frecuencia absoluta acumulada, Ni : Número de individuos que presentan un valor inferior o igual a xi.
Frecuencia relativa acumulada, Fi : Proporción de individuos que presentan un valor inferior o igual a xi.
Intervalos y amplitud
El número de intervalos o clases depende del número de datos y de la dispersión de los mismos (si son parecidos o no entre sí), no hay regla establecida. En la práctica se toma un número de intervalos aproximadamente igual a la raíz cuadrada del número de observaciones.
En cuanto a la amplitud, se suele tomar la misma en todos los intervalos. Una forma de obtenerla es:
Entonces, obtenemos el valor máximo y el valor mínimo. Generalmente los extremos inferiores se abren y los superiores se cierran, en lugar de tomar exactamente el valor mínimo, se toma un valor próximo inferior, ya que en otro caso el valor mínimo no podría incluirse en el primer intervalo.
Representaciones gráficas
Veremos las representaciones gráficas más comunes para cada tipo de variable.
Cualitativas
- Diagrama de barras o rectángulos
- Diagrama de Pareto
- Diagrama de sectores
Cuantitativas
- Histograma
- Polígono de frecuencias
- Diagrama de puntos
Cuando cantidades que informen de la concentración de las observaciones alrededor de dicho centro.
- La media:
- La mediana:
media de los dos (ó mas) valores centrales.
Para datos tabulados: si existe un valor con frecuencia relativa acumulada igual a 0.5, se toma como mediana la media de tal valor y el siguiente. Caso contrario, se toma el valor proximo en frecuencia relativa acumulada 0.5.
- La moda: Es la observacion que mas se respite, en el conjuto de datos en estudio.
- Cuantiles: deciles, cuartiles y percentiles
- Rango Intercuartílico
- Varianza: es una medida estadística que mide la dispersión de los valores respecto a un valor central (tambien "media"), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su media aritmética ( σ o V ) .
- Coeficiente de variación:
No hay comentarios:
Publicar un comentario