Buscar este blog

CAPITULO I

Estadística Descriptiva (Unidimensional)


El objetivo básico de la Estadística es extraer la información de una población o muestra en estudio. Resumir los datos es un procedimiento útil para conseguirlo y puede hacerse mediante tablas, gráficos o valores numéricos, permitiendo describir una característica de interés observada en una población, poniendo en realce sus rasgos más importantes.


Organización de datos

Tablas de frecuencias:

En las tablas de frecuencias se recogen los distintos valores (números o categorías) que toma la variable junto con sus correspondientes frecuencias de aparición.

Asumamos que hemos medido una variable X (numérica) sobre un conjunto de N individuos.

Llamamos xi al valor que presenta el individuo i en la variable X, con i = 1, ..., N. Si observamos entre ellos k valores distintos, diremos que X toma valores x1, x2, ..., xk y determinaremos la frecuencia asociada a cada uno de ellos.

Para un valor xi, i = 1, ..., k, definimos las siguientes frecuencias:

Frecuencia absoluta, ni : Número de individuos que presentan el valor xi.


Frecuencia relativa, fi : Proporción de individuos que presentan el valor xi.


Frecuencia absoluta acumulada, Ni : Número de individuos que presentan un valor inferior o igual a xi.


Frecuencia relativa acumulada, Fi : Proporción de individuos que presentan un valor inferior o igual a xi.


Intervalos y amplitud

El número de intervalos o clases depende del número de datos y de la dispersión de los mismos (si son parecidos o no entre sí), no hay regla establecida. En la práctica se toma un número de intervalos aproximadamente igual a la raíz cuadrada del número de observaciones.


En cuanto a la amplitud, se suele tomar la misma en todos los intervalos. Una forma de obtenerla es:


Entonces, obtenemos el valor máximo y el valor mínimo. Generalmente los extremos inferiores se abren y los superiores se cierran, en lugar de tomar exactamente el valor mínimo, se toma un valor próximo inferior, ya que en otro caso el valor mínimo no podría incluirse en el primer intervalo.



Representaciones gráficas

Veremos las representaciones gráficas más comunes para cada tipo de variable.

Cualitativas

  • Diagrama de barras o rectángulos
  • Diagrama de Pareto
  • Diagrama de sectores

Cuantitativas

  • Histograma
  • Polígono de frecuencias
  • Diagrama de puntos
Medidas de Posición
Cuando cantidades que informen de la concentración de las observaciones alrededor de dicho centro.
Entre ellas, tenemos:
  • La media:
Para datos sin tabular:

Para datos tabulados:

  • La mediana:
Para datos sin tabular: ordenar de menor a mayor, si el número de ibservaciones "N" es impar se toma el valor central ; si es par se toma la
media de los dos (ó mas) valores centrales.

Para datos tabulados: si existe un valor con frecuencia relativa acumulada igual a 0.5, se toma como mediana la media de tal valor y el siguiente. Caso contrario, se toma el valor proximo en frecuencia relativa acumulada 0.5.

  • La moda: Es la observacion que mas se respite, en el conjuto de datos en estudio.
  • Cuantiles: deciles, cuartiles y percentiles
Medidas de Dispersión
Las medidas de posición o centralización no siempre proporcionan información suficiente para describir un conjunto de datos de manera adecuada. Entre ellas tenemos:

  • Rango Intercuartílico
  • Varianza: es una medida estadística que mide la dispersión de los valores respecto a un valor central (tambien "media"), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su media aritmética ( σ o V ) .
  • Coeficiente de variación:



Mas adelante, pondre ejercicios..

No hay comentarios:

Publicar un comentario