jueves, 27 de junio de 2024

MEDIDAS DE VARIABILIDAD O DE DISPERSION

 Medidas de variabilidad o de dispersión 

Muestran la separación existente entre los valores en general con respecto a los valores centrales, y permiten distinguir que tan dispersos están los datos de una distribución para completar los cálculos estadísticos y hacerlos mas objetivos y acertados.

las mas conocidas son las que calculan la variación de los datos con respecto a la medida aritmética como: rango, desviación y varianza 

Rango (R)

es la diferencia de datos entre el mayor dato y el menor, es la distancia que hay entre ellos. En los datos, mientras mayor sea le rango, mayor es su dispersión, y entre menos sea, hay menor dispersión.


VARIANZA PARA DATOS AGRUPADOS Y NO AGRUPADOS

varianza es la medida aritmética del cuadrado de las desviaciones respecto  a la media de una distribución estadística.

la formula para datos no agrupados es:



para datos no agrupados se utiliza la siguiente formula:



DESVIACIÓN ESTANDAR 

La dispersión de una distribución de datos en una variable Y, entre mas dispersa sea la distribución mas grande será la desviación estándar; puede considerarse como la raíz de la varianza. Permite analizar datos de una población (σ) o de una muestra (S): 






DESVIACION MEDIA ABSOLUTA 

la desviación es la diferencia que hay entre la media aritmética y cada valor dentro de un conjunto de datos, pero, para obtener un solo dato hay que calcular la desviación media a partir de la siguiente formula: 








miércoles, 26 de junio de 2024

medidas de posición de tendencia central

 Medidas de posición de tendencia central 

Las medidas o parámetros estadísticos muestran valores representativos de un grupo de datos, resumiendo la información del total de ese conjunto de datos. 

brindan información sobre el comportamiento general de los datos, incluyendo su posición o situación variabilidad o dispersión, con la finalidad de obtener de manera rápida y practica la estructura de los datos y/o su comparación entre diferentes conjuntos de datos.

MEDIA ARITMETICA PARA DATOS AGRUPADOS Y NO GRUPADOS 

Es el valor obtenido por la suma de todos los valores entre el numero de datos.

para datos agrupados y no agrupados la media representa el promedio total de los datos.


MEDIANA PARA DATOS AGRUPADOS Y NO AGRUPADOS 

  1. se localiza la posición de la mediana, para ello es necesario construir una distribución de frecuencias acumuladas.
  2. se utiliza la formula:       



en donde:

Lme= limite inferior del intervalo de clase donde se encuentra la mediana.

n= Numero total de datos

fa= la suma de las frecuencias anteriores a la clase donde se encuentra la mediana.

fme= la frecuencia de la clase donde se encuentra la mediana.

Cme= amplitud de clase donde esta la mediana.


MODA DE DISTRIBUCION DE DATOS AGRUPADOS 

se ubica la clase modal y posterior mente se utiliza la formula:


En donde: 

Lmo= limite inferior de la clase modal 

∆1= es la diferencia entre la frecuencia de la clase modal--frecuencia de la clase que le antecede 

∆2= es la diferencia entre la clase modal-- frecuencia de clase que le sigue

c=es el ancho de clase de la clase modal





GRAFICAS

 Graficas

histograma con polígono de frecuencias

un histograma es una representación grafica de una variable en forma de barras, teniendo en cuenta que la superficie de cada barra es proporcional a la frecuencia de los valores representados. nos permite ver como se distribuyen los valores de la variable en estudio.

PASOS PARA CONSTRUIR UN HISTOGRAMA

se parte de una tabla de frecuencias con datos agrupados y se siguen los siguientes pasos: 

  1. en el eje horizontal X colocamos los limites de clase.
  2. en el eje vertical Y colocamos las frecuencias. 
  3. dibujamos las barras de cada clase, teniendo en cuenta que la altura de cada barra es igual a la frecuencia.

POLIGONO DE FRECUENCIAS

Es la grafica que se obtiene al unir en forma consecutiva con segmentos los puntos de intersección entre los puntos medios de cada clase y su frecuencia, incluyendo el punto medio anterior a la primera clase y el punto medio posterior a la ultima clase.

para construir el polígono de frecuencias se toma la marca de clase que coincide con el punto medio de cada rectángulo (la construcción de los rectángulos es igual a cuando se realiza un histograma).


GRAFICA DE PASTEL 

se utiliza para representar datos estadísticos cualitativo, tiene la forma circular de un pastel divido en sectores, cuyas áreas son proporciones a los porcentajes de los distintos componentes de la población estadística.
la representación de números negativos es imposible con este tipo de diagrama.

GRAFICA DE OJIVA

es un polígono de frecuencias acumuladas, es decir, en la abscisa se colocan los limites superiores de cada intervalo clase y en las ordenadas se coloca la frecuencia acumulada (relativa o absolutas) de la clase.

 es útil para calcular el numero o porcentaje de observaciones que corresponden a un intervalo determinado de la variable.


diagrama de tallo y hoja

 Diagrama de tallo y hoja 

Es una muestra datos numéricos al separar cada punto de datos en una "hoja" es normalmente el ultimo dígito y "tallo" el dígito o dígitos principales.

un ejemplo seria:







tabla de frecuencias de datos no agrupados

Tabla de frecuencia de datos no agrupados 

esta tabla esta compuesta por las siguientes columnas:

  • Valores de la variable: son los diferentes valores que toma la variable en el estudio.
  • Frecuencia absoluta: la sumatoria de las frecuencias absolutas es igual al numero de datos.
  • Frecuencia acumulada: es la suma de las frecuencias absolutas, indica cuantos datos se van contando.
  • Frecuencia relativa: es la fracción de elementos que pertenece a una clase o categoría. se calcula dividiendo la frecuencia absoluta entre el numero de datos.
  • Frecuencia relativa acumulada: es la suma de las frecuencias relativas y se puede calcular también dividiendo de la frecuencia cumulada entre el numero de datos del estudio.



tabla de frecuencias de datos agrupados

 Tabla de frecuencias de datos agrupados 

Es una tabla donde los datos estadísticos aparecen bien organizados, distribuidos según su frecuencia, es decir, según las veces que se repite en la muestra.

en la tabla se representan los diferentes tipos de frecuencia, ordenados en columnas.

FRECUENCIA ABSOLUTA

es el numero de veces que un datos se repite dentro de un conjunto de datos. se representa como f i, donde la i corresponde al numero de datos.

para obtener la frecuencia absoluta es contando las veces que aparece el dato en el conjunto de datos.

la suma de las frecuencias absolutas corresponde al numero total de datos, que es representado por la letra N:

 



FRECUENCIA RELATIVA

la frecuencia relativa de un dato es el numero que se repite ese dato es el numero que se repite en relación al numero total de datos o en otras palabras, es la proporción de veces que aparece ese datos con respecto al total.

se representa como n i siendo i el numero de dato y se calcula dividiendo la frecuencia absoluta de cada dato entre el numero total de datos:




    
El valor de la frecuencia relativa siempre va estar entre 0 y 1.


la suma de todas las frecuencias relativas de todos los datos de muestra es igual a 1.



FRECUENCIA ABSOLUTA ACUMULADA

Es la suma de las frecuencias absolutas que se va acumulando hasta este dato, es decir, la frecuencia absoluta acumulada de un dato de concreto se obtiene sumando su frecuencia absoluta a las frecuencias de los datos que son menores que el.

este se representa como Fi, donde i es el numero de dato.

se calcula sumando la frecuencia absoluta de dato mas la frecuencia absoluta del dato anterior. por tanto, la frecuencia absoluta acumulada del primer dato coincide con su frecuencia absoluta y la frecuencia absoluta acumulada del ultimo dato coincide con el numero total de datos.

FRECUENCIA RELATIVA ACUMULADA

es el mismo concepto que para la frecuencia absoluta acumulada.

se representa como Ni donde la i es el numero de datos y se puede obtener como el cociente entre la frecuencia absoluta acumulada para cada dato entre el numero de datos totales.  

O también, como la suma de la frecuencia relativa de un dato mas la frecuencia relativa del dato anterior.


CLASES

si se llegan a tener un numero de datos muy grande, este se agrupa en intervalos, para no tener que realizar tablas muy largas. también se agrupan en intervalos de las variables continuas.

en este caso se realiza una tabla de frecuencias de datos agrupados.

sobre las clases se resaltan los siguientes conceptos: 

LIMITES DE CLASE: cada intervalo tiene un limite inferior, que pertenece a ese intervalo y un limite superior que no pertenece.

AMPLITUD DE CLASE: es la diferencia entre el limite superior e inferior y debe ser la misma para cada intervalo.

MARCA DE CLASE: es el punto medio de cada intervalo y es el valor que se utiliza para calcular otras medidas.

PASOS PARA ELABORAR TABLAS DE FRECUENCIAS DE DATOS AGRUPADOS 

  • hallar el rango (R): R= Xmax - Xmin
  • hallar el numero de intervalos (K). si no se indica cuantos intervalos usar, se recomienda usar la regla de sturgues: K=1 + 3.332log n, siendo n el numero de datos.
  • en caso de que el numero de datos sea menor que 50 usaremos la raíz cuadrada K=(n) raíz 
  • determinar la amplitud de clase (A): A= R/K
  • hallar el limite inferior y superior de cada clase, así como las marcas de clase.
  • se debe color los valores hallados en las columnas de la tablas de frecuencias, con el siguiente orden: clases (intervalos), marcas de clase, frecuencia absoluta, frecuencia acumulada, frecuencia relativa, frecuencia relativa acumulada.


información estadística

 fuentes de información estadística 

Son aquellos que sirven para recolectar datos e indicadores necesarios para su estudio o análisis. existen dos tipos las cuales son:

DIRECTA: son aquellas que están donde se produce los hechos. Por ejemplo: los peajes, para obtener la información de circulación de una carretera, las notarias para conocer la información de nacimientos, defunciones, matrimonios, etc.

INDIRECTA: son aquellas donde el hecho es manifestado indirectamente. Por ejemplo: las cuentas de nomina donde se obtiene la información de productividad.



MEDIDAS DE VARIABILIDAD O DE DISPERSION

  Medidas de variabilidad o de dispersión   Muestran la separación existente entre los valores en general con respecto a los valores central...