VARIABLE:
Una variable estadística es cada una
de las características o
cualidades que poseen los individuos
de una población.
TIPOS DE VARIABLES:
Variable
cualitativa
Las variables cualitativas se
refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:
Variable
cualitativa nominal
Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden.
Variable
cualitativa ordinal o variable cuasicuantitativa
Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden.
Variable
cuantitativa
Una variable
cuantitativa es la
que se expresa mediante un número, por
tanto se pueden realizar operaciones
aritméticas con
ella. Podemos distinguir dos tipos:
Variable
discreta
Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos
valores específicos.
Variable
continúa
Una variable continua es aquella que puede tomar valores comprendidos entre dos números.
DATO ESTADÍSTICO:
Es un conjunto de
valores numéricos que tienen relación significativa entre sí. Los mismos pueden
ser comparados, analizados e interpretados en una investigación cualquiera. Se
puede afirmar que son las expresiones numéricas obtenidas como consecuencia de observar
un individuo de la población; por lo tanto, son las características que se han
tomado en cuenta de cualquiera población para una investigación determinada.
FRECUENCIA:
La frecuencia es el
número de veces que se repite (aparece) el mismo dato estadístico en un
conjunto de observaciones de una investigación determinada, las frecuencias se
les designan con las letras fi, y por lo general se les llaman
frecuencias absolutas.
DISTRIBUCIÓN DE FRECUENCIA:
En estadística
existe una relación con cantidades, números agrupados o no, los cuales poseen
entre sí características similares. Existen investigaciones relacionadas con
los precios de los productos de la dieta diaria, la estatura y el peso de un
grupo de individuos, los salarios de los empleados, los grados de temperatura
del medio ambiente, las calificaciones de los estudiantes, etc., que pueden
adquirir diferentes valores gracias a una unidad apropiada, que recibe el
nombre de variable. La representación numérica de las variables se denomina
dato estadístico.
La distribución de
frecuencia es una disposición tabular de datos estadísticos, ordenados
ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las
distribuciones de frecuencias pueden ser para datos no agrupados ypara
datos agrupados o de intervalos de clase.
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS NO AGRUPADOS:
Es aquella
distribución que indica las frecuencias con que aparecen los datos
estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se
haya hecho ninguna modificación al tamaño de las unidades originales. En estas
distribuciones cada dato mantiene su propia identidad después que la
distribución de frecuencia se ha elaborado. En estas distribuciones los valores
de cada variable han sido solamente reagrupados, siguiendo un orden lógico con
sus respectivas frecuencias.
DISTRIBUCIÓN DE FRECUENCIA DE CLASE O DE DATOS AGRUPADOS:
Es aquella
distribución en la que la disposición tabular de los datos estadísticos se
encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los
datos originales de varios valores adyacentes del conjunto se combinan para
formar un intervalo de clase. No existen normas establecidas para determinar
cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo,
se sugiere que cuando el número total de datos (N) es igual o superior
50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces,
se utilizará la distribución de frecuencia para datos agrupados,
también se utilizará este tipo de distribución cuando se requiera elaborar
gráficos lineales como el histograma, el polígono de frecuencia o la ojiva.
La razón
fundamental para utilizar la distribución de frecuencia de clases es
proporcionar mejor comunicación acerca del patrón establecido en los datos y
facilitar la manipulación de los mismos. Los datos se agrupan en clases con el
fin de sintetizar, resumir, condensar o hacer que la información obtenida de
una investigación sea manejable con mayor facilidad.
Componentes de una
distribución de frecuencia de clase
1.- RANGO O AMPLITUD TOTAL (RECORRIDO).-
Es el límite dentro del cual están
comprendidos todos los valores de la serie de datos, en otras palabras, es el
número de diferentes valores que toma la variable en un estudio o investigación
dada. Es la diferencia entre el valor máximo de una variable y el valor mínimo
que ésta toma en una investigación cualquiera. El rango es el tamaño del
intervalo en el cual se ubican todos los valores que pueden tomar los
diferentes datos de la serie de valores, desde el menor de ellos hasta el valor
mayor estando incluidos ambos extremos. El rango de una distribución de
frecuencia se designa con la letra R.
2.- CLASE O INTERVALO DE CLASE.-
Son divisiones o
categorías en las cuales se agrupan un conjunto de datos ordenados con
características comunes. En otras palabras, son fraccionamientos del rango o
recorrido de la serie de valores para reunir los datos que presentan valores
comprendidos entre dos limites.
Para organizar los
valores de la serie de datos hay que determinar un número de clases que sea
conveniente. En otras palabras, que ese número de intervalos no origine un
número pequeño de clases ni muy grande. Un número de clases pequeño puede
ocultar la naturaleza natural de los valores y un número muy alto puede
provocar demasiados detalles como para observar alguna información de gran
utilidad en la investigación.
TAMAÑO DE LOS INTERVALOS DE CLASE
Los intervalos de
clase pueden ser de tres tipos, según el tamaño que estos presenten en una
distribución de frecuencia: a) Clases de igual tamaño, b)clases
desiguales
de tamaño y c) clases abiertas.
3.-AMPLITUD DE CLASE, LONGITUD O ANCHO DE UNA CLASE
La amplitud o
longitud de una clase es el número de valores o variables que concurren a una
clase determinada. La amplitud de clase se designa con las letras Ic. Existen
diversos criterios para determinar la amplitud de clases, ante esa diversidad
de criterios, se ha considerado que lo más importante es dar un ancho o
longitud de clase a todos los intervalos de tal manera que respondan a la
naturaleza de los datos y al objetivo que se persigue y esto se logra con la
practica.
4.-PUNTO MEDIO O MARCA DE CLASE
El centro de la
clase, es el volar de los datos que se ubica en la posición central de la clase
y representa todos los demás valores de esa clase. Este valor se utiliza para
el calculo de la media aritmética.
5.-FRECUENCIA DE CLASE
La frecuencia de
clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es
el número total de valores de las variables que se encuentran presente en una
clase determinada, de una distribución de frecuencia de clase.
6.- FRECUENCIA RELATIVA
La frecuencia relativa
es aquella que resulta de dividir cada uno de los fi de las
clases de una distribución de frecuencia de clase entre el número total de
datos(N) de la serie de valores. Estas frecuencias se designan con las letras fr;
si cada fr se multiplica por 100 se obtiene la frecuencia
relativa porcentual (fr %).
7.-FRECUENCIAS ACUMULADAS
Las frecuencias
acumuladas de una distribución de frecuencias son aquellas que se obtienen de
las sumas sucesivas de las fi que integran cada una de las clases
de una distribución de frecuencia de clase, esto se logra cuando la acumulación
de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar
la ultima. Las frecuencias acumuladas se designan con las letras fa. Las
frecuencias acumuladas pueden ser menor que (fa< que) y frecuencias acumuladas mayor
que (fa>que).
8.- FRECUENCIA ACUMULADA RELATIVA
La frecuencia
acumulada relativa es aquella que resulta de dividir cada una de las fa de
las diferentes clases que integran una distribución de frecuencia de clase
entre el número total de datos (N) de la serie de valores, estas frecuencias se
designan con las letras far. Si las far se
multiplican por 100 se obtienen las frecuencias acumuladas relativas
porcentuales y las mismas se designan así: far %.
LA MEDIANA
La mediana (Md) es
una medida de posición que divide a la serie de valores en dos partes iguales,
un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento
que es menor o igual que ella. Es por lo tanto, un parámetro que esta en el
medio del ordenamiento o arreglo de los datos organizados, entonces, la mediana
divide la distribución en una forma tal que a cada lado de la misma queda un
número igual de datos.
Para encontrar la
mediana en una serie de datos no agrupados, lo primero que se hace es ordenar
los datos en una forma creciente o decreciente y luego se ubica la posición que
esta ocupa en esa serie de datos; para ello hay que determinar si la serie de
datos es par o impar, luego el número que se obtiene indica el lugar o posición
que ocupa la mediana en la serie de valores, luego la mediana será el número
que ocupe el lugar de lo posición encontrada.
LA MODA
La moda es la
medida de posición que indica la magnitud del valor que se presenta con más
frecuencia en una serie de datos; es pues, el valor de la variable que más se
repite en un conjunto de datos. De las medias de posición la moda es la que se
determina con mayor facilidad, ya que se puede obtener por una simple
observación de los datos en estudio, puesto que la moda es el dato que se
observa con mayor frecuencia. La moda se designa con las letras Mo.
DESVIACION TIPICA O ESTANDAR
Es la medida
de dispersión más utilizada en las investigaciones por ser la más
estable de todas, ya que para su calculo se utilizan todos los desvíos con
respecto a la media aritmética de las observaciones, y además, se toman en
cuenta los signos de esos desvíos. Se le designa con la letra castellana Scuando
se trabaja con una muestra y con la letra griega minúscula s (Sigma) cuando se trabaja con una
población. Es importante destacar que cuando se hace referencia a la población
él número de datos se expresa con N y cuando se refiere a la
muestra él número de datos se expresa con n. La desviación típica
se define como:
INTERPRETACION DE LA DESVIACION ESTANDAR
La desviación
típica como medida absoluta de dispersión, es la que mejor nos proporciona la
variación de los datos con respecto a la media aritmética, su valor se
encuentra en relación directa con la dispersión de los datos, a mayor
dispersión de ellos, mayor desviación típica, y a menor dispersión, menor
desviación típica.
VARIANZA
Es otra de las variaciones
absolutas y la misma se define como el cuadrado de la desviación típica; viene
expresada con las mismas letras de la desviación típica pero elevadas al
cuadrado, así S2 y s2. Las formulas para
calcular la varianza son las mismas utilizadas por la desviación típica,
exceptuando las respectivas raíces, las cuales desaparecen al estar elevados el
primer miembro al cuadrado
EJEMPLOS:
.jpg)
.jpg)



No hay comentarios:
Publicar un comentario