Teoría

 

1. TABULACION DE DATOS Y ANALISIS DE DATOS

2. Factores • El nivel de medición de las variables • La manera como se formulen las hipótesis • El interés del investigador • El análisis de los datos busca describir y posteriormente efectuar análisis estadístios para relacionar sus variables.

3. Distribución Es un conjunto de puntuaciones Frecuencias Ordenadas en sus respectivas Categorías.

4. VARIABLES CUALITATIVAS Permiten ser Software Nº observaciones tabuladas u ordenadas SPSS 10 en tablas que Infostat 45 resumen las Statgraphic 16 cualidades o atributos. Statistic 2

5. VARIABLES CUANTITATIVAS • Pueden ser agrupadas según su naturaleza: a) discretas b) continuas

6. Variables discretas • Se pueden ordenar en clases individuales o en intervalos de clases. Variables continuas • Se pueden ordenar solo en intervalos de clases.

7. Ejemplos intervalo de clase Nº de Xi Nº de observaciones observaciones 119 - 127 2 1 10 128 - 136 6 2 12 137 - 145 8 3 7 146 - 154 15 155 - 163 5 4 7 164 - 172 3 5 3 173 - 181 1 Total 40

8. También pueden contener Frecuencias relativas (porcentaje de casos de cada categoría) y Frecuencias Acumuladas (acumulan en cada categorías). Edad del Encuestado Porcentaje Porcentaje Frecuencia Porcentaje válido acumulado Válidos 3,00 4 44,4 44,4 44,4 6,00 1 11,1 11,1 55,6 9,00 4 44,4 44,4 100,0 Total 9 100,0 100,0

9. Distribuciones de frecuencias • El conteo por clase o intervalo recibe el nombre de frecuencia absoluta. Se denota por: ni •Las frecuencias absolutas acumuladas son el conteo acumulado clase a clase y se denota por: Ni

10. ACTIVIDADES

11. REPRESENTACIÓN GRÁFICA DE DISTRIBUCIONES DE FRECUENCIAS

12. GRÁFICO DE BARRA Es usado en observaciones cualitativas o cuantitativas discretas. Sobre cada clase se levanta una barra de altura igual a la frecuencia de la clase. Eje horizontal: se representan las clases Eje vertical: las frecuencias absolutas ni 25 20 15 10 5 0 Auditoria Medicina Derecho Ingenieria

13. HISTOGRAMA Se utiliza en variables cuantitativas. Consiste en un conjunto de rectángulos cada uno de los cuales representa un intervalo de agrupación o clase. Sus bases son iguales a la amplitud del intervalo y la altura se determina de manera que su área sea proporcional a la frecuencia de cada clase. Eje horizontal: se representan los intervalos de fronteras “Fi - Fs” Eje vertical: las frecuencias absolutas “ni” 15 1a5 10 5 a 15 15 a 33 33 a 50 5 50 a 60 60 a 72 0 EDAD

14. • Las frecuencias relativas pueden también presentarse 50 en histogramas o 40 graficas de otro tipo. 30 (salida de SPSS) 20 10 Porcentaje 0 3,00 6,00 9,00 Edad del Encuestado

15. POLÍGONO DE FRECUENCIAS Es un gráfico de línea. Se construye uniendo con segmentos de recta los puntos medios (marca de clase) de los intervalos adyacentes. Se utiliza para determinar la forma que sigue la distribución de frecuencias de las observaciones con el propósito de ajustarle alguna función probabilística determinada. •Eje horizontal: se representan las marcas de clases “mi ” •Eje vertical: las frecuencias absolutas “ni”

16. OJIVA Es un polígono de frecuencias acumulativas. Comienza en cero y termina en 100%. Es un polígono que parte de la frontera inferior del primer intervalo de clase y en cada frontera superior va indicando su frecuencia acumulada. Eje horizontal: se representan los intervalos de fronteras “Fi - Fs” Eje vertical: las frecuencias absolutas acumuladas “Ni”

17. GRÁFICO CIRCULAR Permite representar las frecuencias absolutas o frecuencias relativas porcentuales en un círculo. Se debe determinar la cantidad de grados del círculo correspondiente a cada frecuencia absoluta mediante la proporción 360° ⋅ ni X° = N N° ALUMNOS POR EDADES 10% 20% 36% 34% 20 años 19años 23 años 25 años

 
VARIABLES CUALITATIVAS 
 
Pueden representarse : 
  • La frecuencia absoluta (símbolo : f ó n), que es el nº de veces que aparece cada modalidad (resultado del recuento). La frecuencia total, de todas las modalidades juntas, se representa por N. 
  • La frecuencia relativa ( fr) o proporción se obtiene dividiendo la frecuencia de cada modalidad entre el total de datos. fr = f / N . Los valores posibles oscilan entre 0 y 1. Suele expresarse con 3 decimales. La suma de todas las fr tiene que dar 1 ó un número muy cercano al 1, si ha habido redondeos.
  • El porcentaje (P o %), que es la frecuencia relativa multiplicada por 100. P = fr * 100 ó % = (f*100)/N . Suele expresarse con 3 dígitos. La suma de todos los porcentajes debe dar 100 o un número muy próximo, si ha habido redondeos.
  • Las frecuencia acumuladas (Σ f ó Σn ) que se obtienen sumando la frecuencia de cada modalidad a las frecuencias ya acumuladas anteriormente. En la primera modalidad no hay nada acumulado de antes y por tanto su frecuencia acumulada será su misma frecuencia. La última modalidad tiene que dar una frecuencia acumulada igual a N.
  • Las frecuencias relativas acumuladas y los porcentajes acumulados se obtienen de forma similar
 
VARIABLES CUANTITATIVAS 
 
Los datos se agrupan según la frecuencia de los valores. Es lo que se denomina Distribución de frecuencias. La forma de tabular depende del nº de datos. 
----Si son pocos (la mayoría de autores pone el tope en 30) , se hace una tabla simple de 
forma similar a lo visto para las variables CL. Cada dato equivale a una modalidad. Al final nos quedaremos con la f de cada número y si se prefiere también con el %. Los números se ordenan de menor a mayor o de mayor a menor. La tabla puede hacerse en sentido 
vertical u horizontal. 
 
Ejemplo: Si x = ( 4 , 1 , 7 , 2 , 2 , 9 , 7 , 2 , 2 , 9 , 7 , 1 , 4) 
 o bien 
----Si son muchos se agrupan en clases, que son intervalos sucesivos de valores. Los datos se 
asignan a la clase que les corresponde y se cuentan los datos de cada clase, que está representada por el punto medio o centro de clase (pm ó c).
Esta agrupación es arbitraria con dos condiciones esenciales: que las clases sean mutuamente excluyentes y que todos los datos puedan se asignados a una clase. Ahora bien, la experiencia ha ido introduciendo una serie de normas, que permiten hacer esta agrupación de la forma 
más racional posible. 
 
Se recomiendan los siguientes pasos: 
 
1) calcular el RECORRIDO ( R ) , (a veces mal llamado Rango) 
= (límite real superior del dato mayor – límite real inferior del dato menor) 
O si se prefiere: = (valor tabulado máximo – valor tabulado mínimo) + 1 
 
2) calcular el Nº DE CLASES (NC) . 
Es función de N (tamaño de la muestra) y no hay reglas fijas. 
 En general: “entre 4 y 20” . 
 Ayudas: NC = 1+ 3,32*logN ó 1+1,44*lnN
 O la siguiente tabla: N 8 16 32 64 128 256 etc. 
------------------------------------------------ 
 NC 4 5 6 7 8 9 etc. 
 De entrada nos quedamos con 2 ó 3 opciones 
 
3) calcular la AMPLITUD de las clases ó INTERVALO (i) : i = R / NC 
Si i no es número entero, se redondea al número entero superior para que NC*i ≥ R y 
así queden englobados todos los datos 
Como probamos con 2 ó 3 opciones, conviene elegir una i que sea impar, pues así el 
punto medio de la clase (pm ó c) tendrá una cifra menos. 
En principio todas las clases deben tener la misma amplitud. 
 
4) Ver si hay SOBRAS, que son la diferencia entre NC*i y R. Se reparten lo mejor posible 
entre ambos extremos de la distribución fijando así los límites definitivos de la tabla. 
x 1 2 4 7 9 
f 2 4 2 3 2 
x f 
1 2 
2 4 
4 2 
7 3 
9 2 4-3 
 
5) Construir el esquema de la tabla, poniendo columnas de 
 CLASES ó LIMITES TABULADOS 
 LIMITES REALES 
 PUNTO MEDIO (pm ó c) 
 FRECUENCIA ( f ó n) 
 FRECUENCIA RELATIVA ( fr) 
 PORCENTAJE (P o %) 
 FRECUENCIAS ACUMULADAS ( Σf ó Σn) 
 FRECUENCIAS RELATIVAS ACUMULADAS (Σfr) 
 PORCENTAJES ACUMULADOS (Σ%) 
 
6) Hacer el RECUENTO de datos y rellenar las casillas correspondientes 
 
7) Escribir la TABLA DEFINITIVA. Son obligadas las clases y la frecuencia absoluta,
pudiendo añadir otros parámetros, si se considera que mejoran la información. Una tabla 
excesivamente prolija resulta más difícil de leer. Por tanto la norma es: poner todo lo necesario, pero no más de lo necesario. 
Algunos de éstos parámetros son los mismos que se han visto para las variables CL. Otros 
precisan una aclaración: 
Los límites de las clases son los valores inferior y superior de cada clase. (Límite inferior y 
límite superior). Hay que distinguir entre los límites tabulados (LT) y los límites reales (LR). 
Los límites tabulados son los datos originales que abren y cierran una clase. Los límites reales 
son el límite real inferior del primer valor (LRI) y el límite real superior del último (LRS). 
El punto medio o centro de la clase (pm ó c) representa a la clase cuando se hacen operaciones matemáticas. Es la media de los límites. Da lo mismo tomar los límites reales que los tabulados, ya que ambos dan el mismo resultado. 
En una distribución con todas las clases de la misma amplitud las diferencias entre los puntos 
medios, los límites inferiores y los límites superiores de dos clases consecutivas valen lo 
mismo y son igual a la amplitud de la clase (i). Esto facilita la construcción de la tabla. 
Una clase es abierta cuando carece de un límite. Sólo pueden ser abiertas la primera clase 
(p.e. <10 ; no tiene límite inferior)) y la última (p.e. >100 ; no tiene límite superior). No deben usarse, a no ser que no haya otro remedio.