Está en la página 1de 43

estadistica aplicada a las ciencias

sociales
por marubas23amas | buenastareas.com

CAPITULO I

1. INTRODUCIN.
Matemticas Bsicas.
Por qu estudiar estadstica?
2. ESTADSTICA.
La estadstica y su empleo.
Qu es la estadstica?
Estadstica descriptiva.
Estadstica inferencial.
3. POBLACIN Y MUESTRA.
La poblacin y su clasificacin.
La muestra.
Ejercicios prcticos tema 3
4. MUESTREO.
El muestreo aleatorio.
El muestreo sistemtico.
El muestreo estratificado.
El muestreo por conglomerados.
5. VARIABLES.
Variable.
Variable aleatoria.
Variable continua.

Variable discreta.
Variable Cuantitativa.
Variable Cualitativa.

1. INTRODUCCIN.
Por qu estudiar estadstica?

La estadstica es la ciencia que trata sobre la obtencin de informacin a partir de datos


numricos. Estudiamos estadstica porque la utilizacin de datos se ha convertido en algo
cada vez ms comn en un nmero creciente de profesiones, en poltica y en la vida
cotidiana.
Para la gente comn y corriente la estadstica significa nmeros. En el peridico de la
maana se pueden encontrar las estadsticas ms recientes sobre los delitos de la ciudad,
nmero de asesinatos, de robos de automviles, de asaltos y dems delitos que hayan
sido denunciados en determinado periodo de tiempo. Aunque estos ejemplos forman
parte del concepto total estadstica, la palabra tiene un sentido ms amplio para aquellas
personas cuyo trabajo requiere un conocimiento (si bien a veces mnimo) de los aspectos
ms tcnicos de la estadstica. Para estas personas, la palabra estadstica tiene una
relacin con aquellos conceptos y tcnicas que se emplean en la
recopilacin,organizacin, resumen, anlisis, interpretacin y comunicacin de la
informacin numrica. Naturalmente, dichos conceptos y tcnicas juegan un papel
importante en las actividades que cumplen los profesionales de ciertas ciencias.
La mayora de los lectores del presente texto no van a ser expertos en estadstica, cabe
preguntar entonces para qu hay que estudiarla. La razn estriba, en pocas palabras, en
que los conceptos y las tcnicas de la estadstica se utilizan actualmente en un gran
nmero de ocupaciones. Las ideas estadsticas constituyen una parte integral de las
actividades investigativas, de las encuestas para recopilar datos y del anlisis de los datos
que se originan en las instituciones y en las organizaciones.
Es posible que un trabajador no necesite conocer de la estadstica sino aquello que lo
faculte para saber cundo se requieren los servicios de un experto y para poder
comunicarse eficazmente con l cuando trabajen juntos en la planeacin, direccin e

interpretacin de los resultados de una actividad que requiere la metodologa de esta


ciencia.
La persona que comprenda los conceptos estadsticos y su metodologa sacar mejor
provecho de ellos. Esta persona estar ms preparada para evaluar los resultados de una
investigacin y dems informaciones que se obtengan. El profesional que entienda de
estadstica podr leer con mayor inteligencia la lectura que, sobre su campo de accin, va
da a da apareciendo.
Finalmente vamos a descubrir que los conocimientos de la estadstica son de gran ayuda
para las dems asignaturas. Muchos textos correspondientes a otras asignaturas se
hanescrito sobre la base de que el estudiante tiene por lo menos un conocimiento
elemental de las ideas y tcnicas de la estadstica y, adems, muchos cursos superiores
tienen esta materia como requisito previo.
Algunas reas de aplicacin de la metodologa estadstica son la agricultura, biologa,
negocios, salud, medicina, industria, sociologa y psicologa, ya que la mayora de los
psiclogos se valen de los conceptos y tcnicas de la estadstica para medir y comparar la
conducta, las actitudes, la inteligencia y las aptitudes del hombre.

2. ESTADSTICA.
La estadstica y su empleo?
La estadstica es una de las herramientas ms ampliamente utilizadas en la investigacin
cientfica. Se emplea en las instituciones gubernamentales y educativas, en los negocios
en la industria y en otras organizaciones. El empleo juicioso de las tcnicas estadsticas
permite obtener conclusiones tiles a partir de un conjunto de datos numricos.
Sin embargo el trmino estadstica tiene distintos significados para diferentes personas.
Para algunos no es ms que informacin numrica, para otros es un mtodo para
obtener, presentar y describir grandes cantidades de datos y para otros es un mtodo
para tomar decisiones en situaciones de incertidumbre. Los objetivos principales de este
captulo son aclarar los significados de estadstica, definir sus conceptos bsicos
utilizados con mayor frecuencia.
Nos enfocaremos en la divisin de la estadstica en dos reas principales, la estadstica

descriptiva la cual incluye la obtencin, presentacin y descripcin de datos numricos y


la estadstica inferencialque se ocupa de las tcnicas para tomar decisiones con base en
el anlisis de los datos obtenidos.
Qu es la estadstica?
La mayor parte de las palabras tienen varios significados; la palabra estadstica no es
una excepcin. En el lenguaje comn, la palabra se emplea para detonar un conjunto de
calificaciones o nmeros. Por ejemplo el cronista deportivo puede decir, estas son las
estadsticas para la primera mitad. Una persona cualquiera puede preguntar has visto
las ltimas estadsticas acerca del desempleo?. En los diarios o peridicos locales se
presentan nacimientos y muertes como estadsticas vitales.
El trmino estadstica tambin se emplea para designar un rea de estudio: una disciplina.
Es la ciencia que se encarga del estudio de los mtodos y procedimientos para recolectar,
clasificar, resumir, presentar, analizar e interpretar informacin. La aplicacin de la
estadstica se da en varios niveles de complejidad, desde los que requieren tcnicas muy
elevadas hasta los que solo necesitan, por ejemplo, la organizacin de un conjunto de
datos en tablas, la construccin de algunas grficas y el clculo de ciertos promedios.
Como se menciono anteriormente la estadstica comnmente se clasifica en dos ramas o
procedimientos:
Estadstica descriptiva.
La estadstica descriptiva se refiere a aquella parte del estudio que incluye la obtencin,
organizacin, presentacin y descripcin de informacin numrica.
Comprende aquellos mtodos usados para recolectar, organizar y describir la informacin
recabada, nos ayuda a describir el mundo en torno nuestro.
Despusde obtener datos, estos deben transformarse en formas ms tiles y
significativas:
En forma tabular.
En forma de grficas.
En forma aritmtica.
La parte de la estadstica que da los procedimientos para transformar los datos se llama
estadstica descriptiva.

Ejemplo: Un gerente de personal desea conocer las aptitudes de cinco oficinistas que
trabajan en una compaa. Se aplica una prueba de aptitudes a los cinco empleados y las
calificaciones son 82, 85, 95, 92 y 91. La medida estadstica que emplea el gerente de
personal es la aptitud promedio o media aritmtica, la cul es la suma de los valores
obtenidos dividida entre el nmero de observaciones.

82 + 85 + 95 + 92 + 91 = 445 = 89
55
El resultado se limita a los datos obtenidos en este caso particular y no aplica ninguna
inferencia o generalizacin acerca de las aptitudes de otros oficinistas. Este mtodo es de
naturaleza descriptiva, debido a que el promedio condensa y describe la informacin
obtenida.
Adems los datos pueden representarse en numerosas formas visuales. Una de ellas
utilizadas con mayor frecuencia es la grfica de barras.
Estadstica Inferencial.

Parte de la estadstica que se refiere a la formulacin de inferencias o deducciones de los


valores resultantes, obtener conclusiones para la toma de decisiones sobre poblaciones a
partir de una muestra.
La estadstica inferencial es la parte de los mtodos estadsticos que ayudan a conocer
algn aspecto de la poblacin mediante el conocimiento de ciertos aspectos de la
muestra.
La inferencia estadstica es unatcnica mediante la cual se obtiene generalizaciones o se
toman decisiones en base a una informacin parcial o incompleta obtenida mediante
tcnicas descriptivas. A continuacin se presenta un caso tpico que se resuelven
mediante estadstica inferencial, donde la decisin o eleccin se da en base a informacin
numrica.
Ejemplo: Un fabricante de medicinas afirma que una nueva vacuna contra el catarro
desarrollado por su compaa tiene una efectividad del 90%; esto es, en promedio 90 de
cada 100 personas que emplean la vacuna pasarn el invierno sin contagiarse de catarro.
Resulta prcticamente imposible probar la vacuna en todas las personas, as que
consideraremos que 30 personas han recibido la vacuna, y que de las 30, 25 no se

contagiaron de catarro. Si la afirmacin del fabricante es correcta, se esperara que 27


personas (30 x .90 = 27) pasarn el invierno sin catarro. Ya que el nmero observado es
25, lo cual es inferior al nmero esperado 27, Debera rechazarse la afirmacin del
fabricante en base a la evidencia?
Tanto la estadstica descriptiva e inferencia son dos reas que conforman a la disciplina
de la estadstica moderna. De las dos la segunda se ha vuelto cada vez ms importante.
Sin embargo, son esenciales tanto en la investigacin como en la toma de de decisiones.

3. POBLACIN Y MUESTRA.
La poblacin y su clasificacin.
La poblacin es uno de los conceptos bsicos que existe en la estadstica, llamamos
poblacin a la totalidad de todas las posibles observaciones y mediciones bajo
consideracin es una situacin dada un problema.
Es un conjunto de individuos uobjetos acerca del cual se quiere saber algo o tambin, es
el total de la informacin, o de los objetos con una caracterstica en comn de inters para
un estadstico o una investigacin particular.
Cada situacin diferente implica una poblacin diferente. Si el problema consiste en
evaluar el coeficiente intelectual promedio de todos los nios de las primarias del Estado
de Michoacn, entonces los C.I. de todos los nios constituyen la poblacin. Si la finalidad
de una investigacin es determinar qu proporcin de todas las unidades producidas en
cierto proceso de manufactura es defectuosa, entonces la poblacin consiste en las
mediciones de calidad de todas las unidades producidas mediante ese proceso.
A la poblacin generalmente se le clasifica en dos categoras finitas e infinitas. Una
poblacin finita es aquella que incluye un nmero limitado de medidas y observaciones.
Por ejemplo son poblaciones finitas el conjunto de las alturas de todos los estudiantes que
actualmente estn presentes en el aula, o el conjunto de calificaciones del presente ciclo
escolar en la Licenciatura en Psicologa Educativa. Se dice que una poblacin es infinita si
incluye un gran conjunto de medidas u observaciones que no pueden alcanzarse por
conteo, por ejemplo la poblacin formada por los nacimientos de personas del presente y
futuro, o el conjunto de estrellas que forman el universo.
Muestra.

Una muestra es un conjunto de medidas u observaciones tomadas a partir de una


poblacin dada, es un subconjunto de una poblacin. Desde luego, el nmero de
observaciones en una muestra es menor que el nmero posiblede observaciones en la
poblacin; de otra forma, la muestra sera la poblacin misma. Las muestras se toman
debido a que no es factible desde el punto de vista econmico, aunque en algunos casos
sea probable (como sucede con los censos nacionales) recolectar todas las posibles
observaciones en la poblacin. Por ejemplo se desea conocer la opinin que los alumnos
de una universidad tienen sobre los alimentos de la cafetera, por lo que se decide aplicar
encuestas. Podra resultar muy difcil aplicar la encuesta a cada uno de los alumnos que
conforman esa universidad suponiendo que la matricula sea de 20,000 alumnos, por lo
que sera recomendable tomar una muestra de esa poblacin para aplicar dichas
encuestas.
4. MUESTREO.
Muestreo aleatorio simple.
Muestreo es el proceso de tomar una o varias muestras de una poblacin. Existen al
menos cuatros diseas de muestra comnmente utilizados, uno de ellos es el muestreo
aleatorio simple.
La muestra se elige de forma tal que todas las muestras del mismo tamao tengan la
misma probabilidad de ser elegidas.
El muestreo aleatorio simple se usa cuando las unidades son homogneas con respecto a
la caracterstica poblacional en estudio.
Existen varias tcnicas comnmente utilizadas para llevar a cabo este muestreo, como lo
son la tabla de nmeros aleatorios, la tcnica de la urna, otra tcnica es someter nmeros
a una rifa, incluso las calculadoras cientficas tienen la opcin de darnos nmeros
aleatorios.
Muestreo sistemtico.
Con este procedimiento, se selecciona una muestra tomada cada k-sima unidad de la
poblacin una vez que las unidadesde muestreo estn numeradas o arregladas de alguna
forma. La letra k es la razn del muestreo, esto es, la razn del tamao de la poblacin al
tamao de la muestra. Entonces si se va a seleccionar una muestra de 40 unidades a
partir de una poblacin de 1000 unidades, entonces k= 1000/40 =25, y la muestra se
obtiene tomando cada 25-sima unidad de la poblacin.
Puede utilizarse el procedimiento de la urna para determinar con cul de las primeras 25

unidades empezar. Si se selecciona la 10-sima como inicial aleatorio, entonces la


muestra incluir las unidades 10, 35, 60,...., 960-simas. Entonces, aquellas unidades
cercanas nunca estarn representadas ni de ms ni de menos en la muestra.
Muestreo Estratificado.
Este es otro diseo de muestreo frecuentemente utilizado. Este procedimiento implica
dividir a la poblacin en clases o grupos denominados estratos. Se supone que las
unidades incluidas en cada estrato son relativamente homogneas con respecto a las
caractersticas que vayan a estudiarse. Se toma una submuestra a partir de cada estrato
mediante un procedimiento aleatorio simple. Entonces para obtener la muestra general se
combinan las submuestras correspondientes a todos los estratos.
El muestreo estratificado se emplea con ms frecuencia en el manejo de poblaciones
heterogneas tales como los datos acerca del ingreso familiar en una sola rea
metropolitana. Mediante estratificacin, se forman estratos de manera que las unidades
dentro de cada uno sean casi homogneas y los estratos sean diferentes unos a otros. A
menudo se toma una razn de muestreo igual para todos los estratos.Esto es, las
unidades en la muestra se asignan entre los estratos en proporcin al nmero relativo de
unidades en cada estrato de la poblacin. A una muestra seleccionada de esta forma se
le denomina muestra estratificada proporcional.
Algunas veces la razn de muestreo en cada estrato ser inversamente relacionada con
la homogeneidad de las unidades en el estrato; mientras ms homogneo sea el estrato,
menor ser su proporcin incluida en la muestra. A una muestra obtenida de esta forma
se le denomina muestra estratificada desproporcionada. La razn de este proceder, es
que cuando las unidades de un estrato son ms homogneas, resulta necesaria una
submuestras pequea para asegurar la representatividad. En consecuencia, el costo del
muestreo se reduce.
Muestreo por conglomerados.
En primer lugar, este procedimiento implica la seleccin aleatoria de grupos o
conglomerados, a partir de la poblacin; la muestra general est formada por todas o por
una submuestra de las unidades en cada conglomerado. El muestreo por conglomerados
es diferente del muestreo estratificado en que las diferencias entre los conglomerados son
generalmente pequeas y las unidades dentro de cada uno en general son ms
heterogneas. Cada conglomerado debera ser una miniatura de la poblacin. Aun
cuando un solo conglomerado podra ser una muestra satisfactoria, ste rara vez es el
caso.

Generalmente los conglomerados se les conocen como unidades primarias de muestreo.


Si todas las unidades de los conglomerados elegidos se incluyen en la muestra general, al
procedimiento se le denomina muestreo de una sola etapa(unietpico). Si se toma
aleatoriamente una submuestra a partir de cada conglomerado seleccionado y todas las
unidades de la submuestra se incluyen en la muestra general, al procedimiento se le
denomina muestreo bietpico (dos etapas)
Sin un proceso de muestreo implica tres o ms etapas, se le denomina muestreo
polietpico (varias etapas). Por ejemplo, en una investigacin acerca de los profesores en
las universidades estatales de Mxico, se seleccion aleatoriamente cierto nmero de
universidades estatales como conglomerados en la primera etapa. Si en la muestra se
incluyen todos los profesores de las universidades seleccionadas, se trata de un muestreo
de una sola etapa. Si dentro de cada una de las universidades elegidas se selecciona
aleatoriamente cierto nmero de departamentos o licenciaturas, y la muestra incluye a
todos los profesores de los departamentos o licenciaturas elegidas se trata de un muestre
bietpico. La tercera etapa podra implicar la seleccin de una muestra de profesores de
cada departamento o licenciatura; entonces, la muestra incluira a todos los profesores
muestreados en los departamentos seleccionados de los conglomerados elegidos. A
menudo se prefiere el muestreo por conglomerados debido a su costo relativamente bajo.
VARIABLES.
Variable.
Es el conjunto de caractersticas de las entidades que interesan en una investigacin
cientfica. El bilogo puede tener un inters especial es el tamao del foramen magno de
las ardillas. El mdico puede querer investigar el nivel de colesterol de ciertos pacientes.
Al educador le puede llamar la atencin el rendimiento en la lecturade los estudiantes que
han aprendido a leer con un mtodo determinado. El investigador agrcola puede estar
interesado en conocer la resistencia de una variedad de trigo a cierta enfermedad. Al
meteorlogo le puede llamar la atencin la nieve como una proporcin de la precipitacin
total. En virtud de que cualquiera de estas caractersticas, por regla general, presenta un
valor diferente cuando se observa en diferentes entidades, ella recibe el nombre de
variable. Adems de las variables ya mencionadas, inmediatamente vienen a la mente
otras, tales como la estatura de los hombres, la vida de las llantas de un automvil, el
color de la piel de los perros y el nmero de zurdos en una escuela.
Variable aleatoria.

Si los valores numricos que provienen de una variable provienen de factores fortuitos y si
un determinado valor no se puede predecir exactamente con anticipacin, esa variable se
denomina variable aleatoria.
Para representar las variables aleatorias utilizaremos letras maysculas como X, Y y Z.
De esta manera podremos referirnos a la variable aleatoria edad como X o a la variable
aleatoria estatura como Y. Los valores individuales de una variable aleatoria se
representarn con letras minsculas tales como x, y, y z. Si por ejemplo, la variable
aleatoria X tiene 6 valores, nos referimos a esos valores como x1, x2, x3, x4, x5, x6. Los
subndices servirn para distinguir un valor de la variable aleatoria de otro.
Variable continua.
Una variable continua es aquella que tericamente puede tomar cualquier valor dentro de
un intervalo de valores. Es decir, una variable continua semide uniformemente. Otra
manera de explicar lo que es una variable continua consiste en decir que, sin importar que
tan cerca puedan estar dos valores de una variable, es posible tericamente hallar otra
variable cuyo valor se pueda colocar entre ellos. Un ejemplo de variables continua es la
estatura humana. Sin tener en cuenta que tan prxima sea la estatura de dos personas,
es posible tericamente encontrar otra persona que sea ms alta que la ms baja y a la
vez ms baja que la ms alta de las dos.
Nuestra posibilidad de identificar a tal persona en la prctica puede dificultarse por las
limitaciones de los instrumentos de medida disponibles. Otras variables continuas pueden
ser aquellas que se miden con una escala de peso o de temperatura.
Variable discreta.
Cuando los valores que puede tomar una variable estn separados entre s por una
determinada cantidad, la variable se denomina discreta. Una caracterstica de la variable
discreta es la presencia de vacios o interrupciones entre los valores que se pueden
tomar. Como ejemplos de la variable discreta puede citarse, el nmero de admisiones en
un hospital durante un da determinado, el nmero de accidentes automovilsticos que se
producen dentro de los lmites de una ciudad durante un mes, el nmero de colonias de
bacterias en una placa de agar y el nmero de estudiantes de primer ao en un sistema
escolar determinado.
Variable cuantitativa.
Se dice que una variable, es una variable cuantitativa siempre que los valores que puede
asumir sean los resultados de medidas numricas. Ejemplos de variable cuantitativa son

la estatura, elpeso, la temperatura, el coeficiente intelectual, la presin sangunea, el


nmero de estudiantes de primer ao y el nmero de accidentes que se producen en
alguna regin geogrfica en un perodo de tiempo dado.
Variable cualitativa.
Hay muchos casos en que no es posible hacer medidas numricas. Muchas variables son
susceptibles nicamente de clasificacin. Por ejemplo la variable estado civil puede
recibir valores cualitativos de soltero, casado, divorciado, viudo etc. Si las entidades de
inters son estudiantes universitarios y si la variable de inters es curso la variable
puede asumir los valores cualitativos de primero, segundo, tercero, etc. Una variable
cuyos valores consisten en categoras de clasificacin se denomina variable cuantitativa.
Como la determinacin del valor de una variable cuantitativa se lleva a cabo por medio de
algn procedimiento de medicin, el resultado se denomina medida. Un grupo de tales
medidas recibe el nombre de datos de medida. Cuando las entidades se clasifican
teniendo en cuenta una variable cuantitativa, generalmente es necesario contar el nmero
de entidades que se pueden clasificar en cada una de las categoras. La informacin de
este tipo se denomina datos de conteo. Frecuentemente se utiliza la palabra observacin
para hacer referencia a un dato o medida de conteo.

CAPITULO II
6. NIVELES DE MEDICIN.
Nominal
Ordinal
De intervalo
De razn.
7. MEDIDAS DE TENDENCIA CENTRAL.
Media aritmtica.
Mediana.
Moda.
Ejercicios prcticos del tema 7
8. MEDIDAS DE DISPERCIN

Desviacin tpica.
Datos agrupados.
La varianza.Ejercicios prcticos tema 8
9. DISTRIBUCIN DE FRECUENCIAS Y REPRESENTACIN GRFICA.
Distribucin de frecuencias.
Representacin grfica.
Ejercicios prcticos tema 9
6. NIVELES DE MEDICIN.
La medicin puede definirse como la asignacin de nmeros a objetos y eventos de
acuerdo con ciertas reglas; la manera como se asignan esos nmeros determina el tipo
de escala de medicin (Stevens, 1946; Cohen y Cohen, 1975;Saris y Stronkhorst, 1984).
Esto conduce a la existencia de diferentes tipos de escalas, por lo que el problema se
transforma en explicitar a)las reglas para asignar nmeros, b)las propiedades
matemticas de las escalas resultantes, y c)las operaciones estadsticas aplicables a las
medidas hechas con cada tipo de escala.
Las propiedades del sistema numrico asociadas con las escalas de medicin son la
identidad, magnitud, igual intervalo y cero absoluto (Stevens, 1957): 1-Identidad: cada
nmero tiene un significado particular. 2-Magnitud: los nmeros tienen un orden inherente
ascendente o descendente. 3-Intervalos iguales: las diferencias entre nmeros en
cualquier punto de la escala son las mismas (la diferencia entre 10 y 20 es la misma que
entre 100 y 110). 4-Cero absoluto: el punto cero en la escala de medicin representa la
ausencia de la propiedad que se estudia.
A continuacin se presenta un resumen de las caractersticas, propiedades y aplicaciones
de cada una de las escalas mencionadas (Stevens, 1957; Cohen y Cohen, 1975; Saris,
1984)
Escala nominal. En esta escala las unidades observacionales (UO) se agrupan en clases
excluyentes segn determinada propiedad, con lo que sedefine una particin sobre el
conjunto de tales unidades. Los nmeros se usan como identificadores o nombres.
Cuando se estudia el desempleo de un pas y se incluye la variable sexo, se codifica
masculino como 1 y femenino como 2, por ejemplo; los nmeros 1 y 2 representan
categoras de datos: son simples identificadores y son completamente arbitrarios. La
operacin matemtica permitida es el conteo.
Escala ordinal: Surge a partir de la operacin de ordenamiento; en esta escala se habla
de primero, segundo, tercero. No se sabe si quien obtiene el primer puesto est cerca o

lejos del segundo puesto. Los valores de la escala representan categoras o grupos de
pertenencia, con cierto orden asociado, pero no una cantidad mensurable. La escala
ordinal tiene las propiedades de identidad y magnitud. Los nmeros representan una
cualidad que se est midiendo, y expresan si una observacin tiene ms de la cualidad
medida que otra UO. La distancia entre puntos de la escala no es constante: no se puede
determinar la distancia entre las categoras, slo es interpretable el orden entre sus
valores. Ejemplos: situacin socioeconmica, nivel educativo.
Escala de intervalos. Esta escala representa magnitudes, con la propiedad de igualdad de
la distancia entre puntos de escala de la misma amplitud. Aqu puede establecerse orden
entre sus valores, hacerse comparaciones de igualdad, y medir la distancia existente
entre cada valor de la escala. El valor cero de la escala no es absoluto, sino un cero
arbitrario: no refleja ausencia de la magnitud medida, por lo que las operaciones
aritmticas de multiplicacin y divisinno son apropiadas. Cumple con las propiedades de
identidad, magnitud e igual distancia. La igual distancia entre puntos de la escala significa
que puede saberse cuntas unidades de ms tiene una UO comparada con otra, con
relacin a cierta caracterstica analizada.
Escala de razn. Corresponde al nivel de medicin ms completo. Tiene las mismas
propiedades que la escala intervalos, y adems posee el cero absoluto. Aqu el valor cero
no es arbitrario, pues representa la ausencia total de la magnitud que se est midiendo.
Con esta escala se puede realizar cualquier operacin lgica (ordenamiento,
comparacin) y aritmtica. A iguales diferencias entre los nmeros asignados
corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio.
Ejemplos: longitud, peso, distancia, ingresos, precios.
A manera de conclusin es importante tener siempre presente la escala de medicin que
se est usando, pues no todos los procedimientos estadsticos son apropiados para
cualquier anlisis. En general, las variables estadsticas se clasifican en variables
continuas o cuantitativas y variables discretas o cualitativas, segn el nivel de escala en
que estn medidas. Las variables continuas se refieren a magnitudes medidas en escala
de intervalos o de razn, mientras que las variables discretas comprenden magnitudes
medidas en escalas de nivel nominal y ordinal.

7. MEDIDAS DE TENDENCIA CENTRAL.


Supngase que un determinado alumno obtiene 35 puntos en una prueba de matemtica.
Este puntaje, por s mismo tiene muy poco significado a menos que podamos conocer el

total de puntos queobtiene una persona promedio al participar en esa prueba, saber cul
es la calificacin menor y mayor que se obtiene, y cun variadas son esas calificaciones.
En otras palabras, para que una calificacin tenga significado hay que contar con
elementos de referencia generalmente relacionados con ciertos criterios estadsticos.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de
referencia para interpretar las calificaciones que se obtienen en una prueba.
Volviendo a nuestro ejemplo, digamos que la calificacin promedio en la prueba que hizo
el alumno fue de 20 puntos. Con este dato podemos decir que la calificacin del alumno
se ubica notablemente sobre el promedio. Pero si la calificacin promedio fue de 65
puntos, entonces la conclusin sera muy diferente, debido a que se ubicara muy por
debajo del promedio de la clase.
En resumen, el propsito de las medidas de tendencia central es:
Mostrar en qu lugar se ubica la persona promedio o tpica del grupo.
Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el
puntaje central o tpico.
Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms
grupos.
La media aritmtica: comnmente conocida como media o promedio. Se representa por
medio de una letra M o por una X con una lnea en la parte superior.
La mediana: la cual es el puntaje que se ubica en el centro de una distribucin. Se
representa como Md.
La moda: que es el puntaje que se presenta con mayorfrecuencia en una distribucin. Se
representa Mo.
De estas tres medidas de tendencia central, la media es reconocida como la mejor y ms
til. Sin embargo, cuando en una distribucin se presentan casos cuyos puntajes son muy
bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la
moda. (Porque dadas las caractersticas de la media, esta es afectada por los valores
extremos).
La media es considerada como la mejor medida de tendencia central, por las siguientes
razones:
Los puntajes contribuyen de manera proporcional al hacer el cmputo de la media.
Es la medida de tendencia central ms conocida y utilizada.

Las medias de dos o ms distribuciones pueden ser fcilmente promediadas mientras que
las medianas y las modas de las distribuciones no se promedian.
La media se utiliza en procesos y tcnicas estadsticas ms complejas mientras que la
mediana y la moda en muy pocos casos.

Cmo calcular, la media, la moda y la mediana


Media aritmtica o promedio
Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable
por la frecuencia total. En palabras ms simples, corresponde a la suma de un conjunto
de datos dividida por el nmero total de dichos datos.
Ejemplo 1:
En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
n = 6 (nmero total de datos)
La media aritmtica de las notas de esa asignatura es 4,8. Este nmero representa
el promedio.
Ejemplo 2:
Cuando se tienen muchos datos es ms conveniente agruparlos en una tabla de
frecuencias y luego calcular la media aritmtica. El siguiente cuadro con lasmedidas de 63
varas de pino lo ilustra.
Largo (en m)
Frecuencia absoluta
Largo por Frecuencia absoluta
5
10
5
.
10 = 50
6
15
6
.
15 = 90
7
20
7
.
20 = 140
8
12
8
.
12 = 96
9
6

6 = 54

Frecuencia total = 63
430

Se debe recordar que la frecuencia absoluta indica cuntas veces se repite cada valor,
por lo tanto, la tabla es una manera ms corta de anotar los datos (si la frecuencia
absoluta es 10, significa que el valor a que corresponde se repite 10 veces).
Moda (Mo)
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o
sea, cual se repite ms.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de
nias de un Jardn Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
Ejemplo 2:
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este conjunto
de valores no tiene moda.
Mediana (Med)
Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a
menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante
corresponde al nmero del caso que representa la mediana de la distribucin.
Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente.
Dicho en otras palabras, la Mediana corresponde al valor que deja igual nmero de
valores antes y despus de l en un conjunto dedatos agrupados.
Segn el nmero de valores que se tengan se pueden presentar dos casos:
Si el nmero de valores es impar, la Mediana corresponder al valor central de dicho
conjunto de datos.
Si el nmero de valores es par, la Mediana corresponder al promedio de los dos valores
centrales (los valores centrales se suman y se dividen por 2).
Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5, 8, 9, 10

El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.


Ejemplo 2:
El siguiente conjunto de datos est ordenado en forma decreciente, de mayor a menor, y
corresponde a un conjunto de valores pares, por lo tanto, la Med ser el promedio de los
valores centrales.
21, 19, 18, 15, 13, 11, 10, 9, 5, 3
Ejemplo 3:
En el grfico de barras (que tiene un nmero par de columnas) los valores centrales son
72 y 77, por lo tanto, la

8. MEDIDAS DE DISPERCIN
A pesar de la gran importancia de las medidas de tendencia central y de la cantidad de
informacin que aportan individualmente, no hay que dejar de sealar que en muchas
ocasiones esa informacin, no slo no es completa, sino que puede inducir a errores en
su interpretacin. Veamos algunos ejemplos.
Consideremos dos grupos de personas extrados como muestras respectivas de dos
poblaciones distintas: el primero est compuesto por 100 personas que asisten a la
proyeccin de una pelcula para nios, y el segundo por 100 personas elegidas entre los
asistentes a una discoteca juvenil.Pudiera ocurrir que, aun siendo las distribuciones de las
edades de ambos grupos muy distinta, la media y la mediana coincidieran para ambas.
(Da un ejemplo concreto en que esto ocurra).
Igualmente ocurre en este otro ejemplo. La caja de un kiosco registra las siguientes
entradas en miles de pesos, a lo largo de dos semanas correspondientes a pocas
distintas del ao.
1 semana
2 semana
10
30
20
40
30
50
50
50

60
60
80
60
100
60
350
350
La media y la mediana de ambas distribuciones coinciden (el valor de ambas es 50 en los
dos casos) y, sin embargo, las consecuencias que se podran derivar de una y otra tabla
son bien distintas.
Comprendemos pues, a la vista de estos ejemplos, la necesidad de conocer otras
medidas, aparte de los valores de centralizacin, que nos indiquen la mayor o menor
desviacin de cada observacin respecto de aquellos valores.
Las medidas de desviacin, variacin o dispersin que estudiaremos a continuacin son:
Rango o amplitud, desviacin media y desviacin tpica.
RANGO, AMPLITUD TOTAL O RECORRIDO
El rango se suele definir como la diferencia entre los dos valores extremos que toma la
variable. Es la medida de dispersin ms sencilla y tambin, por tanto, la que proporciona
menos informacin. Adems, esta informacin puede ser errnea, pues el hecho de que
no influyan ms de dos valores del total de la serie puede provocar una deformacin de la
realidad.
Comparemos, por ejemplo, estas dos series:
Serie 1: 1 5 7 7 8 9 9 10 17
Serie 2: 2 4 6 8 10 12 14 16 18
Ambas series tienen rango 16, pero estn desigualmenteagrupadas, pues mientras la
primera tiene una mayor concentracin en el centro, la segunda se distribuye
uniformemente a lo largo de todo el recorrido.
El uso de esta medida de dispersin, ser pues, bastante restringido.

DESVIACIN MEDIA
En teora, la desviacin puede referirse a cada una de las medidas de tendencia central:

media, mediana o moda; pero el inters se suele centrar en la medida de la desviacin


con respecto a la media, que llamaremos desviacin media.
Puede definirse como la media aritmtica de las desviaciones de cada uno de los valores
con respecto a la media aritmtica de la distribucin, y de indica as:

Ntese que se toman las desviaciones en valor absoluto, es decir, que la frmula no
distingue si la diferencia de cada valor de la variable con la media es en ms o en menos.
Ya se habr advertido que esta expresin sirve para calcular la desviacin media en el
caso de datos sin agrupar. Veamos un ejemplo:
Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviacin media de estos
valores.

2
-3
3
2
3
3
4
-1
1
4
-1
1
4
-1
1
5
0
0
6
1
1

7
2
2
8
3
3
8
3
3
DM = 1,8
Veamos ahora cmo se calcula la desviacin media en el caso de datos agrupados en
intervalos.

donde observamos que ahora las desviaciones van multiplicadas por las frecuencias de
los intervalos correspondientes.
Adems, las desviaciones son de cada centro, o marca de clase, a la media aritmtica. Es
decir,

Ejemplo: Para hallar la desviacin media de la siguiente tabla referida a las edades de los
100 empleados de una cierta empresa:
Clase
ni16-20
2
20-24
8
24-28
8
28-32
18
32-36
20
36-40
18
40-44
15

44-48
8
48-52
3
veamos cmo se procede:
Clase
ni
xm
ni xm
ni
16-20
2
18
36
16,72
33,44
20-24
8
22
176

24-28
8

28-32
18

32-36
20

36-40
18

40-44
18

44-48
8

48-52
3

100

DM = 6,09
La desviacin media viene a indicar el grado de concentracin o de dispersin de los
valores de la variable. Si es muy alta, indica gran dispersin; si es muy baja refleja un
buen agrupamiento y que los valores son parecidos entre s.
La desviacin media se puede utilizar como medida de dispersin en todas aquellas

distribuciones en las que la medida de tendencia central ms significativas haya sido la


media. Sin embargo, para las mismas distribuciones es mucho ms significativa la
desviacin tpica, que estudiaremos a continuacin, y eso hace que el uso de la
desviacin media sea cada vez ms restringido.

DESVIACIN TPICA
Es sin duda la medida de dispersin ms importante, ya que adems sirve como medida
previa al clculo de otros valores estadsticos.
La desviacin tpica se define como la raz cuadrada de la media de los cuadrados de las
desviaciones con respecto a la media de la distribucin. Es decir,

para datos sin agrupar, o bien:

Clculo de la desviacin tpica para datos no agrupados en clases


Veamos la frmula anterior aplicada a un caso concreto.
Hallar la desviacin tpica de la serie: 5, 8, 10, 12, 16.
X
2
5
-5,2
27,04
8
-2,2
4,84
10
-0,2
0,04
12
1,8

3,24
16
5,8
33,64Primero hallamos = 10,2
luego S =
Clculo de la desviacin tpica para datos agrupados en clases y agrupados por
frecuencias
Mtodo largo: Se aplica la siguiente frmula

donde y f es la frecuencia absoluta de cada intervalo.


Mtodo abreviado o corto: La frmula a utilizar es:

donde:
I: amplitud de la clase
D: distancia en clases desde cada una en concreto a la clase que contiene a la media
supuesta A.
Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen as:
Clases
F
150 155
155 160
160 165
165 170
170 175
175 180
180 185
185 190
190 195
195 200
3
6
12

18
25
17
10
7
4
1
103
Resp: S = 9,56
9. DISTRIBUCIN DE FRECUENCIAS Y REPRESENTACIN GRFICA.
Cuando se rene gran cantidad de datos primarios es til distribuirlos en clases y
categoras y determinar las frecuencias de las clases, o sea, el nmero de elementos que
pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente
con las frecuencias de clases se denomina distribucin de frecuencias
El caso que se describe a continuacin, variables discretas se denomina distribucin por
conteo de valores individuales. Supongamos que un determinado colectivo, representado
por la variable estadstica Xi, que para mayor sencillez consideraremos como
unidimensional; sean los datos de esta variable (representativo cada uno de ellos de un
suceso) X1, X2, , Xn (supuesto que sean n los valores de la variable considerada.)
Definiremos como frecuencia de un dato el nmero de veces que este aparece en el
colectivo; consecuentemente, si unavariable estadstica toma r valores, cada uno de los
cuales puede repetirse un cierto nmero de veces, podramos decir que el nmero de
datos representado por la variable seran N, siendo N la suma de las respectivas
frecuencias de cada dato (N=Xi).
Este valor N ser denominado como frecuencia total, mientras que la frecuencia de cada
dato recibir el nombre de frecuencia absoluta o simplemente frecuencia (fi). La
frecuencia absoluta nos habla del nmero de veces que un dato aparece en un
colectivo, ms ello no nos dice demasiado en orden al establecimiento de comparaciones
sobre la importancia de este dato. Para obtener una idea de la importancia que un dato
posee en el seno de un colectivo, puesto que no es suficiente concepto de frecuencia, se
utiliza el concepto frecuencia relativa, que se definir como: el coeficiente entre la
frecuencia absoluta del dato considerado y la frecuencia total (fr=fi/Xi).
Para efectos prcticos, asumiremos las siguientes definiciones de frecuencias:

Frecuencia absoluta: es el nmero de veces que aparece en la muestra dicho valor de la


variable y se representa por fi.
Frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamao de la
muestra. La denotaremos por fri
Frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay que
tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable.
En otro caso no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta
acumulada de un valor de la variable, es el nmero de veces que ha aparecido en la
muestra un valor menor o igual queel de la variable y lo representaremos por fa, se puede
acumular, en la tabla estadstica) en orden ascendente (fa) o descendente (fa).
Frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el
cociente entre la frecuencia absoluta acumulada dividido por el tamao de la muestra (N)
y la denotaremos por fra.

Resumiendo lo expuesto, si Xi es un valor de la variable, podemos representar por fi a su


frecuencia y por fi/Xi a su frecuencia relativa (siendo Xi=N o la frecuencia total). Para el
conjunto de los valores de la variable Xi tendramos, as la tabla #1, compresiva de
la informacin sobre dicha variable, a travs de las respectivas frecuencias:
Tabla #1: Variables Discretas
Valores de la variable Xi
(datos)
frecuencias absolutas
fi
frecuencias relativas
fi/N
X1
f1
f1/N
X2
f2
f2/N

Xn

Fn
fn/N
Donde:
N=fi y fi/N=1
Otro es el caso de las clases representadas en forma de intervalos, variables continuas,
llamados intervalos de clases que poseen extremos llamados lmite inferior y lmite
superior, Un intervalo se dice que es abierto o no cerrado, por un extremo si no contiene
el lmite correspondiente.
La longitud, tamao o amplitud de un intervalo de clases (C) es la diferencia entre los
limites superior e inferior (C=lim sup lim inf). El Recorrido (R) es la diferencia entre el
dato mayor y el menor del conjunto da datos en estudio (R=Xn X1)
En el caso de variables continuas ser necesario fijar intervalos de frecuencias para llegar
a un resumen efectivo de la informacin original. A menudo es necesariorepresentar una
clase, o ms particularmente, un intervalo por un nico valor, este representar a todo el
intervalo y se denominar marca de clases. Matemticamente el punto medio de cada
intervalo corresponde a lo que denominamos marca de clase, se denotar por Xi, y
constituir el valor representativo de cada intervalo. El nmero de observaciones que
correspondan a cada intervalo se denominar frecuencias absolutas.
Tabla #2: Variables Continuas
Intervalos
(C)
Marcas de Clases
Xi
Frecuencias Absolutas
fi
X1-X2
X1
f1
X2-X3
X2
f2

Xn-1-Xn
Xn
Fn
Donde
N = fi = Nmero de observaciones
C = X X" = Amplitud del intervalo
Por ltimo, en el caso de variables no mensurables, dicha tabla adoptar una forma como
la siguiente:
Tabla #3: Variable Ordinales
Variable
Frecuencias
Caracterstica A
Fa
Caracterstica B
Fb

Caracterstica Z
Fz
Reglas Generales para construir las distribuciones de frecuencias por intervalos
A = ( X1, X2, , Xn )
1. Efectuar el arreglo ordenado (Ascendente o Descendente) de la poblacin o muestra
2. Obtener la frecuencia absoluta mediante la tabulacin o conteo de los datos
(homogenizar los datos)
R = (valor mayor valor menor) = Xn X1
3. Encontrar el rango o recorrido (R) de los datos:
4. Encontrar el nmero de clases o intervalos de clases (K). El nmero de clases debe ser
tal que se evite el detalle innecesario, pero que no conduzca a la prdida de ms
informacin de la que puede ser convenientemente ignorada. Para este clculo se utiliza
la formula de Sturges
K = 1 + 3.322(log. N)
5- Determinar la amplitud dela clase ( C ):
R
C = -------K
Nota: el resultado siempre se aproxima al siguiente entero si excede al nmero entero

obtenido, no importa el monto de la fraccin excedida al entero


C = se lee "se aproxima a"
6. El dato menor (X1) ser el lmite inferior de la primera clase. A l se le suma C y se
obtiene el lmite superior de la primera clase que tambin ser el lmite inferior de la
segunda clase. Luego se suma nuevamente C y se obtiene el lmite superior del segundo
intervalo e inferior del tercero. Y as sucesivamente hasta que el lmite superior
corresponda o supere ligeramente el valor mayor ( Xn ), la cantidad de clases obtenidas
deber corresponder con el nmero K calculado mediante la frmula de Sturges.
7. Una vez construidos los intervalos se calculan, mediante tabulacin de acuerdo a los
lmites inferiores y superiores de las clases, las frecuencias absolutas, relativas,
porcentuales y acumuladas correspondientes.
8. Con los datos obtenidos se procede a construir la tabla de distribucin de frecuencia.

Tabla de distribucin de frecuencias.

Una de los primeros pasos que se realizan en cualquier estudio estadstico es la


tabulacin de resultados, es decir, recoger la informacin de la muestra resumida en una
tabla, que denominaremos distribucin de frecuencias, en la que cada valor de la variable
se le asocian determinados nmeros que representan el nmero de veces que ha
aparecido, su proporcin con respecto a otros valores de la variable, etc.
Por tanto, llamaremos distribucin de frecuencias a un agrupamiento de datos
en clases acompaada de susfrecuencias: frecuencias absolutas, frecuencias relativa o
frecuencia porcentuales. En caso de que las variables estn al menos en escala ordinal
aparecen opcionalmente las frecuencias acumuladas absolutas, y frecuencias
acumuladas porcentuales. Las distribuciones de frecuencias varan en dependencia si
corresponden a una variable discreta o a una variable continua.

Ejemplo #1: Variable Continua:


La tienda CABRERAS Y ASOCIADOS estaba interesada en efectuar un anlisis de
sus cuentas por comprar. Uno de los factores que ms interesaba a la administracin de
la tienda era el de los saldos de las cuentas de crdito. Se escogi al azar una muestra
aleatoria de 30 cuentas y se anot el saldo de cada cuenta (en unidades monetarias)
como sigue:
77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99
43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97
32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68

Solucin:
1. A= ( 7.42, 8.15, , , , 90.99, 93.91 )
donde: X1 = valor mnimo = 7.42
Xn= valor mximo = 93.91
2. Efectuar el arreglo ordenado de la poblacin o muestra:
R = valor mayor valor menor = Xn X1 = 93.91 7.42 = 86.49
3. Encontrar el rengo o recorrido de los datos: "R"
K=1+3.322(log N)
Nota: en el ejemplo en estudio N=30 por cuanto que son 30 clientes en la muestra:
K = 1 + 3.322 (log 30)
= 1 + 3.322 (1.477) el log fue obtenido segn calculadora
= 1+ 4.9069
= 5.9069 ~6 aproximado al siguiente entero
4. Encontrar en nmero de clases "K" , segn la frmula de Sturges:
5. Determinar la amplitud de la clase: "C"
Nota: obsrvese que se va a trabajar con una cifra significativa mscmoda, o sea como
los datos estn dados en centsimos, se calculo C hasta los milsimos para evitar que
algn dato coincida con el lmite de clases
Clases
P.M.
Xi
fi
fr
fa
fa
fra
fra
7.420 21.835
14.628
10
0.33
10
30
0.33
1.00
21.835 36.250
29.043
4
0.13

14
20
0.46
0.67
36.250 50.665
43.458
5
0.17
19
16
0.63
0.54
50.665 65.080
57.873
3
0.10
22
11
0.73
0.37
65.080 79.495
72.288
3
0.10
25
8
0.83
0.27
79.495 93.910
86.703
5
0.17
30
5
1.00
0.17
Total
XXX
30
1.00

XXX
XXX
XXX
XXX
Simbologa utilizada:
XI = Punto medio o marca de clases
fi = frecuencia absoluta
fr = frecuencia relativa
fa = frecuencia absoluta acumulada descendente
fa = frecuencia absoluta acumulada ascendente
fra = frecuencia relativa acumulada descendente
fra = frecuencia relativa acumulada ascendente
Nota:
i. Obsrvese que el lmite inferior de la primera clase es el valor mnimo ( X1=7.42 ) y el
lmite superior es el resultado de X1+C = 7.42+14.415 = 21.835.
ii. El lmite inferior de la siguiente clase es igual al lmite superior de la clase anterior y el
lmite superior es el resultado de adicionarle nuevamente la amplitud de la clase ( C ).
iii. Obsrvese que el lmite superior de la ltima clase es igual al valor mayor ( Xn=93.91 )

Representaciones Grficas de la Distribucin de Frecuencias


a. Los Cuadros estadsticos:
La estadstica es una disciplina que nos ensea a organizar los datos recogidos para
poder analizar sus caractersticas y posteriormente inferir, a partir de las muestras
tomadas, las caractersticas de la poblacininvestigada. Los cuadros o tablas
corresponden a arreglos sistemticos de los datos por filas y columnas y son un buen
complemento del texto en los informes
El primer procedimiento estadstico consiste en tabular los datos segn el tipo de escala
de medicin utilizada. La tabulacin de los datos conlleva a representar la informacin a
travs de tablas que de forma general contiene las siguientes partes fundamentales:
1. Numeracin (siempre que se presenten dos o ms cuadros)
2. Ttulo: es la descripcin que precede al cuadro, la cul deber estar redactada en forma
breve y clara, de tal manera que exprese su contenido, siguiendo el ordenamiento del
mismo. Es necesario abarcar las caractersticas: Qu, Dnde, Cmo y Cundo
3. Encabezamiento: se refiere al nmero de atributos o variables que se quieren
representar en el cuadro y se anotan como denominaciones de las columnas y

subcolumnas; puede ser unidimensional, bidimensonial o multidimensional. Los ttulos de


las columnas van en maysculas y los subttulos en minsculas
4. Cuerpo: es el conjunto de columnas y lneas que contiene el cuadro en orden vertical y
horizontal, donde se colocan los datos sobre los hechos observados
5. Pie: se refiere a la informacin adicional necesaria a saber: notas, llamadas, fuentes de
informacin y otras. Se anotan en el espacio debajo de la lnea inferior que limita el
cuerpo del cuadro.
Los Grficos Estadsticos:
El grfico es quizs el auxiliar ms valioso y utilizado para expresar datos estadsticos,
este elemento no le aade novedad a las tablas o cuadros estadsticos, es de fcil
comprensin yaccesible a un nmero mayor de usuarios. El grfico adems de expresar
visualmente los hechos ms importantes de la informacin numrica, permite una mejor y
ms fcil comprensin y ahorra tiempo y esfuerzo en el anlisis de datos estadsticos al
facilitar su apreciacin visual en forma conjunta:
Histogramas de frecuencias:
Un histograma es un grfico que sirve para representar una distribucin de frecuencias.
Este grfico est formado por un conjunto de rectngulos (caso de variables continuas)
que tienen como base un eje horizontal (generalmente el eje de las abscisas o de las X), y
como centro los puntos medios de las clases. Los anchos de las clases y las reas de los
rectngulos son proporcionales a las frecuencias de las clases. En el caso de las
variables discretas el grfico consiste de un conjunto de barras verticales en lugar de
rectngulos, hallndose cada barra sobre la observacin respectiva y con una altura
proporcional a la frecuencia de la observacin

Polgono de frecuencias:
El polgono de frecuencias es un grfico formado por lneas quebradas, que tiene los
centros de las clases representadas en un eje horizontal (eje de las X) y las frecuencias
de las clases en un eje vertical (eje de las Y). La frecuencia correspondiente a cada centro
de clase se seala mediante un punto y luego los puntos consecutivos se unen por lneas
rectas. Del correspondiente histograma se puede lograr el polgono de frecuencia uniendo
los puntos medios de las bases superiores de cada rectngulos mediante lneas rectas.
Ojivas:
Las ojivas se refieren a los grficos que se construyen utilizando unadistribucin
acumulativa de frecuencias, el orden de acumulacin se aplica al cuadro de distribucin
de frecuencia y puede ser descendente (fa, fra) o ascendente (fa, fra). La figura que
se forma al unir los puntos del polgono de frecuencias acumulativas es lo contrario del

orden anunciado (por ejemplo si se utiliz el orden descendente en la acumulacin de los


datos en el cuadro, la ojiva resulta ser ascendente).

CAPITULO III

10. INTRODUCCIN A LA PROBABILIDAD


Concepto de probabilidad.
Enfoques de la probabilidad.
Experimentos aleatorios.
Ejercicios prcticos tema 10

10. INTRODUCCIN A LA PROBABILIDAD


Muchos de los eventos que ocurren en la vida diaria no pueden ser predichos con
exactitud desde antes por diversas razones, pues la mayora de los hechos estn influidos
por factores externos. Adems, existen aquellos sucesos que estn directamente influidos
por el azar, es decir, por procesos que no se est seguro de lo que va a ocurrir. Sin
embargo, la probabilidad nos permite acercarnos a esos sucesos y estudiarlos,
ponderando las posibilidades de su ocurrencia y proporcionando mtodos para tales
ponderaciones.
Precisamente, algunos de esos mtodos proporcionados por la probabilidad nos llevan a
descubrir que algunos sucesos tienen una mayor o menor probabilidad de ocurrir que la
ponderacin asignada a travs del sentido comn. Nuestros sentidos, la informacin
previa que poseemos, nuestras creencias o posturas, nuestras inclinaciones, son algunos
de los factores que intervienen para no permitirnos hacerponderaciones reales y
sistemticas. La probabilidad nos permitir estudiar los eventos de una manera
sistemtica y ms cercana a la realidad, retribuyndonos con informacin ms precisa y
confiable y, por tanto, ms til para las disciplinas humanas.
Anlisis combinatorio
En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una situacin
dada se convierte en algo difcil de lograr o, simplemente, tedioso. El anlisis
combinatorio, o clculo combinatorio, permite enumerar tales casos o sucesos y as
obtener la probabilidad de eventos ms complejos.
En el caso de que existan ms de un suceso a observar, habra que contar el nmero de
veces que pueden ocurrir todos los sucesos que se desean observar, para ello se utiliza el
principio fundamental de conteo:

Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2 formas,


entonces el nmero de formas en que ambos sucesos pueden presentarse en ese orden
es de n1n2.
En otras palabras, basta multiplicar el nmero de formas en que se pueden presentar
cada uno de los sucesos a observar.
Este principio nos remite automticamente al factorial de un nmero natural, que se puede
pensar como una funcin con dominio los nmeros naturales junto con el cero
y codominio los nmeros naturales. El factorial de un nmero n, denotado n!, se define
como:

En el anlisis combinatorio se definen las permutaciones, con o sin repeticin, y las


combinaciones.
Permutaciones (u ordenaciones) con repeticin
Las permutaciones son tambin conocidas como ordenaciones, y de hecho toman este
nombre porque son ordenacionesde r objetos de n dados. En este curso las
representaremos como ORnr nORr.
Por ejemplo:
Sea A={a,b,c,d}, cuntas "palabras" de dos letras se pueden obtener?
Se pide formar permutaciones u ordenaciones de 2 letras, cuando el total de letras es 4.
En este caso r=2 y n=4.
Las "palabras" formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db, dc, dd.
En total son 16.
En general, si se toman r objetos de n, la cantidad de permutaciones u ordenaciones con
repeticin obtenidas son:
ORnPr = nORr = n r
Permutaciones (u ordenaciones) sin repeticin
En este caso, a diferencia del anterior, se realizan ordenaciones de r objetos
de n dados atendiendo a la situacin de cada objeto en la ordenacin. Su representacin
ser Pnr nPr.

Por ejemplo:
Sea el mismo conjunto A={a,b,c,d}, cuntas ordenaciones sin repeticin se pueden
obtener?
Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total.

En general, si se toman r objetos de un total de n, la cantidad de permutaciones


Pnr = nPr =
Combinaciones
Es una seleccin de r objetos de n dados sin atender a la ordenacin de los mismos. Es
decir, es la obtencin de subcojuntos, de r elementos cada uno, a partir de un conjunto
inicial de nelementos. La denotaremos con Cnr, nCr .
Por ejemplo:
Si tomamos el mismo conjunto A={a,b,c,d}, cuntos subconjuntos de 2 elementos cada
uno se pueden obtener?
Hacindolos se obtienen: {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}. Son seis los subconjuntos.
En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el
nmero decombinaciones obtenidas son:
Cnr = nCr =
o, que es lo mismo,
Cnr = nCr =
Eventos
Cuando se realiza un experimento, que es cualquier proceso que produce un resultado o
una observacin, se van a obtener un conjunto de valores. A este conjunto de valores que
puede tomar una variable se le denomina espacio muestral.
Por ejemplo:
Si se tiene un dado cualquiera, el espacio muestral (EM) es EM={1,2,3,4,5,6}.
Si existen ms de una variable, el espacio muestral est formado por las combinaciones
de valores de cada una de las variables.
Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina
un evento, y si ste consta de un solo elemento entonces es un evento elemental.
Como se puede uno imaginar, existen eventos que siempre, no importa el nmero de
experimentos o su situacin, ocurren, y en cambio existen otros que nunca ocurren. Los

que siempre ocurren son los eventos seguros, y los que nunca son los eventos
imposibles.
Sin embargo, no todos los resultados son al azar, pues si un experimento es cualquier
proceso entonces los resultados pueden tomar cualquier tipo de valor. Por esta razn, se
define como experimento aleatorio al proceso en el que se pueden predecir con certeza la
ocurrencia de sus eventos, con excepcin del seguro o del imposible. Hay que hacer la
observacin que esta definicin habla en trminos generales y no especficamente sobre
algn experimento en particular.
A aqulla variable que est asociada a un experimento de este tipo se le
denomina variable aleatoria.
En cambio, a un experimento no aleatorio se le denomina experimento
determinstico.Cuando hablamos de varios eventos dentro del mismo experimento se
pueden dar varios casos.
Si dos o ms eventos no pueden ocurrir simultneamente, se llaman eventos mutuamente
excluyentes, es decir, que la interseccin de ambos eventos es vaca.
Por otro lado, en ocasiones un evento o ms eventos dependen de otro evento previo, es
decir, un evento A ocurre dado que ocurri un evento B. Si existe este tipo de relacin
entre eventos se dice que son eventos dependientes o condicionados (el
evento A depende del evento B, o el resultado del evento A est condicionado al resultado
del evento B). Por otro lado, si no existe tal relacin entre eventos se dice que
son eventos independientes. Los criterios de dependencia o de independencia se
definirn ms adelante, en trminos de probabilidad condicional.

Probabilidad de eventos
Para calcular la probabilidad de eventos es necesario que stos se comporten de una
manera ms o menos estable. Precisamente, se echa mano de la regularidad estadstica,
que es la propiedad de los fenmenos aleatorios, y que consiste en que al aumentar el
nmero de repeticiones de un experimento en condiciones prcticamente constantes,
la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo.
Sin embargo, al momento de definir la probabilidad de un evento podemos tomar en
cuenta los siguientes criterios:
1. La probabilidad subjetiva de un evento se la asigna la persona que hace el estudio, y
depende del conocimiento que esta persona tenga sobre el tema. Precisamente por su

carcter de subjetividad no se considera con validez cientfica, aunque en lavida diaria es


de las ms comunes que se utilizan al no apoyarse ms que en el sentido comn y los
conocimientos previos, y no en resultados estadsticos.
2. La probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias
relativas de ocurrencia del evento de acuerdo a la regularidad estadstica. Esta definicin
sera la ms real, pero proporciona probabilidades aproximadas, es decir, proporciona
estimaciones y no valores reales. Adems, los resultados son a posteriori, pues se
necesita realizar el experimento para poder obtenerlo.
3. La probabilidad clsica de un evento E, que denotaremos por P(E), se define como el
nmero de eventos elementales que componen al evento E, entre el nmero de eventos
elementales que componen el espacio muestral:

Es la definicin ms utilizada porque supone de antemano, y se necesita como requisito


indispensable, que todos los eventos elementales tienen la misma probabilidad de ocurrir.
Axiomas de la probabilidad
Recordemos primero que las frecuencias relativas de una distribucin tenan las
siguientes propiedades:
1. Las frecuencias relativas son mayores o iguales que cero.
2. La frecuencia relativa del espacio muestral es igual a la unidad.
3. Si dos eventos son mutuamente excluyentes, es decir que no ocurren
simultneamente, entonces la frecuencia relativa de su unin es la suma de las
frecuencias relativas de cada uno.
Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definicin ya
expuesta, es la frecuencia relativa cuando se aumenta el tamao de la muestra, se tienen
lo siguiente.
Si E es un eventode un espacio muestral S y P(E) es la probabilidad de E, entonces se
satisfacen los axiomas de la probabilidad:
1. 0 P(E) 1.
2. P(S) = 1.
3. Si E1, E2, ... , En son eventos mutuamente excluyentes, entonces
Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad de
eventos.

Posibilidades y probabilidades
Se habla muy comnmente en sitios de apuestas, como en las autdromos o hipdromos,
de que "las apuestas a tal o cual participante es de x a y", es decir, que las posibilidades
de que gane es de x a y. Esta manera de expresarse se refiere al uso de razones.
En trminos generales, la posibilidad de que ocurra un evento se determina mediante la
razn de la probabilidad de que ocurra a la probabilidad de que no ocurra.
Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las
posibilidades de que ocurra son x a y, es decir
Tales que x y y son enteros positivos.
Por ejemplo: Si se tiran dos monedas normales (no trucadas), la probabilidad de que las
dos monedas caigan cara es de . Esto quiere decir si alguien apuesta a que las dos
monedas no caen simultneamente en cara, la posibilidad de ganar la apuesta es de
es decir, 3 a 1.
Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento,
entonces se acostumbra mencionar las posibilidades en contra del evento.
Por ejemplo: Si se tira un dado no trucado, sabemos que la probabilidad de obtener un
cuatro es 1/6, es decir que la posibilidad de obtener un cuatro es de 1 a 6; pero se
acostumbra decir que las posibilidades en contra, esto es, de no obtener un cuatroes de 6
a 1.
Inversamente, en el caso de tener las posibilidades de un evento, entonces es fcil
obtener su probabilidad, pues si la posibilidad de un evento es de x a y, entonces la
probabilidad p de que ocurra tal evento es

Por ejemplo: En la Copa Mundial de Futbol Francia 1998 se deca que el equipo mexicano
tena una posibilidad de 1 a 75 de llegar a ser el campen del torneo.
Si se desea encontrar la probabilidad de que el equipo mexicano llegase a ser campen,
entonces se tiene que
es la probabilidad de que ocurriese el evento.
Esto tiene la ventaja de que permite, en combinacin con el tercer axioma de la

probabilidad, medir la confiabilidad que tienen las opiniones de las personas sobre las
posibilidades que le asignan a algunos eventos. Esto quiere decir que el clculo de las
probabilidades de dos eventos mutuamente excluyentes a partir de las posibilidades
otorgadas de manera subjetiva resulta como un criterio de consistencia.

Por ejemplo: Un criminlogo piensa que las posibilidades de que en la prxima semana la
cantidad de delitos en una ciudad aumente con respecto a la anterior es de 5 a 2, de que
sea la misma cantidad de delitos es de 1 a 3 y las posibilidades de que aumente la
cantidad o sea la misma es de 7 a 4.
Si se desea saber si son consistentes las probabilidades correspondientes habra que
hacer los clculos.
Las probabilidades de aumente la cantidad de delitos, sea igual la cantidad de delitos, y
de que aumente o sea igual la cantidad de delitos es, respectivamente, de
y dado que (como son eventos mutuamente excluyentes) no es lo mismo que 7/11,
entonceslos criterios del criminlogo pueden ser cuestionados.
Propiedades de la probabilidad de eventos no elementales

Cuando se tienen eventos elementales no existe mucho problema en el sentido del


clculo de las probabilidades, pues basta con una contabilizacin o el uso directo
del clculo combinatorio. Pero en el caso de eventos no elementales, que son los
compuestos por ms de un evento elemental, el proceder de manera anloga resulta muy
complejo y las operaciones pueden sobrepasar la capacidad de clculo existente. Sin
embargo, utilizando los axiomas de la probabilidad y las siguientes propiedades, se
podrn expresar las probabilidades de estos eventos en trminos de los eventos
elementales que lo componen, siempre y cuando se conozcan las probabilidades de
stos.
Veamos la probabilidad de una unin de eventos, la cual la podremos calcular de la
siguiente manera:
Propiedad 1. Si A y B son dos eventos, la probabilidad de que ocurra A o B es igual a la
suma de las probabilidades de ocurrencia de A y de B, menos la probabilidad de que
ocurran A y B simultneamente. Es decir,
P(AB) = P(A) + P(B) - P(AB)

Ahora, si el caso es que los eventos sean mutuamente excluyentes se tiene:


Propiedad 2. Si dos eventos, A y B, son mutuamente excluyentes entonces la probabilidad
de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia de A y de B.
Es decir
P(AB) = P(A) + P(B)
Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad del
complemento de un evento E, que denotaremos como ~E:
Propiedad 3. Si E es un evento y ~E su complemento, entoncesP(~E) = 1 - P(E)
Retomando los conceptos de eventos dependientes o condicionales, se va a definir
la probabilidad condicional como sigue:
Propiedad 4. La probabilidad de que ocurra un evento A dado que ocurri el evento B (el
evento A depende del evento B), denotado P(A|B), es:
Hay que notar que esta propiedad no es conmutativa, situacin que s ocurre con la
probabilidad de unin o la interseccin de eventos, por lo que no hay que confundir P(A|B)
y P(B|A).
Finalmente, el criterio para la independencia de eventos queda como sigue:
Propiedad 5. Dos eventos A y B son independientes si y slo si
P(A|B) = P(A) y P(B|A) = P(B)
o, que es lo mismo:
P(AB) = P(A) P(B)
BIBLIOGRAFA
CABALLERO, Wilfredo Introduccin a la Estadstica
Serie Libros y Materiales Educativos N 28
I edicin. San Jos, Costa Rica
IICA, 1981

CARRASQUILLA E. Pedro Manual para la confeccin de grficos estadstico


DEC-CGR, Direccin de Estadsticas y Censos
Panam. Repblica de Panam.
DEC-CGR Manual para la elaboracin y publicacin de
Cuadros estadsticos (tercera edicin)
Direccin de estadstica y Censos.
Panam. Repblica de Panam.
NEZ del Benavente Estadstica bsica para planificacin. 6ta.edicin
Arturo Siglo XX! Editores S.A,
Mxico. 1977

ALLEN L. Webster, Estadstica Aplicada a los Negocios y la Economa.


Ed. McGraw Hill. Mxico
3 Edicin, 2000.
SPIEGEL, Murray R. Estadstica.
Ed. McGraw-Hill. Mxico,
3 Edicin, 2002.
CASTILLO Padilla J. Gmez Arias J. Estadstica Inferencial Bsica
Ed. Iberoamericana, 1998.

También podría gustarte