ESTADISTICA Carpeta

IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
ESTADISTICA
INTRODUCCION: QUE ES LA ESTADISTICA
¿Cuál es la definición de estadística? Nos topamos con ella en el lenguaje cotidiano. En

realidad, posee dos significados: en su acepción más común, la estadística se refiere a
información numérica. Algunos ejemplos son el sueldo inicial de los graduados universitarios,
el número de muertes que provocó el alcoholismo el año pasado, el cambio en el promedio
industrial Dow Jones de ayer a hoy y la cantidad de cuadrangulares conectados por los
Cachorros de Chicago durante la temporada 2010. En estos ejemplos las estadísticas refieren
un valor o un porcentaje.
Todos éstos constituyen ejemplos de estadísticas. Una colección de información numérica
recibe el nombre de estadísticas.
A menudo la información estadística se presenta en forma gráfica, la cual es útil porque capta
la atención del lector e incluye una gran cantidad de información.
Como verá, la estadística tiene un significado mucho más amplio que la simple recolección
y publicación de información numérica. Definimos a la estadística como:
ESTADÍSTICA: Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de
propiciar una toma de decisiones más eficaz.
TIPOS DE ESTADISTICAS
Por lo general, el estudio de la estadística se divide en dos categorías: la estadística descriptiva
y la estadística inferencial.
ESTADISTICA DESCRIPTIVA
Es la ciencia que “recoge, organiza, presenta, analiza… datos”. Esta parte de la estadística
recibe el nombre de estadística descriptiva.
Una masa de datos desorganizados —como el censo de población, los salarios semanales de
miles de programadores de computadoras y las respuestas de 2 000 votantes registrados para
elegir presidente de Estados Unidos— resulta de poca utilidad. No obstante, las técnicas de la
estadística descriptiva permiten organizar esta clase de datos y darles significado.
Los datos se ordenan en una distribución de frecuencia.

Se emplean diversas clases de gráficas para describir datos.
Las medidas específicas de localización central, como la media, describen el valor central de un
grupo de datos numéricos. Para describir la proximidad de un conjunto de datos en torno al
promedio se emplean diversas medidas estadísticas.
ESTADISTICA INFERENCIAL
El segundo tipo es la estadística inferencial, también denominada inferencia estadística. El
principal interés que despierta esta disciplina se relaciona con encontrar algo relacionado con
una población a partir de una muestra de ella. Por ejemplo, una encuesta reciente mostró que
1
AGUIRRE WALTER
FERNANDEZ YANINA
sólo 46% de los estudiantes del último grado de secundaria podían resolver problemas que
incluyeran fracciones, decimales y porcentajes. Además, sólo 77% de los alumnos de último
año de secundaria pudo sumar correctamente el costo de una ensalada, una hamburguesa,
unas papas fritas y un refresco de cola, que figuraban en el menú de un restaurante ya que
estas son inferencias relacionadas con una población (todos los estudiantes de último grado de
secundaria), basadas en datos de la muestra, se trata de estadística inferencial .
Se podría considerar a la estadística inferencial como la mejor conjetura que es posible
obtener del valor de una población sobre la base de la información de una muestra.
Preste atención a las palabras población y muestra en la definición de estadísti ca inferencial.

Con frecuencia hacen referencia a la población de 308.8 millones de personas que viven en
Estados Unidos o a la población de 1 310 millones de habitantes de China.
No obstante, en estadística, la palabra población posee un significado más amplio. Una
población puede constar de individuos —como los estudiantes matriculados de la Universidad
Estatal de Utah, los estudiantes de Contabilidad 201 o los presidentes de las compañías de
Fortune 500—.
También puede consistir en objetos, tales como las llantas Cobra G/T producidas en Cooper
Tire and Rubber Company en la planta de Findlay, Ohio, etc. De esta manera, desde una
perspectiva estadística, una población no siempre tiene que ver con personas.
Con el objeto de inferir algo sobre una población, lo común es que tome una muestra de ella.
MUESTRA: Porción o parte de la población de interés.
¿Por qué tomar una muestra en lugar de estudiar a cada miembro de la población? Una
muestra de votantes registrados se hace necesaria en virtud de los costos prohibitivos de
ponerse en contacto con millones de electores antes de una elección. En la práctica resulta
imposible que unos cuantos biólogos marinos capturaren y rastreen a todas las focas en el
océano. La toma de muestras para aprender algo sobre una población es de uso frecuente en
administración, agricultura, política y acciones de gobierno, etc.
2
AGUIRRE WALTER
FERNANDEZ YANINA
EL MUESTREO
MUESTREO
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los
elementos de una población), se selecciona una muestra, entendiendo por tal una parte
representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica
es determinar que parte de una población debe examinarse, con la finalidad de hace r
inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la que se reproduzca
de la mejor manera los rasgos esenciales de dicha población que son importantes para la
investigación. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población, es decir ejemplificar las características
de ésta.
Los errores más comunes que se pueden cometer son:

1.- Hacer conclusiones muy generales a partir de la observación de sólo una parte de la
Población, se denomina error de muestreo.
2.- Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se
cómo la muestra. Error de Inferencia.
En la estadística se usa la palabra población para referirse no sólo a personas sino a todos los
elementos que han sido escogidos para su estudio y el término muestra se usa para describir
una porción escogida de la población.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y
métodos de muestreo no probabilísticos.
I. Muestreo probabilístico
Los métodos de muestreo probabilísticos son aque llos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las
posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos
métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída
y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos
encontramos los siguientes tipos:
1.- Muestreo aleatorio simple:

El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la
población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de
números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se
eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.
3
AGUIRRE WALTER
FERNANDEZ YANINA
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la
población que estamos manejando es muy grande.
2.- Muestreo aleatorio sistemático:

Este procedimiento exige, como el anterior, numerar todos los elementos de la población,
pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número
aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los
que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k,
siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k=
N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población
ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos
introducir una homogeneidad que no se da en la población. Imaginemos que estamos
seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones
y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre
seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los
dos sexos.
3.- Muestreo aleatorio estratificado:

Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y
suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar
categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a
alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de interés estarán representados adecuadamente en la
muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán
parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues
exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).
La distribución de la muestra en función de los diferentes estratos se denomina afijación, y
puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la
población en cada estrato.
Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se
considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer
la desviación.
4.- Muestreo aleatorio por conglomerados:

Los métodos presentados hasta ahora están pensados para seleccionar directamente los
elementos de la población, es decir, que las unidades muéstrales son los elementos de la
población.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la
población que forman una unidad, a la que llamamos conglomerado.
4
AGUIRRE WALTER
FERNANDEZ YANINA
Las unidades hospitalarias, los departamentos universitarios, una caja de determinado

producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son áreas geográficas suele hablarse de "muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de
conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar
después todos los elementos pertenecientes a los conglomerados elegidos.
II. Métodos de muestreo no probabilísticos
A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso

y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar
generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de
que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen
la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo
determinados criterios procurando, en la medida de lo posible, que la muestra sea
representativa.
En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los
problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo
los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la
población.
Entre los métodos de muestreo no probabilísticos más utilizados en investigación
encontramos:
1.- Muestreo por cuotas:

También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un
buen conocimiento de los estratos de la población y/o de los individuos más "representativos"
o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el
muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que
reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo
femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se
encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas
de opinión.
2.- Muestreo intencional o de conveniencia:

Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es
muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones
han marcado tendencias de voto.
También puede ser que el investigador seleccione directa e intencionadamente los individuos
de la población. El caso más frecuente de este procedimiento el uti lizar como muestra los
individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha
frecuencia a sus propios alumnos).
5
AGUIRRE WALTER
FERNANDEZ YANINA
3.- Bola de nieve:

Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as í hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos,
etc.
4.- Muestreo Discrecional · A criterio del investigador los elementos son elegidos sobre lo que él
cree que pueden aportar al estudio.
Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico
6
AGUIRRE WALTER
FERNANDEZ YANINA
EJEMPLO
Para realizar a modo de ejemplo una investigación de mercado, hemos elegido desarrollar más
detalladamente el Muestreo Aleatorio Estratificado.
Cuando una población se divide en grupos a partir de ciertas características, se aplica el

muestreo aleatorio estratificado con el fin de garantizar que cada grupo se encuentre
representado en la muestra. A los grupos también se les denomina estratos. Por ejemplo, los
estudiantes universitarios se pueden agrupar en estudiantes de tiempo completo o de medio
tiempo, por sexo, masculino o femenino, tradicionales o no tradicionales. Una vez definidos los
estratos, se aplica el muestreo aleatorio simple en cada grupo o estrato con el fin de formar la
muestra.
Por ejemplo, puede estudiar los gastos en publicidad de las 352 empresas más grandes de
Estados Unidos. Suponga que el objetivo del estudio consiste en determinar si las empresas
con altos rendimientos sobre el capital (una medida de rentabilidad) gastan en publicidad la
mayor parte del dinero ganado que las empresas con un registro de bajo rendimiento o déficit.
Para asegurar que la muestra sea una representación imparcial de las 352 empresas, éstas se
deben agrupar de acuerdo con su rendimiento porcentual sobre el capital. La siguiente tabla
incluye los estratos y las frecuencias relativas. Si aplicara el muestreo aleatorio simple, observe
que las empresas del tercero y cuarto estratos tienen una probabilidad alta de que se les
seleccione (0.87), mientras que las empresas de los demás estratos tienen menos (0.13).
Podría no seleccionar ninguna de las empresas que aparecen en los estratos 1 o 5

sencillamente por azar. No obstante, el muestreo aleatorio estratificado garantizará que por lo
menos una empresa de los estratos 1 o 5 aparezca en la muestra. Considere una selección de
50 compañías para llevar a cabo un estudio minucioso. Entonces se seleccionará de forma
aleatoria 1 (0.02 _ 50) empresas del estrato 1; 5 (0.10 _ 50), del estrato 2, etc. En este caso, el
número de empresas en cada estrato es proporcional a la frecuencia relativa del estrato en la
población. El muestreo estratificado ofrece la ventaja de que, en algunos casos, refleja con
mayor fidelidad las características de la población que el muestreo aleatorio simple o el
muestreo aleatorio sistemático.
Número seleccionado de una muestra aleatoria estratificada proporcional
7
AGUIRRE WALTER
FERNANDEZ YANINA
CALCULO DE LA MUESTRA
Antes de continuar recordaremos algunos conceptos claves:

 Una muestra es un subconjunto de la población.
 Es representativa porque tiene un nivel de confianza y un margen de error.
 Sus ventajas es que reduce costos, tiempo y permite estudiar poblacion es muy
grandes.
Existen 2 tipos de Población:
 Población Finita: está formada por un número limitado de elementos.

 Por ejemplo: todos los habitantes de una comunidad, el número de estudiantes de un
colegio, el número de trabajadores de una empresa, etc.
 Para conocer el tamaño de la muestra de este tipo de población se utiliza la siguiente
formula:

( )
 Población Infinita: está formada por un número extremadamente grande de

componentes, donde no se pueden contabilizar todos sus elementos, ya que son un
número ilimitado de elementos.
 Por ejemplo: el número de insectos en el mundo, numero de estrellas en el universo,
etc.
 Para conocer el tamaño de la muestra con este tipo de población se utiliza la siguiente
formula:
 En ambos casos:
 n = es el tamaño de la muestra es decir, el número de elementos o sujetos extraídos
de una población susceptibles de ser observados.
 N = es el tamaño de la población, como se observa en ambas fórmulas, solo aparece
“N” cuando se conoce con certeza el número de componentes, es decir, cuando el
universo es finito y no infinito.
 Z = es el parámetro estadístico que depende del nivel de confianza. El Nivel de
Confianza es el grado de certeza (o probabilidad), expresado en porcentaje con el que
se pretende realizar la estimación de un parámetro a través de un estadístico
muestral.
 Tabla con los Niveles de Confianza más utilizados:
Nivel de Confianza Z Nivel de Confianza Z
99 % 2,58 95 % 1,96
98 % 2,33 90 % 1,65
97 % 2,17 80 % 1,28
96 % 2,05 50 % 0,67
8
AGUIRRE WALTER
FERNANDEZ YANINA
 e = es el error de estimación máximo aceptado: la cantidad de error de muestreo

aleatorio resulta de la elaboración de una investigación. El error lo coloca el
investigador, generalmente se usa el 5 % de error es decir el 0,05.
 p = es la probabilidad de que SI ocurra el evento estudiado, es decir, la probabilidad de
éxito.
 q = es igual a (1 – p), es la probabilidad de que NO ocurra el evento estudiado.
 Por ejemplo: si la probabilidad a favor es e p = 40%, entonces la probabilidad de que
no ocurra será de q = 60%.
 En el caso de que no conozcamos la probabilidad se sugiere hacer p = 50% y q = 50%.
ESCALA O NIVELES DE MEDICION

ESCALA DE MEDICION
Una escala de medición es el conjunto de los posibles valores que una cierta variable puede
tomar. Estos valores están ordenados correlativamente, que admite un punto inicial y otro
final. Las escalas de medición se utilizan para medir variables o atributos. Se distinguen 4
escalas de medición.
NOMINAL
ESCALAS CATEGORICAS
ORDINAL
INTERVALO
ESCALAS NUMERICAS
RAZON
Las escalas categóricas se usan comúnmente para variables cualitativas, mientras que las
escalas numéricas son adecuadas parta la medición de variables cualitativas.
TIPOS DE VARIABLES VS ESCALA DE MEDICION
9
AGUIRRE WALTER
FERNANDEZ YANINA
ESCALA NOMINAL: es la escala más elemental y la forma más rudimentaria de medir. En esta
escala se clasifica a las variables de estudio en categorías basándose en características,
atributos o propiedades distintivas, dándoles a cada uno un nombre, de ahí que s ea nominal.
Por lo tanto, en la escala nominal, las observaciones de una variable cualitativa solo se
clasifican y se cuenta. No existe una forma particular para ordenarlas.
En esta escala se tiene dos o más categorías de una variable medida y pueden ser:
 Dicotómicas: incluyen solo dos categorías. Por ejemplo: el sexo (hombre – mujer).
 Policotomicas: con tres o más categorías. Por ejemplo: raza, carrera, religión.
ESCALA ORDINAL: esta escala se logra cuando las observaciones pueden colocarse en un orden
relativo con respecto a las características que se evalúan. Aquí las etiquetas categóricas si
indican jerarquía.
Por ejemplo: las notas escolares cualitativas (Insuficientes, aceptables, buenas,

sobresalientes), los rangos militares o jerárquicos, el grado de escolaridad, grado de calidad,
días de la semana, meses del año, etc.
ESCALA DE INTERVALOS: esta escala incluye las mismas del nivel ordinal pero también incluye
la diferencia entre los valores, que es una magnitud constante, que se conoce de forma
concreta. En este tipo de medida puede utilizarse cualquier unidad, sea cual sea su magnitud y
la elección del cero puede hacerse de modo arbitrario.
Desde el punto de vista matemático, las escalas de intervalo admiten el cálculo de

proporciones, porcentajes y razones; además, permite estimar estadísticos como: la media
aritmética, mediana, moda, rangos y desviación estándar.
Algunos ejemplos de este tipo de escalas y variables medidas en ellas son:
 Lapsos de tiempo transcurridos entre 1995-1999 y 2000-2004.

 Escalas de los test psicológicos.
 Ubicación de una carretera respecto de un punto de referencia (Km 85, Ruta 5).
 Variables usadas en test de rendimiento.
 Temperatura corporal.
 Puntaje obtenido por un equipo en un campeonato deportivo.
ESCALA DE RAZON: en esta escala son registrados todos los datos cualitativos. El nivel de razón
es el más alto. Presenta todas las características de la escala de intervalos aunque el “0” tiene
sentido y la razón entre 2 números es significativa.
Este tipo de escala se puede utilizar para magnitudes físicas, estaturas de personas, velocidad,
peso, tiempo, etc.
10
AGUIRRE WALTER
FERNANDEZ YANINA
MEDIDAS DE RESUMEN
Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que
constituyen una muestra tomada de alguna población.
Resumir un conjunto de datos es pasar de una visión detallada a una generalización simple e
informativa tratando de preservar las características esenciales.
Estas medidas son utilices para comparar conjuntos de datos y presentar los resultados de un
estudio y se clasifican en dos grupos principales:
 Medidas de posición o localización: que describen un valor alrededor del cual se

encuentran las observaciones.
 Medidas de dispersión o escala: las cuales pretenden expresar cuan variable es un
conjunto de datos.
Dependiendo del Nivel de Medición de las variables observadas se pueden utilizar diferentes
medidas de resumen en estadística descriptivas.
 Para las Variables Cuantitativas, las medidas de resumen pueden ser:

 Medidas de Posición Central: como la media, mediana y moda.
 Medidas de posición No Centrales: como los cuartiles y fractiles.
 Medidas de Variabilidad o Dispersión: como el desvío medio, desvío estándar
y varianza.
 Para las Variables Cualitativas, las medidas de resumen pueden ser:
 Cifras Relativas: como las razones, proporciones y tasas.
RAZONES
Definición: una razón indica la relación entre dos mediciones

disjuntas, es decir, en el cálculo de una razón, no existe ningún
elemento en común entre el numerador y denominador. Es una
medida de comparación a través de cociente entre dos conjuntos.
Esta razón puede tomar valores desde cero hasta cualquier valor
positivo y no puede tomar valores negativos.
Ejemplo: Calcular el número de enfermeras por camas hospitalarias. En este caso se calcula
dividiendo el número de enfermeras (en el numerador) que trabajan en un servicio en un
periodo, entre el total de camas hospitalarias (en el denominador) en el servicio en el mismo
periodo. Como se aprecia no existes elementos en común, ya que se relacionan o comparan las
enfermeras con las camas hospitalarias.
11
AGUIRRE WALTER
FERNANDEZ YANINA
PROPORCIONES
Definición: es una medida de resumen para variables cualitativas

que consiste en la comparación, a través de una división, entre un
subconjunto y el conjunto al que pertenece. Indica la relación entre
una parte y un todo, es decir, en el cálculo de una proporción, el
numerador está incluido en el numerador.
Esta medida puede tomar valores entre cero hasta la unidad; si

arroja valor cero, no existen elementos con esa característica, y si
arroja uno, todos los elementos tienen esas características.
La proporción no puede tomar valores negativos ni mayores que

uno. Esta proporción generalmente se presentan como porcentajes
para hacer más fácil la interpretación.
Ejemplo: calcular el cumplimiento de citas al médico. En este caso se calcula dividiendo el

número de pacientes que acuden a su cita en la fecha indicada en un periodo, entre el total de
pacientes citados en el mismo periodo. Como se observa tanto en el numerador como en el
denominador, están incluidos los pacientes que tienen citas, solo que se comparan cuantos en
proporción de los citados realmente fueron a la cita.
50 pacientes fueron a la cita, de un total de 70. Calculando la proporción de 50/70 arroja que
el 71,42% (0,7142 por 100) acudieron a su cita.
TASAS
Definición: la tasa es otra medida de resumen, que consiste

en una medida de la rapidez de cambio de un estado o
fenómeno a otro, por lo tanto implica un riesgo. Se expresa a
través de una división entre el número de veces que ocurre
un cierto tipo de eventos y la población en la que puede
ocurrir dicho tipo de eventos.
Las tasas asumen valores de 0 a infinito y expresa el número

de eventos que ocurren en tiempo – persona de exposición,
que es la característica fundamental de la tasa. Suele ser
multiplicado por alguna constante que sea múltiplo de 10
para ser representado de mejor manera.
Ejemplo: en una ciudad a lo largo del año 2010 ocurrieron 345 defunciones por cáncer de
próstata, dicha ciudad tenía una población de 2.453.210 habitantes, de ellos 1.210.425 eran de
sexo masculino. Entonces se desea calcular una medida de resumen que permita imaginar o
12
AGUIRRE WALTER
FERNANDEZ YANINA
evocar la magnitud de riesgo que existe para los habitantes masculinos de esa cuidad de
fallecer por cáncer de próstata.
Para calcular la tasa, de acuerdo a la definición, debe dividirse en número de eventos entre la
población en la cual dicho evento puede ocurrir.
345 / 1.210.425 = 0,0002850239 por 100.000 (múltiplo de 10) = 28,50 %.
DISTRIBUCIÓN DE FRECUENCIAS Y GRAFICO : al igual que las variables cualitativas,

con las variables categóricas se utiliza la distribución de frecuencia para ordenar y analizar los
datos observados.
Ejemplo:
DISTRIBUCION DE FRECUENCIAS DE VARIABLES CUALITATIVAS – ESCALA NOMINAL
FRECUENCIA FRECUENCIA
OCUPACION PORCENTAJE
ABSOLUTA RELATIVA
MEDICO 224 0,34 34
OBSTETRIZ 194 0,29 29
TECNOLOGO 131 0,20 20
ENFERMERA 67 0,10 10
NUTRICIONISTA 47 0,07 7
TOTAL 663 1,00 100
Su respectiva grafica puede ser la de barras o la de sectores. Donde se puede representar las
proporciones de ocupación.
40
34
35
29
30
25
20
20
15
10
10 7
5
0
MEDICO OBSTETRIZ TECNOLOGO ENFERMERA NUTRICIONISTA
13
AGUIRRE WALTER
FERNANDEZ YANINA
Ocupacion
7 MEDICO
10
34 OBSTETRIZ
20 TECNOLOGO
ENFERMERA
29 NUTRICIONISTA
DISTRIBUCION DE FRECUENCIAS DE VARIABLES CUALITATIVAS – ESCALA ORDINAL
CALIDAD DE FRECUENCIA FRECUENCIA

PORCENTAJE
ATENCION ABSOLUTA RELATIVA
MUY BUENA 35 0,18 18
BUENA 73 0,37 37
REGULAR 58 0,30 30
MALA 23 0,12 12
MUY MALA 7 0,03 3
TOTAL 196 1,00 100
Su respectiva grafica puede ser la de barras o la de sectores. Donde se puede representar las
proporciones de la calidad de atención.
Calidad de atencion
MUY MALA 3
MALA 12
REGULAR 30
BUENA 37
MUY BUENA 18
0 5 10 15 20 25 30 35 40
14
AGUIRRE WALTER
FERNANDEZ YANINA
BIDIMENSIONAL
TABLA DE CONTIGENCIA
Una tabla de contingencia, según Arrondo (2014), se define como una “organización de filas y
columnas, en cuyas casillas se expresa la frecuencia de ocasiones en las que se presenta el par valor
fila x valor columna” (p. 2). Los autores Otero y Moral (2005) definen la tabla de contingencia como
“una tabla de doble entrada, donde en cada casilla figurará el número de casos o individuos que
poseen un nivel de uno de los factores o características analizadas y otro nivel del ot ro factor
analizado”.
Cuando se tiene una tabla de contingencia interesa ver si las variables representadas en las filas y
columnas están relacionadas entre sí. En este caso, se está haciendo referencia a la asociación
entre las dos variables, según lo comentado por Batanero y Díaz (2008). En general, una tabla de
contingencia nos proporciona una forma resumida de representar datos de dos variables que se
quieren estudiar, según Cañadas, Contreras, Arteaga y Gea (2013).
VALORES OBSERVADOS PARA UN TAMAÑO DE 30 DATOS

ESTADO CIVIL
SOLTERO CASADO UNION LIBRE OTRO TOTAL
MASCULINO 3 11 1 1 16
SEXO
FEMENINO 5 3 5 1 14
TOTAL 8 14 6 2 30
A continuación se podrá apreciar la tabla de valores observados.

La siguiente expresión corresponde al algoritmo de la prueba de independencia de la Ji cua-
drado.
Para poder realizar el test estadístico Ji cuadrado se deberá completar la tabla de valores
esperados, la cual se deriva de los valores relativos. La misma se obtiene teniendo en cuenta la
tabla realizada anteriormente, de la cual se toma los 4 valores totales por fila (marginales en
X:8, 14, 6 , 2) y se multiplica por el primer valor total (16) de los marginales. Al efectuar todas
las operaciones, se llega finalmente a la tabla de los valores esperados.
VALORES RELATIVOS
16 * 8 / 30 16 * 14 / 30 16 * 6 / 30 16 * 2 / 30
14 * 8 / 30 14 * 14 / 30 14 * 6 / 30 14 * 2 / 30
VALORES ESPERADOS
4,27 7,47 3,2 1,07
3.73 6,53 2,8 0,93
15
AGUIRRE WALTER
FERNANDEZ YANINA
VALORES ESPERADOS LOGRADOS CON LA MACRO JI CUADRADO

SOLTERO CASADO UNION LIBRE OTRO
MASCULINO 4,27 7,47 3,2 1,07
FEMENINO 3,73 6,53 2,8 0,93
TEST ESTADISTICO JI CUADRADO:
Ahora se podrán reemplazara estos valores estadísticos de prueba en la siguiente ecuación:
Una vez logrados los cálculos, es conveniente que se tenga en cuenta los siguientes pasos para
completar todo el ejercicio.
1) Primer paso: se deben plantear las dos hipótesis, tanto la nula como la alterna, como sigue:
H0: “Las variables son independientes”.
H1: ”Las variables no son independientes”.
2) Segundo paso: se calcula el estadístico de prueba; este valor va en mayúscula y como ya se

calculó se sabe con certeza que es = 7.64.
3) Tercer paso: se busca el correspondiente valor en tabla de la Ji cuadrado.
X2 (γ, α) = X2 (3,0.05)= 7.815
El anterior valor se buscó teniendo en cuenta 3 grados de libertad. Los grados de libertad se
calculan de acuerdo con el número de filas y el núme ro de columnas de la tabla de valores
observados. Como en las filas están los dos géneros (femenino y masculino), se realiza la
diferencia entre las categorías del género que son 2 y 1 que es constante (2 − 1); en las
columnas aparecen las cuatro categorías del estado civil, también se realiza esta diferencia, las
cuatro categorías menos 1 que es constante (4 – 1), y quedan finalmente tres grados de
libertad así:
Grados de libertad para la Ji cuadrado:
γ = (Número de filas – 1) (Número de columnas – 1)
γ = (2 – 1) (4 – 1) = 3 g.l. (grados de libertad)
γ = Es una letra del alfabeto griego y se pronuncia Nú.
16
AGUIRRE WALTER
FERNANDEZ YANINA
Ahora se busca el valor en la tabla de la Ji cuadrado, se tomará α = 5 %; este valor se escoge a

criterio del investigador.
X2 (γ, α) = X2 (3,0.05)= 7.815.
4) Cuarto paso: se comparan los dos valores; el del estadístico de prueba y el valor encontrado
en la tabla, de la siguiente manera:
Si X2 > x2(γ, α), entonces se rechaza la hipótesis nula.
En este caso, como el valor que dio el estadístico de prueba fue de = 7.64, que resultó menor
que el valor buscado en tabla que fue de: = 7.815, entonces no se rechaza la hipótesis nula.
Esto significa que las variables son independientes, lo que indica que el estado civil no tiene
nada que ver con ser hombre o ser mujer.
Tabla de Referencia
17
AGUIRRE WALTER
FERNANDEZ YANINA
PRACTICA
ESTUDIO DE MERCADO PARA CONOCER LOS HABITOS Y PREFERENCIAS DE LOS TUCUMANOS
QUE CONSUMEN REFRESCOS.
El tipo de muestreo elegido para la investigación pertinente fue el probabilístico, muestreo

aleatorio estratificado, para poder tener una muestra lo más representativamente posible,
ahorrando costos y el tiempo empleado para el mismo.
Dentro del muestreo aleatorio estratificado, elegimos el de fijación proporcional, ya que la

población se divide en partes y se seleccionan de cada una cierta cantidad en proporción a la
población y de este modo, todos tienen posibilidades de ser elegidos para la muestra.
Se dividió la Población “habitantes de la provincia de Tucumán”, en los 17 departamentos.
TOTAL 1.674.622 YERBA BUENA 98.686

BURRUYACU 45.155 LEALES 62.826
CAPITAL 593.000 LULES 91.821
CHICLIGASTA 92.166 MONTEROS 74.337
CRUZ ALTA 218.154 RIO CHICO 65.002
FAMAILLA 41.957 SIMOCA 32.777
GRANEROS 14.485 TAFI DEL VALLE 17.063
ALBERDI 34.435 TAFI VIEJO 149.896
LA COCHA 21.599 TRANCAS 21.263
A continuación en la siguiente grafica se detalla la proporcionalidad de cada departamento con

relación a la población y al tamaño de la muestra respectiva.
TOTAL 1.674.622 MUESTRA 384 YERBA BUENA 98.686 5,89% 23
BURRUYACU 45.155 2,70% 10 LEALES 62.826 3,75% 14

CAPITAL 593.000 35,41% 136 LULES 91.821 5,48% 21
CHICLIGASTA 92.166 5,50% 21 MONTEROS 74.337 4,44% 17
CRUZ ALTA 218.154 13,03% 50 RIO CHICO 65.002 3,88% 15
FAMAILLA 41.957 2,51% 10 SIMOCA 32.777 1,96% 8
GRANEROS 14.485 0,86% 3 TAFI DEL VALLE 17.063 1,02% 4
ALBERDI 34.435 2,06% 8 TAFI VIEJO 149.896 8,95% 34

LA COCHA 21.599 1,29% 5 TRANCAS 21.263 1,27% 5
18
AGUIRRE WALTER
FERNANDEZ YANINA
El cálculo de la muestra fue el siguiente:
( )
( )
( )
( ) ( )
( )
Datos Técnicos:
 Población: los habitantes que residen en la provincia de Tucumán. De todas las

edades. La población es de 1.674.622 habitantes.
 Tamaño de la Muestra: 384 unidades muéstrales válidas.
 Tipo de Muestreo: muestreo estratificado proporcional.
 Margen de Error: aproximadamente el 5 % para un nivel confianza del 95 %. Población
conocida mayor a 100.000.
 Fecha de Inicio de recolección de datos: 18 / 09 / 19.
 Fecha de finalización de recolección de datos: 18 / 10 / 19.
19
AGUIRRE WALTER
FERNANDEZ YANINA
Análisis del estudio de mercado sobre consumo de refrescos
Tan adictivo, burbujeante y sobre todo dulce, el refresco se ha convertido en una de las
principales causas de obesidad en nuestro país y en la provincia, pero realmente ¿Qué motiva
su consumo?, en esta investigación de mercado hemos decidido conocer a fondo las razones
que motivan a los tucumanos a consumir refrescos, así como también, conocer sus
preferencias y frecuencia de consumo. Enseguida presentamos los resultados de estudio de
mercado sobre refrescos.
El 75% de los mexicanos acostumbra tomar refresco y 1 de cada 3 consumidores de refresco lo

consume 2 o 3 días a la semana, con una tendencia a que se consuma más días durante la
semana. En cuanto a su consumo en cantidad semanal, ronda entre 1 y 5 litros.
El sabor preferido de la mayoría (63%) es el sabor a cola, seguido muy de lejos (17%) por
manzana y naranja (7%)
Regularmente el refresco lo toman solo el 90% de las personas, esto significa que no requiere
modificadores, alcohol, u otra condición.
20
AGUIRRE WALTER
FERNANDEZ YANINA
A continuación se mostrara todos los resultados del estudio de mercado sobre refrescos:
1 - ¿Estás acostumbrado a tomar refrescos?
2 - ¿Con que frecuencia tomas refrescos?
21
AGUIRRE WALTER
FERNANDEZ YANINA
3 – Y en tu casa ¿Cuántos litros de refresco compran a la semana?
4 - ¿Qué sabor de refresco prefiere?
22
AGUIRRE WALTER
FERNANDEZ YANINA
5 - ¿Cómo sueles tomar refresco con más frecuencia?
6 - ¿Qué línea de refrescos prefieres?
23
AGUIRRE WALTER
FERNANDEZ YANINA
7 – Y ¿Qué te gusta más?
8 - ¿Tiene influencia la marca de refrescos que te gusta al decidir ir al cine?
24
AGUIRRE WALTER
FERNANDEZ YANINA
Para continuar con la investigación, nos interesa saber si la frecuencia con que los encuestados
toman refrescos está relacionada de alguna manera con la forma que suelen tomar los
refrescos.
A continuación se presenta la tabla de distribución de frecuencias absolutas de ambas

variables con sus respectivos datos en una tabla de contingencia.
¿Con que frecuencia tomas refrescos?

TABLA
No tomo Alguna vez por M 1 vez por S 2 o 3 por S 4 o 5 por S Casi Diario Diario Sub Total
Con alcohol 0 2 4 10 4 6 3 29
¿Cómo suele
tomarlo?
Solo 6 24 50 110 46 69 43 348

Ninguna
0 1 1 2 1 1 1 7
manera
Sub Total 6 27 55 122 51 76 47 384
Ahora se debe presentar la tabla con las observaciones esperadas.
¿Con que frecuencia tomas refrescos?

TABLA
No tomo Alguna vez por M 1 vez por S 2 o 3 por S 4 o 5 por S Casi Diario Diario Sub Total
Con alcohol 0,45 2,04 4,15 9,21 3,85 5,74 3,55 29
¿Cómo suele
tomarlo?
Solo 5,44 24,47 49,84 110,56 46,22 68,88 42,59 348

Ninguna
0,11 0,49 1,00 2,22 0,93 1,39 0,86 7
manera
Sub Total 6 27 55 122 51 76 47 384
Una vez realizadas ambas tablas se procede a desarrollar la ecuación:
( )
∑
Con la ayuda de Excel, usando las tablas arriba realizadas logramos obtener cada valor:
0,453125 0,000748324 0,00568345 0,06713127 0,00572072 0,01181564 0,08506244
0,05818966 0,008979885 0,00048981 0,00286179 0,00103533 0,00022686 0,00387472
0,109375 0,523933532 0 0,02255318 0,00531775 0,10722118 0,02394409
Y utilizando la función Suma el Ji Cuadrado calculado fue: 1,49729638.

El correspondiente valor en la tabla de la Ji Cuadrado es: (y; a) = (12; 0,05) = 21,03
El Ji C calculado es menor al Ji C de la tabla, Se rechaza la H alternativa, esto significa que las

variables son independientes.
25

ESTADISTICA Carpeta

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

ESTADISTICA Carpeta

Cargado por

Copyright:

Formatos disponibles

IES COVIELLO – CARRERA TAE – 2º AÑO A

INTRODUCCION: QUE ES LA ESTADISTICA

¿Cuál es la definición de estadística? Nos topamos con ella en el lenguaje cotidiano. En

Los datos se ordenan en una distribución de frecuencia.

Preste atención a las palabras población y muestra en la definición de estadísti ca inferencial.

MUESTRA: Porción o parte de la población de interés.

Los errores más comunes que se pueden cometer son:

1.- Muestreo aleatorio simple:

2.- Muestreo aleatorio sistemático:

3.- Muestreo aleatorio estratificado:

4.- Muestreo aleatorio por conglomerados:

Las unidades hospitalarias, los departamentos universitarios, una caja de determinado

II. Métodos de muestreo no probabilísticos

A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso

1.- Muestreo por cuotas:

2.- Muestreo intencional o de conveniencia:

3.- Bola de nieve:

Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico

Cuando una población se divide en grupos a partir de ciertas características, se aplica el

Podría no seleccionar ninguna de las empresas que aparecen en los estratos 1 o 5

Número seleccionado de una muestra aleatoria estratificada proporcional

Antes de continuar recordaremos algunos conceptos claves:

Existen 2 tipos de Población:

 Población Finita: está formada por un número limitado de elementos.

 Población Infinita: está formada por un número extremadamente grande de

 e = es el error de estimación máximo aceptado: la cantidad de error de muestreo

ESCALA O NIVELES DE MEDICION

TIPOS DE VARIABLES VS ESCALA DE MEDICION

Por ejemplo: las notas escolares cualitativas (Insuficientes, aceptables, buenas,

Desde el punto de vista matemático, las escalas de intervalo admiten el cálculo de

Algunos ejemplos de este tipo de escalas y variables medidas en ellas son:

 Lapsos de tiempo transcurridos entre 1995-1999 y 2000-2004.

 Medidas de posición o localización: que describen un valor alrededor del cual se

 Para las Variables Cuantitativas, las medidas de resumen pueden ser:

Definición: una razón indica la relación entre dos mediciones

Definición: es una medida de resumen para variables cualitativas

Esta medida puede tomar valores entre cero hasta la unidad; si

La proporción no puede tomar valores negativos ni mayores que

Ejemplo: calcular el cumplimiento de citas al médico. En este caso se calcula dividiendo el

Definición: la tasa es otra medida de resumen, que consiste

Las tasas asumen valores de 0 a infinito y expresa el número

345 / 1.210.425 = 0,0002850239 por 100.000 (múltiplo de 10) = 28,50 %.

DISTRIBUCIÓN DE FRECUENCIAS Y GRAFICO : al igual que las variables cualitativas,

DISTRIBUCION DE FRECUENCIAS DE VARIABLES CUALITATIVAS – ESCALA NOMINAL

DISTRIBUCION DE FRECUENCIAS DE VARIABLES CUALITATIVAS – ESCALA ORDINAL

CALIDAD DE FRECUENCIA FRECUENCIA

VALORES OBSERVADOS PARA UN TAMAÑO DE 30 DATOS

A continuación se podrá apreciar la tabla de valores observados.

4,27 7,47 3,2 1,07

3.73 6,53 2,8 0,93

VALORES ESPERADOS LOGRADOS CON LA MACRO JI CUADRADO

TEST ESTADISTICO JI CUADRADO:

Ahora se podrán reemplazara estos valores estadísticos de prueba en la siguiente ecuación:

2) Segundo paso: se calcula el estadístico de prueba; este valor va en mayúscula y como ya se

Ahora se busca el valor en la tabla de la Ji cuadrado, se tomará α = 5 %; este valor se escoge a

El tipo de muestreo elegido para la investigación pertinente fue el probabilístico, muestreo

Dentro del muestreo aleatorio estratificado, elegimos el de fijación proporcional, ya que la

Se dividió la Población “habitantes de la provincia de Tucumán”, en los 17 departamentos.

TOTAL 1.674.622 YERBA BUENA 98.686

A continuación en la siguiente grafica se detalla la proporcionalidad de cada departamento con

TOTAL 1.674.622 MUESTRA 384 YERBA BUENA 98.686 5,89% 23

BURRUYACU 45.155 2,70% 10 LEALES 62.826 3,75% 14

GRANEROS 14.485 0,86% 3 TAFI DEL VALLE 17.063 1,02% 4