Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AGUIRRE WALTER
FERNANDEZ YANINA
ESTADISTICA
ESTADÍSTICA: Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de
propiciar una toma de decisiones más eficaz.
TIPOS DE ESTADISTICAS
Por lo general, el estudio de la estadística se divide en dos categorías: la estadística descriptiva
y la estadística inferencial.
ESTADISTICA DESCRIPTIVA
Es la ciencia que “recoge, organiza, presenta, analiza… datos”. Esta parte de la estadística
recibe el nombre de estadística descriptiva.
Una masa de datos desorganizados —como el censo de población, los salarios semanales de
miles de programadores de computadoras y las respuestas de 2 000 votantes registrados para
elegir presidente de Estados Unidos— resulta de poca utilidad. No obstante, las técnicas de la
estadística descriptiva permiten organizar esta clase de datos y darles significado.
ESTADISTICA INFERENCIAL
El segundo tipo es la estadística inferencial, también denominada inferencia estadística. El
principal interés que despierta esta disciplina se relaciona con encontrar algo relacionado con
una población a partir de una muestra de ella. Por ejemplo, una encuesta reciente mostró que
1
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
sólo 46% de los estudiantes del último grado de secundaria podían resolver problemas que
incluyeran fracciones, decimales y porcentajes. Además, sólo 77% de los alumnos de último
año de secundaria pudo sumar correctamente el costo de una ensalada, una hamburguesa,
unas papas fritas y un refresco de cola, que figuraban en el menú de un restaurante ya que
estas son inferencias relacionadas con una población (todos los estudiantes de último grado de
secundaria), basadas en datos de la muestra, se trata de estadística inferencial .
Se podría considerar a la estadística inferencial como la mejor conjetura que es posible
obtener del valor de una población sobre la base de la información de una muestra.
Con el objeto de inferir algo sobre una población, lo común es que tome una muestra de ella.
¿Por qué tomar una muestra en lugar de estudiar a cada miembro de la población? Una
muestra de votantes registrados se hace necesaria en virtud de los costos prohibitivos de
ponerse en contacto con millones de electores antes de una elección. En la práctica resulta
imposible que unos cuantos biólogos marinos capturaren y rastreen a todas las focas en el
océano. La toma de muestras para aprender algo sobre una población es de uso frecuente en
administración, agricultura, política y acciones de gobierno, etc.
2
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
EL MUESTREO
MUESTREO
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los
elementos de una población), se selecciona una muestra, entendiendo por tal una parte
representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica
es determinar que parte de una población debe examinarse, con la finalidad de hace r
inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la que se reproduzca
de la mejor manera los rasgos esenciales de dicha población que son importantes para la
investigación. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población, es decir ejemplificar las características
de ésta.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y
métodos de muestreo no probabilísticos.
I. Muestreo probabilístico
Los métodos de muestreo probabilísticos son aque llos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las
posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos
métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída
y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos
encontramos los siguientes tipos:
3
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la
población que estamos manejando es muy grande.
4
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
5
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
4.- Muestreo Discrecional · A criterio del investigador los elementos son elegidos sobre lo que él
cree que pueden aportar al estudio.
6
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
EJEMPLO
Para realizar a modo de ejemplo una investigación de mercado, hemos elegido desarrollar más
detalladamente el Muestreo Aleatorio Estratificado.
Por ejemplo, puede estudiar los gastos en publicidad de las 352 empresas más grandes de
Estados Unidos. Suponga que el objetivo del estudio consiste en determinar si las empresas
con altos rendimientos sobre el capital (una medida de rentabilidad) gastan en publicidad la
mayor parte del dinero ganado que las empresas con un registro de bajo rendimiento o déficit.
Para asegurar que la muestra sea una representación imparcial de las 352 empresas, éstas se
deben agrupar de acuerdo con su rendimiento porcentual sobre el capital. La siguiente tabla
incluye los estratos y las frecuencias relativas. Si aplicara el muestreo aleatorio simple, observe
que las empresas del tercero y cuarto estratos tienen una probabilidad alta de que se les
seleccione (0.87), mientras que las empresas de los demás estratos tienen menos (0.13).
7
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
CALCULO DE LA MUESTRA
( )
En ambos casos:
n = es el tamaño de la muestra es decir, el número de elementos o sujetos extraídos
de una población susceptibles de ser observados.
N = es el tamaño de la población, como se observa en ambas fórmulas, solo aparece
“N” cuando se conoce con certeza el número de componentes, es decir, cuando el
universo es finito y no infinito.
Z = es el parámetro estadístico que depende del nivel de confianza. El Nivel de
Confianza es el grado de certeza (o probabilidad), expresado en porcentaje con el que
se pretende realizar la estimación de un parámetro a través de un estadístico
muestral.
Tabla con los Niveles de Confianza más utilizados:
Nivel de Confianza Z Nivel de Confianza Z
99 % 2,58 95 % 1,96
98 % 2,33 90 % 1,65
97 % 2,17 80 % 1,28
96 % 2,05 50 % 0,67
8
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
Una escala de medición es el conjunto de los posibles valores que una cierta variable puede
tomar. Estos valores están ordenados correlativamente, que admite un punto inicial y otro
final. Las escalas de medición se utilizan para medir variables o atributos. Se distinguen 4
escalas de medición.
NOMINAL
ESCALAS CATEGORICAS
ORDINAL
INTERVALO
ESCALAS NUMERICAS
RAZON
Las escalas categóricas se usan comúnmente para variables cualitativas, mientras que las
escalas numéricas son adecuadas parta la medición de variables cualitativas.
9
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
ESCALA NOMINAL: es la escala más elemental y la forma más rudimentaria de medir. En esta
escala se clasifica a las variables de estudio en categorías basándose en características,
atributos o propiedades distintivas, dándoles a cada uno un nombre, de ahí que s ea nominal.
Por lo tanto, en la escala nominal, las observaciones de una variable cualitativa solo se
clasifican y se cuenta. No existe una forma particular para ordenarlas.
En esta escala se tiene dos o más categorías de una variable medida y pueden ser:
Dicotómicas: incluyen solo dos categorías. Por ejemplo: el sexo (hombre – mujer).
Policotomicas: con tres o más categorías. Por ejemplo: raza, carrera, religión.
ESCALA ORDINAL: esta escala se logra cuando las observaciones pueden colocarse en un orden
relativo con respecto a las características que se evalúan. Aquí las etiquetas categóricas si
indican jerarquía.
ESCALA DE INTERVALOS: esta escala incluye las mismas del nivel ordinal pero también incluye
la diferencia entre los valores, que es una magnitud constante, que se conoce de forma
concreta. En este tipo de medida puede utilizarse cualquier unidad, sea cual sea su magnitud y
la elección del cero puede hacerse de modo arbitrario.
ESCALA DE RAZON: en esta escala son registrados todos los datos cualitativos. El nivel de razón
es el más alto. Presenta todas las características de la escala de intervalos aunque el “0” tiene
sentido y la razón entre 2 números es significativa.
Este tipo de escala se puede utilizar para magnitudes físicas, estaturas de personas, velocidad,
peso, tiempo, etc.
10
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
MEDIDAS DE RESUMEN
Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que
constituyen una muestra tomada de alguna población.
Resumir un conjunto de datos es pasar de una visión detallada a una generalización simple e
informativa tratando de preservar las características esenciales.
Estas medidas son utilices para comparar conjuntos de datos y presentar los resultados de un
estudio y se clasifican en dos grupos principales:
Dependiendo del Nivel de Medición de las variables observadas se pueden utilizar diferentes
medidas de resumen en estadística descriptivas.
RAZONES
Ejemplo: Calcular el número de enfermeras por camas hospitalarias. En este caso se calcula
dividiendo el número de enfermeras (en el numerador) que trabajan en un servicio en un
periodo, entre el total de camas hospitalarias (en el denominador) en el servicio en el mismo
periodo. Como se aprecia no existes elementos en común, ya que se relacionan o comparan las
enfermeras con las camas hospitalarias.
11
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
PROPORCIONES
50 pacientes fueron a la cita, de un total de 70. Calculando la proporción de 50/70 arroja que
el 71,42% (0,7142 por 100) acudieron a su cita.
TASAS
Ejemplo: en una ciudad a lo largo del año 2010 ocurrieron 345 defunciones por cáncer de
próstata, dicha ciudad tenía una población de 2.453.210 habitantes, de ellos 1.210.425 eran de
sexo masculino. Entonces se desea calcular una medida de resumen que permita imaginar o
12
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
evocar la magnitud de riesgo que existe para los habitantes masculinos de esa cuidad de
fallecer por cáncer de próstata.
Para calcular la tasa, de acuerdo a la definición, debe dividirse en número de eventos entre la
población en la cual dicho evento puede ocurrir.
Ejemplo:
FRECUENCIA FRECUENCIA
OCUPACION PORCENTAJE
ABSOLUTA RELATIVA
MEDICO 224 0,34 34
OBSTETRIZ 194 0,29 29
TECNOLOGO 131 0,20 20
ENFERMERA 67 0,10 10
NUTRICIONISTA 47 0,07 7
TOTAL 663 1,00 100
Su respectiva grafica puede ser la de barras o la de sectores. Donde se puede representar las
proporciones de ocupación.
40
34
35
29
30
25
20
20
15
10
10 7
5
0
MEDICO OBSTETRIZ TECNOLOGO ENFERMERA NUTRICIONISTA
13
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
Ocupacion
7 MEDICO
10
34 OBSTETRIZ
20 TECNOLOGO
ENFERMERA
29 NUTRICIONISTA
Su respectiva grafica puede ser la de barras o la de sectores. Donde se puede representar las
proporciones de la calidad de atención.
Calidad de atencion
MUY MALA 3
MALA 12
REGULAR 30
BUENA 37
MUY BUENA 18
0 5 10 15 20 25 30 35 40
14
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
BIDIMENSIONAL
TABLA DE CONTIGENCIA
Una tabla de contingencia, según Arrondo (2014), se define como una “organización de filas y
columnas, en cuyas casillas se expresa la frecuencia de ocasiones en las que se presenta el par valor
fila x valor columna” (p. 2). Los autores Otero y Moral (2005) definen la tabla de contingencia como
“una tabla de doble entrada, donde en cada casilla figurará el número de casos o individuos que
poseen un nivel de uno de los factores o características analizadas y otro nivel del ot ro factor
analizado”.
Cuando se tiene una tabla de contingencia interesa ver si las variables representadas en las filas y
columnas están relacionadas entre sí. En este caso, se está haciendo referencia a la asociación
entre las dos variables, según lo comentado por Batanero y Díaz (2008). En general, una tabla de
contingencia nos proporciona una forma resumida de representar datos de dos variables que se
quieren estudiar, según Cañadas, Contreras, Arteaga y Gea (2013).
Para poder realizar el test estadístico Ji cuadrado se deberá completar la tabla de valores
esperados, la cual se deriva de los valores relativos. La misma se obtiene teniendo en cuenta la
tabla realizada anteriormente, de la cual se toma los 4 valores totales por fila (marginales en
X:8, 14, 6 , 2) y se multiplica por el primer valor total (16) de los marginales. Al efectuar todas
las operaciones, se llega finalmente a la tabla de los valores esperados.
VALORES RELATIVOS
16 * 8 / 30 16 * 14 / 30 16 * 6 / 30 16 * 2 / 30
14 * 8 / 30 14 * 14 / 30 14 * 6 / 30 14 * 2 / 30
VALORES ESPERADOS
15
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
Una vez logrados los cálculos, es conveniente que se tenga en cuenta los siguientes pasos para
completar todo el ejercicio.
1) Primer paso: se deben plantear las dos hipótesis, tanto la nula como la alterna, como sigue:
H0: “Las variables son independientes”.
H1: ”Las variables no son independientes”.
16
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
Tabla de Referencia
17
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
PRACTICA
ESTUDIO DE MERCADO PARA CONOCER LOS HABITOS Y PREFERENCIAS DE LOS TUCUMANOS
QUE CONSUMEN REFRESCOS.
18
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
( )
( )
( )
( ) ( )
( )
Datos Técnicos:
19
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
Tan adictivo, burbujeante y sobre todo dulce, el refresco se ha convertido en una de las
principales causas de obesidad en nuestro país y en la provincia, pero realmente ¿Qué motiva
su consumo?, en esta investigación de mercado hemos decidido conocer a fondo las razones
que motivan a los tucumanos a consumir refrescos, así como también, conocer sus
preferencias y frecuencia de consumo. Enseguida presentamos los resultados de estudio de
mercado sobre refrescos.
El sabor preferido de la mayoría (63%) es el sabor a cola, seguido muy de lejos (17%) por
manzana y naranja (7%)
Regularmente el refresco lo toman solo el 90% de las personas, esto significa que no requiere
modificadores, alcohol, u otra condición.
20
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
A continuación se mostrara todos los resultados del estudio de mercado sobre refrescos:
21
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
22
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
23
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
24
IES COVIELLO – CARRERA TAE – 2º AÑO A
AGUIRRE WALTER
FERNANDEZ YANINA
Para continuar con la investigación, nos interesa saber si la frecuencia con que los encuestados
toman refrescos está relacionada de alguna manera con la forma que suelen tomar los
refrescos.
( )
∑
Con la ayuda de Excel, usando las tablas arriba realizadas logramos obtener cada valor:
25