Está en la página 1de 13

Capítulo 1 Fundamentos Estadísticos

Antecedentes

Desde los conocimientos de la civilización han existidos formas sencillas de


estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en
piedras, rocas, palos de madera y paredes de cuevas para contar el número de
personas, animales o ciertas cosas. Hacia el año 3,000 A. C. los babilonios usaban
pequeñas tablillas de arcillas para recopilar datos tabulados sobre la producción
agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios
analizaban los datos de la población y la renta del país mucho antes de construir las
pirámides en el siglo XXXI A. C.

En 1662 apareció el primer estudio estadístico notable de población, titulado


Observations on the London Bills of Mortality.

El desarrollo de la Estadística se fundamenta científicamente a partir de los años 30


a raíz de los problemas planteados en la sociedad industrial, por el desarrollo de otras
ramas de las Matemáticas y de otros campos como la Biología, Medicina, Informática.

Estadística se ocupa de reunir, organizar y analizar datos numéricos y que ayuda a


resolver problemas como el diseño de experimentos y la toma de decisiones.

En nuestros días, la estadística se ha convertido en un método efectivo para describir


con exactitud los valores de datos económicos, políticos, sociales, psicológicos,
biológicos o físicos, y sirve como herramienta para relacionar y analizar dichos datos.

El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos,
sino sobre todo en el proceso de “interpretación” de esa información. El desarrollo
de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la
estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud,
utilizando determinadas distribuciones probabilísticas; los resultados de éstas se
pueden utilizar para analizar datos estadísticos. La probabilidad es útil para
comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la
cantidad de datos necesarios en un determinado estudio estadístico.
Objetivo de la Estadística
El objetivo fundamental de la estadística es obtener conclusiones de la investigación
empírica usando modelos matemáticos. A partir de los datos reales se construye un
modelo que se confronta con estos datos por medio de la Estadística. Esta proporciona
los métodos de evaluación de las discrepancias entre ambos.
Por eso es necesaria para toda ciencia que requiere análisis de datos y diseño de
experimentos.
Definición de Estadística

La Estadística es una ciencia que proporciona un conjunto de métodos que se utilizan


para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los
datos con respecto a una característica materia de estudio o investigación

Ramas de la estadísticas

El estudio de la estadística se ha concretado primordialmente en el análisis de datos


y su aplicación en la toma de decisiones, lo que ha permitido dividir a la estadística por
su aplicación en: Estadística descriptiva y en Estadística inferencial (estadística
inductiva o estadística analítica).
1. Estadística descriptiva. La función descriptiva de la estadística se enfoca en
la presentación y clasificación de los datos obtenidos de la población que se
analiza. Otra manera de describirla: el proceso que se relaciona con los
métodos y/o técnicas para la recopilación, organización y análisis de un
conjunto de datos cuantitativos, con el objeto de describir en forma apropiada
las diversas características de dicho conjunto.
La aplicación del tratamiento estadístico tiene dos fases fundamentales:
➢ Organización y análisis inicial de los datos recogidos.
➢ Extracción de conclusiones validas y toma de decisiones razonables a partir de
ellos.
Los objetivos de la Estadística Descriptiva son los que se abordan en la primera de
estas fases. Es decir, su misión es ordenar, describir y sintetizar la información
recogida. En este proceso será necesario establecer medidas cuantitativas que
reduzcan a un número manejable de parámetros el conjunto (en general grande) de
datos obtenidos.
La realización de graficas (visualización de los datos en diagramas) también forma
parte de la Estadística Descriptiva dado que proporciona una manera visual directa de
organizar la información.
La nulidad de la Estadística Descriptiva no es, entonces, extraer conclusiones
generales sobre el fenómeno que ha producido los datos bajo estudio, sino solamente
su descripción (de ahí el nombre).
2. Estadística inferencial. Esta aplicación de la estadística busca plantear y
resolver problemas específicos y/o hacer previsiones a partir de los datos de
una muestra. Otra manera de describirla: la técnica o metodología mediante la
cual es posible realizar la estimación de las características de una
población o realizar la toma de decisiones basados en resultados muestrales.
La inferencia estadística se ocupa de estudiar los métodos necesarios para extraer, o
inferir, conclusiones validas e información sobre una población a partir del estudio
experimental de una muestra de dicha población.
Los métodos utilizados en la inferencia estadística dependen de la información previa
que se tenga de la población a estudiar. Cuando se conoce la forma de la distribución
de probabilidad que sigue la variable aleatoria a estudiar en la población, el problema
consiste en determinar los diferentes parámetros de dicha distribución (ej. media y
varianza para la distribución normal). Para ello se utilizan los métodos paramétricos,
consistentes en procedimientos óptimos para encontrar dichos parámetros.
Cuando la distribución de la población es desconocida, el problema principal es
encontrar la forma y características de la distribución, lo cual se hace mediante los
llamados métodos no paramétricos.
Ejemplo
Clasifique cada una de las siguientes afirmaciones en Estadística descriptiva o
Estadística inferencial

a. Durante la gestión pasada el puntaje promedio del examen de admisión de jóvenes


estudiantes fue de 71 puntos en la Universidad Autónoma Gabriel René Moreno
b. Probablemente en la siguiente prueba de admisión a un cargo para el área de
ventas, llegaran aproximadamente 85 postulantes.
c. La compañía “R&M” predijo quien sería el ganador de una elección presidencial,
después de conocer los resultados de las votaciones de 25 mesas de sufragio de
un total de 1500 mesas.

Población y Muestra
La palabra “población” tiene varios significados; en el uso común, se refiere a todas
las personas que viven en una región, localidad o país. El concepto de población en
estadística va más allá de lo que comúnmente se conoce como tal. Una población se
precisa como un conjunto finito o infinito de personas u objetos que presentan
características comunes.
Definición "Una población es un conjunto de todos los elementos que estamos
estudiando, acerca de los cuales intentamos sacar conclusiones".
Ejemplo
Los miembros del Colegio de Ingenieros de Santa Cruz.
El tamaño que tiene una población es un factor de suma importancia en
el proceso de investigación estadística, y este tamaño vienen dado por el número de
elementos que constituyen la población, según el número de elementos la población
puede ser finita o infinita. Cuando el número de elementos que integra la población es
muy grande, se puede considerar a esta como una población infinita, por ejemplo; el
conjunto de todos los números positivos. Una población finita es aquella que está
formada por un limitado número de elementos, por ejemplo; el número de estudiante
de la Facultad de Ciencias del Habitad.
Cuando la población es muy grande, es obvio que la observación de todos los
elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo.
Para solucionar este inconveniente se utiliza una muestra estadística.
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre
todos si estos son muchos. En lugar de examinar el grupo entero
llamado población o universo, se examina una pequeña parte del grupo llamada
muestra.
Población finita Una población finita es aquella que tiene un número limitado de
elementos.
Ejemplo
La estatura de los estudiantes del curso de estadística del periodo 2-2020
Población infinita Una población infinita es aquella que no tiene límites, es decir, tiene
un número infinito de elementos.
Ejemplo
La cantidad de peces en un río.
Parámetro: Es una medida resumen que describe una característica de toda la
población.

Los parámetros más usados son:


• La media poblacional
• Desviación típica poblacional
• Proporción poblacional
Muestra
Definición "Se llama muestra a una parte de la población a estudiar que sirve para
representarla".
Una muestra debe ser definida en base de la población determinada, y las
conclusiones que se obtengan de dicha muestra solo podrán referirse a la población
en referencia.
Ejemplo
En una empresa se desea saber la opinión de los empleados sobre una posible medida
administrativa a tomar. En la empresa hay aproximadamente 400 empleados, por lo
que es impráctico pretender conocer la opinión de los 400, por ello se decide
seleccionar una muestra de 30.
El estudio de muestras es más sencillo que el estudio de la población completa; cuesta
menos y lleva menos tiempo.
Una muestra representativa contiene las características relevantes de la población en
las mismas proporciones que están incluidas en tal población.
Los expertos en estadística recogen datos de una muestra. Utilizan
esta información para hacer referencias sobre la población que está representada por
la muestra. En consecuencia, muestra y población son conceptos relativos. Una
población es un todo y una muestra es una fracción o segmento de ese todo.

Estadístico o Estadígrafo: es una medida resumen que describe una característica


de la población

Usos de la Estadística
La Estadística proporciona un conjunto de métodos aplicables en todas las áreas
científicas y otras ligada a nuestras actividades cotidianas donde se acumulan, se
analizan y se interpretan datos. Los métodos estadísticos juegan un papel principal en:
Salud y Medicina, Biología, Economía, Ingeniería, etc.
Los principales motivos por los cuales utilizamos la estadística al control de calidad se
basan en:
➢ Las situaciones que se dan en los procesos productivos se concentran en una
determinada medida, denominada tendencia central
➢ Los modelos estadísticos se asemejan mucho a las situaciones que
encontramos en el control de calidad

El Método Estadístico

Es un conjunto de procedimientos, por los cuales se plantean los problemas científicos


y se ponen a prueba las hipótesis y los instrumentos de trabajo investigativo.

La aplicación de este método es lo que diferencia al conocimiento científico del


conocimiento ordinario.

Dato estadístico: todo número que se pueda analizar, comparar e interpretar.

Etapas del método científico

1. Planteamiento del problema (Observación del fenómeno). - Se observa y se


describe el proceso, objeto de estudio. Ejemplo. Se quiere estudiar el
crecimiento de una planta desde su origen, las semillas. Este dependerá de
varios factores, tipo de semilla, tipo de agua de riego, humedad, tipo d tierra,
fertilizantes, temperatura, sol, presión atmosférica, etc.
Formulación de Hipótesis. - Se establecen posibles causas que expliquen el
fenómeno estudiado, que después habrá de confirmar experimentalmente.
Ejemplo Una planta crece más que otra, porque la primera está en un suelo
ácido y la segunda en suelo básico.

2. Recolección de la información. – La recolección correcta de los datos es de


extrema importancia para el investigador, que tiene que ser realizada o vigilada
por éste. Esta etapa consiste en: determinar los métodos de recolección,
preparar los instrumentos de recolección, prueba del método y de los
instrumentos de recolección seleccionados y realizar la recolección de los
datos.
3. Organización y Clasificación de los datos. – Aquí se debe hacer un análisis
de consistencia y ajustes de los datos. Se trata de asegurar la validez y
confiabilidad de los datos recopilados. Luego se debe clasificar y tabular los
datos y finalmente presentarlos en cuadros estadísticos y gráficas

4. Análisis e interpretación de los resultado. – En esta etapa se calculan


indicadores y medidas resumen que describen al conjunto de datos.

Recolección de los datos

Existen tres métodos básicos con los cuales el investigador puede obtener los datos
deseados: en primer lugar, el investigador puede recurrir a datos ya publicados por
fuentes gubernamentales (INE), industriales o individuales; en segundo lugar, puede
diseñar un experimento para obtener los datos necesarios, y en tercer lugar, puede
efectuar una encuesta.

Fuentes de información. - Es el lugar, la institución, la persona donde están los datos


que se necesitan para cada una de las variables o aspectos de la investigación. Las
fuente pueden ser:

• Fuentes de datos internos Es la información recopilada por la empresa de


los resultados de su propia gestión. Ejemplos:
a) Reportes financieros
b) Reportes operacionales (producción, ventas, etc.)
c) Reportes especiales, es información adicional

• Fuentes de datos externos Son informaciones estadísticas elaboradas por


instituciones de investigación, ya sean públicos o privadas.
• Fuentes de primarias Cuando la información estadística es obtenida
directamente de la unidad de observación. Por ejemplo, los resultados de los
censos de población y vivienda, índices de precios al consumidor, etc.
• Fuentes secundarias Cuando se obtiene información estadística elaborada a
base de los datos de fuentes primarias.
El organismo oficial en nuestro país es el Instituto nacional de Estadísticas (INE)
El ministerio de Economía lleva información del comercio internacional, ingresos
y egresos.

Tipos de datos

Sea cual fuera la fuente de la información, esta puede estar referida a características
cualitativas o cuantitativas.
Variables y Atributos:
Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que
pueden ser expresados mediante números. Son caracteres susceptibles de medición
tales como por ejemplo, la estatura, el peso, el salario, la edad, etc.
“Una variable es un símbolo, tal como X, Y, etc., que puede tomar un valor cualquiera
de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable
puede tomar solamente un valor, se llama constante."
Todos los elementos de la población poseen los mismos tipos de caracteres, pero
como estos en general no suelen representarse con la misma intensidad, es obvio que
las variables toman distintos valores. Por lo tanto, estos distintos números o medidas
que toman los caracteres son los "valores de la variable". Todos ellos juntos
constituyen una variable.
Los atributos también llamados caracteres cualitativos, son aquellos que no son
susceptibles de medición, es decir que no se pueden expresar mediante un número.
"Reciben el nombre de variables cualitativas o atributos, aquellas características que
pueden presentarse en individuos que constituyen un conjunto”.
La forma de expresar los atributos es mediante palabras, por ejemplo; profesión,
estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en
la misma forma en todos los elementos. Estas distintas formas en que se presentan
los atributos reciben el nombre de "modalidades".

Una variable es una característica de la población que se va a investigar y que puede


tomar diferentes valores.

Las variables pueden ser de dos tipos:

Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo:


nacionalidad, color de la piel, sexo). Se clasifican en nominales y ordinales.
• Variables cualitativas nominales. – Son aquellas que establecen la distinción
de los elementos en categorías sin implicar orden entre ellas, por naturaleza no
son numéricos (sexo, color de ojos, grado de estudio).
• Variables cualitativas ordinales. – Son aquellas que agrupan a los objetos,
individuos, en categorías ordenadas, para establecer relaciones comparativas.
Es decir, son susceptibles de ordenación, pero no de medición cuantitativas.

Variables cuantitativas: Se llaman así, cuando la variable está asociada a una


característica cuantitativa. Es decir, estas surgen cuando se pueden establecer cuánto
o en qué cantidad se posee una determinada característica. Tienen valor numérico
(edad, precio de un producto, ingresos anuales). Se clasifican en discretas y continuas.

• Las variables discretas son aquellas que pueden tomar solo un número
limitado de valores separados y no continuos; son aquellas que solo toman un
determinado números de valores, porque entre dos valores consecutivos no
pueden tomar ningún otro; por ejemplo el número de estudiantes de
una clase es una variable discreta ya que solo tomará los valores 1, 2, 3, 4...
nótese que no encontramos valor como 1,5 estudiantes
• Las variables continuas se caracterizan por el hecho de que para todo para
de valores siempre se puede encontrar en valor intermedio, (el peso, la estatura,
el tiempo empleado para realizar un trabajo, etc.)
Una variable es continua, cuando puede tomar infinitos valores intermedios
dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la
temperatura.

Tipos de muestras

Existen básicamente dos clases de muestras: muestra no probabilísticas y muestra


probabilísticas.
Muestras no probabilísticas Llamada también muestreo no aleatorio o de juicio Una
muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con
la población.

Muestra probabilísticas Son aquellas en que todos los elementos de la población


tienen la oportunidad de ser escogidos en la muestra.

Los datos estadísticos se obtienen mediante un proceso que comprende la


observación directa o medición de variables (instrumentos de medidas), ya que
producen valores que tienden a mostrar cierto grado de variabilidad, al efectuarse
mediciones sucesivas.
Actualmente existen diversas formas de muestrear, pero previo a la descripción de
cada una de ellas, necesitamos tener claro algunas definiciones básicas relacionadas
con la teoría de muestreo que nos ayude a precisar el concepto de dichos métodos.
Definiciones Importantes

Grado o Nivel de Confianza


El Grado o nivel de confianza es la probabilidad de que la estimación efectuada se
ajuste a la realidad.
El nivel o grado de confianza es siempre fijado por el investigador en base a su
experiencia y conocimiento acerca de la población a investigar. Generalmente se
trabaja con el 95% de confianza correspondiente a un valor de Z=1.96, el mismo que
usaremos en esta investigación.
Error de Muestreo
El error de muestreo admisible es también definido por el investigador y está
representado por e o E, debemos tomar en cuenta que a mayor error menor será el
tamaño de la muestra y, así mismo, al contrario, a menor error mayor será el tamaño
de la muestra. Normalmente en las investigaciones utilizamos un error del 4%.
Fórmula para calcular y el tamaño de la muestra

Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula:

𝑁𝜎 2 𝑍 2
𝑛=
(𝑁 − 1)𝑒 2 + 𝜎 2 𝑍 2
Donde:

n = el tamaño de la muestra.

N = tamaño de la población.

𝜎 = Desviación estándar de la población que, generalmente cuando no se tiene su


valor, suele utilizarse un valor constante de 0,5.

Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se


tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más
usual) o en relación al 99% de confianza equivale 2,58, valor que queda a criterio del
investigador.
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor,
suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a
criterio del encuestador.

Ejemplo

Calcular el tamaño de la muestra de una población de 400 trabajadores con un nivel


de confianza del 95%

Solución:

Se tiene N=400, para el 95% de confianza Z = 1,96, y como no se tiene los demás
valores se tomará 𝜎 = 0,5, y e = 0,05.

Reemplazando valores de la fórmula se tiene:

𝑁𝜎 2 𝑍 2
𝑛=
𝑒 2 (𝑁 − 1) + 𝜎 2 𝑍 2

400 ∙ 0,52 ∙ 1,962


𝑛=
0,052 (400 − 1) + 0,52 ∙ 1,962

400 ∙ 0,52 ∙ 1,962


𝑛= = 196
0,052 (400 − 1) + 0,52 ∙ 1,962

Métodos para obtener muestras probabilísticas

Ya sabemos que las muestras probabilísticas son aquellas en que todos los elementos,
de la población tienen una probabilidad conocida de ser seleccionados. A
continuación, veremos algunos de los procedimientos más usuales para la selección
de muestras probabilísticas. Existen al menos cuatros métodos comúnmente
utilizados:

❖ Muestreo Aleatorio
• Simple
• Estratificado

❖ Muestreo Sistemático
❖ Muestreo Estratificado
❖ Muestreo por conglomerados
Muestreo Aleatorio Simple
Previo a la definición del Muestreo Aleatorio Simple, es necesario recalcar que la
población de esta investigación es finita; ya que conocemos el total de elementos o
entes a investigar.

Una muestra aleatoria simple tomada de una población finita, es seleccionada de tal
manera que cada muestra posible del mismo tamaño tiene igual probabilidad de ser
seleccionada de la población. Para obtener una muestra aleatoria simple, cada
elemento en la población debe tener la misma probabilidad de ser seleccionado.

El objetivo fundamental de este tipo de muestreo es tratar de eliminar la predisposición


con la que los elementos de la muestra podrían ser elegidos. El método más fácil que
se utiliza para lograr extraer la muestra es enumerar todos los N elementos, luego
fijamos el tamaño n de la muestra y empezamos a tomar al azar los n números.
Ejemplo
Se decide implementar un programa de inspección de los rodamientos que fabrica una
maquina en la fábrica Rodamac. La máquina fabrica 1200 rodamientos por semana.
Se ha decidido tomar una muestra de 200 rodamientos. Se ha decidido utilizar el
método aleatorio simple.

Datos
Población de la localidad 1200 rodamientos
Muestra = 200 rodamientos
Colocar un numero en cada uno de los rodamientos
Numerarlos de 1 a 1200
Selección aleatoria de 200 números
Muestreo Aleatorio Estratificado
Para obtener una muestra aleatoria estratificada, primero se divide la población de N
individuos en H grupos, llamados estratos, cada uno de ellos con sus propias
características, esto es son heterogéneos entre sí, pero en su interior son lo más
homogéneos posible y en conjunto abarcan en su totalidad a la población, esto es:

N = N1 + N2 + N3 + N4 + ... + NH

Donde N1, N2, N3, N4,…,NH son los tamaños de cada uno de los estratos.
Definido cada estrato y cumpliendo la homogeneidad en el interior de ellos, se extrae
una muestra aleatoria simple de cada uno de ellos, dichas extracciones deben
realizarse en forma independiente en cada uno de los estratos. El tamaño de cada uno
de los estratos es representado por:

n = n1 + n 2 + n 3 + n 4 + ... + n H

El tamaño de las muestras de los H estratos pueden ser de igual o diferente tamaño,
esto varía de acuerdo al tamaño de cada estrato.

Muestreo Sistemático

En este procedimiento, se selecciona una muestra, tomando cada k-ésima unidad de


la población una vez que las unidades de muestreo están numeradas o arregladas en
alguna forma. El número k es la razón de muestreo; esto es la razón del tamaño de la
población N al tamaño de la muestra n (k=N/n).

Ejemplo

Se acercan las Navidades y cierta empresa de panetones cree que no va a poder


entregar todos los pedidos a tiempo, a no ser que aumente la plantilla. La empresa
dispone de un listado ordenado alfabéticamente de 20 personas con las mismas
características para el puesto y que actualmente están en desempleadas. Puesto que
el tiempo apremia y no es posible hacer una entrevista para seleccionar al personal,
se decide elegir cinco trabajadores de forma aleatoria usando el muestreo sistemático.

Tenemos que elegir 5 elementos sistemáticamente de un total de 20, por lo tanto, se


debe elegir uno de cada k=20/5=4.

Se elige el punto de partida eligiendo un número al azar entre 1 y 4. Si obtenemos, por


ejemplo, h=2, los elementos de la muestra serán 2, 2+4, 6+4, 10+4;

es decir: 2, 6, 10, 14, 18.

Muestreo Estratificado

Se utiliza cuando la población no es homogénea, sino que pueden en ella identificarse


clases definidas por algún atributo o característica relacionada con la variable que se
estudia.

Este procedimiento implica dividir la población en clases o grupos homogéneos


relativos a las características que van a estudiarse, llamados estratos. Después se
toma una submuestra de cada estrato de uno de los métodos ya estudiados.
Producción de Pernos por cada Maquina
Maquinas Producción Porcentaje Muestra
Maquina A 3.500 55,56% 201
Maquina B 1.800 28,57% 103
Maquina C 600 9,52% 35
Maquina D 400 6,35% 23
TOTAL 6.300 100,00% 362

Observación: Utilizando la fórmula para determinar el número de muestras n, se


encontró n=362.

Muestreo por conglomerados

Se usa en poblaciones grandes y muy dispersas desde el punto de vista geográfico, y


en los cuales el muestreo aleatorio simple sería poco económico debido a que daría
lugar a muestras igualmente dispersas.

En este tipo de muestreo, en lugar de seleccionar directamente los elementos los


elementos de la población se hace una selección inicial de grupos o conglomerados,
que son agrupaciones de elementos que deben ser los más heterogéneos posibles a
diferencia de los estratos, de suerte que cada una de ellas resulte una réplica reducida
de la población, la muestra general está formado por todas o por una submuestra de
las unidades en cada conglomerado.

También podría gustarte