Está en la página 1de 15

República Bolivariana de Venezuela

Ministerio del Poder Popular para la Defensa

Universidad Nacional Experimental Politécnica

De la Fuerza Armada Nacional

UNEFA – Núcleo Puerto Cabello

INTRODUCCIÓN A LA
ESTADÍSTICA

Profesor: Bachilleres

Lic. Wander Lopez -Herrera Angiee

-Dumont José

-Zerpa Hugo

-Betancourt Darwins

3er Semestre, Ing. Naval

Puerto Cabello, Mayo del 2017


Índice

 Introducción.
 Estadística
 Población y Muestra
 Distribución de Frecuencias
 Construcción de una Distribución de Frecuencias
 Estadística y Parámetros
 Estadísticos muy importantes (media, varianza y desviación típica)
 Calculo de media, varianza y desviación típica para datos agrupados y no agrupados
 Bibliografía
 Conclusión
Introducción

La presente investigación se refiere al tema de la Estadística, que se puede definir es la


ciencia cuyo objetivo es reunir una información para facilitar al hombre el estudio de datos
masivos de individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos
datos unos significados precisos o unas previsiones para el futuro.

También se refiere a la importancia, métodos e importancia de la estadística ya que está


relacionada con el estudio de proceso cuyo resultado es más o menos imprescindible y con la
finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales
observaciones

La Estadística se ocupa de los métodos científicos para recolectar, organizar, resumir,


presentar y analizar datos, así como de sacar conclusiones válidas y tomar decisiones con base en
este análisis, así también realizar predicciones a cerca del conjunto del cual se han seleccionado
dichos datos. El empleo cuidadoso de los métodos estadísticos permite obtener información
precisa de los datos.
Estadística

Es una rama de las matemáticas y una herramienta que estudia usos y análisis provenientes
de una muestra representativa de datos, que busca explicar las correlaciones y dependencias de un
fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.

Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Además, se usa en áreas de negocios o
instituciones gubernamentales ya que su principal objetivo es describir al conjunto de datos
obtenidos para la toma de decisiones o bien, para realizar generalizaciones sobre las características

Hoy en día, la estadística es una ciencia que se encarga de estudiar una determinada
población por medio de la recolección, recopilación e interpretación de datos. Del mismo modo,
también es considerada una técnica especial apta para el estudio cuantitativo de los fenómenos de
masa o colectivo.

La estadística se divide en dos grandes áreas:

 Estadística descriptiva: Se dedica a la descripción, visualización y resumen de datos


originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica
o gráficamente. Su objetivo es organizar y describir las características sobre un conjunto de
datos con el propósito de facilitar su aplicación, generalmente con el apoyo de gráficas,
tablas o medidas numéricas.

Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar.

Ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.

 Estadística inferencial: Se dedica a la generación de los modelos, inferencias y predicciones


asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las
observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la
población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas
sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación),
pronósticos de futuras observaciones, descripciones de asociación (correlación) o
modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de
modelamiento incluyen análisis de varianza, series de tiempo y minería de datos. Su
objetivo es obtener conclusiones útiles para lograr hacer deducciones acerca de la totalidad
de todas las observaciones hechas, basándose en la información numérica.

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada, pero la


estadística inferencial, por su parte, se divide en estadística paramétrica y estadística no
paramétrica.

Existe también una disciplina llamada estadística matemática, la que se refiere a las bases
teóricas de la materia. La palabra «estadísticas» también se refiere al resultado de aplicar los
logaritmos S estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas
criminales, etc.
Población y Muestra

Población:

Es la colección de datos que corresponde a las características de la totalidad de individuos,


objetos, cosas o valores en un proceso de investigación.

Para su estudio, en general se clasifican en Poblaciones Finitas y Poblaciones Infinitas.

 Poblaciones Finitas: Constan de un número determinado de elementos, susceptible a ser


contado. Ejemplo: Los empleados de una fábrica, elementos de un lote de producción, etc.
 Poblaciones Infinitas: Tienen un número indeterminado de elementos, los cuales no pueden
ser contados. Ejemplo: Los números naturales.

Así también las poblaciones pueden ser clasificadas en Reales e Hipotéticas, las reales son
aquellas concretas, que ya existen. Ejemplo: Los aspirantes a un puesto de trabajo, los vendedores
de una empresa. Mientras que las hipotéticas, son las formas imaginables en que se podría
presentar un suceso. Ejemplo: Estimaciones de la población económicamente activa dentro de diez
años.

En toda investigación lo ideal sería contar con observaciones o características de todos los
elementos de nuestro grupo de interés, pero en muchas ocasiones eso sería muy caro y/o muy
tardado o simplemente imposible, es por ello que se toman muestras.

Muestra:

“Es una parte representativa de la población que es seleccionada para ser estudiada, ya que la
población es demasiado grande para ser estudiada en su totalidad” Allen Webster.

Distribución de Frecuencias

Se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente


excluyentes que indican el número de observaciones en cada categoría. Esto proporciona un valor
añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones
clasificadas de modo que se pueda ver el número existente en cada clase.

Tipos de Frecuencia:

 Frecuencia absoluta: La frecuencia absoluta es el número de veces que aparece un


determinado valor en un estudio estadístico. La suma de las frecuencias absolutas es igual
al número total de datos, que se representa por N. Para indicar resumidamente estas sumas
se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
 Frecuencia relativa: La frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se
representa por ni. La suma de las frecuencias relativas es igual a 1.
 Frecuencia acumulada: La frecuencia acumulada es la suma de las frecuencias absolutas de
todos los valores inferiores o iguales al valor considerado. Se representa por Fi.
 Frecuencia relativa acumulada: La frecuencia relativa acumulada es el cociente entre la
frecuencia acumulada de un determinado valor y el número total de datos. Se puede
expresar en tantos por ciento.

Distribución de frecuencias agrupadas:

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las


variables toman un número grande de valores o la variable es continua. Se agrupan los valores en
intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente. Límites de la clase. Cada clase está delimitada por el límite inferior de la clase y el
límite superior de la clase.

La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. La marca


de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el
cálculo de algunos parámetros.

Construcción de una Distribución de Frecuencias

1. Recopilación de datos: Consiste en escribir los datos de la muestra que nos interesa
conocer, sin importar el orden.
2. Ordenamiento de los datos: Consiste en ordenar los datos en forma ascendente o
descendente para facilitar el conteo de datos que correspondan a cada uno de los
intervalos
3. Determinación del número de clases: El número de clases en que se agrupan los datos se
determina con la raíz cuadrada del número de datos cuando este es menor de 200. Para
muestras con 200 o más datos el número de clases se determina con la raíz cúbica del
número de datos.
4. Cálculo del tamaño de clase: Para determinar el tamaño de clase es necesario conocer el
rango de la muestra, que se obtiene con la diferencia entre el dato mayor y el dato menor
de la muestra y se representa con la letra R
5. Elaboración de intervalos: El tamaño de clase indica el número de datos que conforman a
cada intervalo, considerando los valores extremos llamados límites. En cada intervalo
aparece un límite inferior (LI) y un límite superior (LS).Cada intervalo se forma sumando al
límite inferior (LI) un número menos que el tamaño de clase para obtener el límite
superior (LS).En la elaboración de la distribución de frecuencias se debe dejar un renglón
antes de la primera clase y otro después de la última. Si en la elaboración de los intervalos
se observa que algunos datos quedan fuera del número de clases, entonces se debe
agregar una clase más al final, esto no alterará los resultados.
6. Obtención de Frecuencias: La frecuencia de clase se obtiene contando, en la tabla de
datos ordenados, los que correspondan al intervalo de dicha clase.
Estadística y Parámetros

Un parámetro estadístico es un número que se obtiene a partir de los datos de una


distribución estadística.

Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por
una gráfica.

Tipos de parámetros estadísticos:

De centralización, de posición y de dispersión.

Medidas de centralización:

Nos indican en torno a qué valor (centro) se distribuyen los datos. Las medidas de centralización
son:

 Media aritmética: La media es el valor promedio de la distribución.


 Mediana: La mediana es la puntación de la escala que separa la mitad superior de la
distribución y la inferior, es decir divide la serie de datos en dos partes iguales.
 Moda: La moda es el valor que más se repite en una distribución.

Medidas de posición

Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de
individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor
a mayor. Las medidas de posición son:

 Cuartiles: Los cuartiles dividen la serie de datos en cuatro partes iguales.


 Deciles: Los deciles dividen la serie de datos en diez partes iguales.
 Percentiles: Los percentiles dividen la serie de datos en cien partes iguales.

Medidas de dispersión

Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la
distribución. Las medidas de dispersión son:

 Rango o recorrido: El rango es la diferencia entre el mayor y el menor de los datos de una
distribución estadística.
 Desviación media: La desviación media es la media aritmética de los valores absolutos de
las desviaciones respecto a la media.
 Varianza: La varianza es la media aritmética del cuadrado de las desviaciones respecto a la
media.
 Desviación típica: La desviación típica es la raíz cuadrada de la varianza.
Estadísticos muy importantes

 Media: Es una medida de tendencia central que según la Real Academia Española (2001).
Resulta al efectuar una serie determinada de operaciones con un conjunto de números y
que, en determinadas condiciones, puede representar por sí solo a todo el conjunto».
Existen distintos tipos de medias, tales como la media geométrica, la media ponderada y la
media armónica aunque en el lenguaje común, el término se refiere generalmente a la
media aritmética.
 Varianza: Es una medida de dispersión definida como la esperanza del cuadrado de la
desviación de dicha variable respecto a su media. Está medida en la unidad de medida de la
variable al cuadrado. Por ejemplo, si la variable mide una distancia en metros, la varianza
se expresa en metros al cuadrado. La desviación estándar es la raíz cuadrada de la varianza,
es una medida de dispersión alternativa expresada en las mismas unidades de los datos de
la variable objeto de estudio. La varianza tiene como valor mínimo 0. Hay que tener en
cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su
uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos
se recomienda el uso de otras medidas de dispersión más robustas.
 Desviación típica: es una medida de dispersión para variables de razón (variables
cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la
varianza de la variable. Para conocer con detalle un conjunto de datos, no basta con conocer
las medidas de tendencia central, sino que necesitamos conocer también la desviación que
presentan los datos en su distribución respecto de la media aritmética de dicha distribución,
con objeto de tener una visión de los mismos más acorde con la realidad al momento de
describirlos e interpretarlos para la toma de decisiones.

Calculo de Media, Varianza y Desviación Típica

Para datos agrupados

 Media:
Para datos agrupados: Se calcula sumando todos los productos de marca clase con
la frecuencia absoluta respectiva y su resultado dividirlo por el número total de
datos:
La marca clase de una tabla para datos agrupados en intervalos corresponde al promedio
de los extremos de cada intervalo.

Ejemplo: En la siguiente tabla se muestran las edades de un grupo de personas.

Calculemos la media aritmética:

Para datos agrupados: Si los datos vienen agrupados en una tabla de frecuencias, la expresión de
la media es:
Ejemplo:

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la
tabla. Calcula la puntuación media.

xi fi xi · fi

[10, 20) 15 1 15

[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

[60,70) 65 4 260

[70, 80) 75 2 150

42 1 820

 Varianza: La varianza se representa por


Varianza para datos agrupados:

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.

Ejemplo: Calcular la varianza de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Para datos no agrupados: Para calcular la varianza de un conjunto de datos no agrupados se utiliza
la fórmula:

Lo que es equivalente a:
 Desviación Típica: La desviación típica se representa por σ.

Desviación típica para datos agrupados:

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes
a las anteriores.

Ejemplo: Calcular la desviación típica de la distribución:

9, 3, 8, 8, 9, 8, 9, 18
Para datos no agrupados: La fórmula para calcular la desviación estándar para datos no agrupados
está dada por la siguiente expresión:

Dónde:

n = Número de datos o elementos de la muestra.

I = Índice de la suma que toma los valores 1, 2, 3...n.

X =Valor del i-ésimo dato de la muestra.

= Media aritmética de la muestra.

Cualquiera de las fórmulas puede usarse indistintamente, pero en la práctica es común el uso de la
segunda. En ésta, al cociente n – 1 se le denomina corrección de Bessel.

Calculemos la desviación estándar para el siguiente conjunto dedatos no agrupados:

A = {2, 4, 6, 8, 10}

De este conjunto se desprende que:

n = 5 x1 = 2 x2 = 4 x3 = 6 x4 = 8 x5 = 10

Con estos datos, procedemos a calcular la media aritmética del conjunto:

Y a continuación se sustituyen los valores anteriores en la fórmula:

Tal como se muestra a continuación:


Bibliografía

 www.monografias.com
 es.wikipedia.org
 estadisticaparaadministracion.blogspot.com
 www.vitutor.com
 www.vae.edu.mx
 www.portaleducativo.net
 moodle2.unid.edu.mx
Conclusión

La estadística provino desde antes de Cristo en el país de Egipto, Persia, babilonia desde
que Moisés levanto un censo del pueblo y cuando ha avanzado, primer censo en América fue llevado
a cabo por los Incas y como muchos matemáticos, filósofos, teólogos, han experimentado y aplicado
la estadística hasta hoy en día que la seguimos utilizando y aplicando para la sociedad, ya que es un
potente auxiliar de muchas ciencias y actividades humanas: sociología, sicología, geografía humana,
economía, etc.

Los conceptos antes mencionados han sido analizados e investigados de tal manera de
hacer más fácil su comprensión y entendimientos ya que la estadística es la ciencia que trata de
entender, organizar y tomar decisiones que estén de acuerdo con los análisis efectuados

Es recomendable tomar en cuenta que la estadística es muy importante en la vida social


y laboral del hombre ya que generaliza información.

Es una herramienta indispensable para la toma de decisiones.

También es ampliamente empleada para mostrar los aspectos cuantitativos de una


situación

También podría gustarte