Está en la página 1de 13

República Bolivariana de Venezuela

Ministerio del Poder Popular para la Educación Superior

Aldea universitaria “Dr. José Rafael Revenga “

Misión Sucre

ANÁ LISIS DE DATOS Unidad I

ESTADÍSTICOS I

Profesora: Triunfadora:

Juanma Pérez Rosa Hernández

CI: V-8246251
Contenido
Introducción............................................................................................................2
Estadísticas............................................................................................................3
Población................................................................................................................5
Características de la población..............................................................................5
Muestra...................................................................................................................5
Características de una muestra estadística representativa...................................7
Variables.................................................................................................................7
Datos......................................................................................................................8
Tipos de datos........................................................................................................9
Conclusión............................................................................................................11
Bibliografía............................................................................................................12
Introducción
Estadísticas
La estadística (la forma femenina del término alemán Statistik, derivado a su
vez del italiano statista, "hombre de Estado"),1 es la rama de las matemáticas que
estudia la variabilidad, colección, organización, análisis, interpretación, y
presentación de los datos, así como el proceso aleatorio que los genera siguiendo
las leyes de la probabilidad.2 Como parte de la matemática, la estadística es una
ciencia formal deductiva, con un conocimiento propio, dinámico y en continuo
desarrollo obtenido a través del método científico formal. En ocasiones, las
ciencias fácticas necesitan utilizar técnicas estadísticas durante su proceso de
investigación factual, con el fin de obtener nuevos conocimientos basados en la
experimentación y en la observación. En estos casos, la aplicación de la
estadística permite el análisis de datos provenientes de una muestra
representativa, que busca explicar las correlaciones y dependencias de un
fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.

La estadística es útil para una amplia variedad de ciencias fácticas, desde la física
hasta las ciencias sociales, desde las ciencias de la salud hasta el control de
calidad. Además, se usa en áreas de negocios o instituciones gubernamentales
con el objetivo de describir el conjunto de datos obtenidos para la toma de
decisiones, o bien para realizar generalizaciones sobre las características
observadas.

En la actualidad, la estadística aplicada a las ciencias fácticas permite estudiar


una determinada población a partir de la recopilación de información, el análisis de
datos y la interpretación de resultados. Del mismo modo, también es una ciencia
esencial para el estudio cuantitativo de los fenómenos de masa o colectivos.

La estadística se divide en dos grandes áreas:

 Estadística descriptiva: Se dedica a la descripción, visualización y


resumen de datos originados a partir de los fenómenos de estudio. Los
datos pueden ser resumidos numérica o gráficamente. Su objetivo es
organizar y describir las características sobre un conjunto de datos con
el propósito de facilitar su aplicación, generalmente con el apoyo de
gráficas, tablas o medidas numéricas.

Ejemplos básicos de parámetros estadísticos son: la media y la desviación


estándar.

Ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre


otros.

 Estadística inferencial: Se dedica a la generación de los modelos,


inferencias y predicciones asociadas a los fenómenos en cuestión
teniendo en cuenta la aleatoriedad de las observaciones. Se usa para
modelar patrones en los datos y extraer inferencias acerca de la
población bajo estudio. Estas inferencias pueden tomar la forma de
respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de
unas características numéricas (estimación), pronósticos de futuras
observaciones, descripciones de asociación (correlación) o
modelamiento de relaciones entre variables (análisis de regresión). Otras
técnicas de modelamiento incluyen análisis de varianza, series de
tiempo y minería de datos. Su objetivo es obtener conclusiones útiles
para lograr hacer deducciones acerca de la totalidad de todas las
observaciones hechas, basándose en la información numérica.

Ambas ramas (descriptiva e inferencial) se utilizan en la estadística aplicada. La


estadística inferencial, por su parte, se divide en estadística paramétrica y
estadística no paramétrica.

Existe también una disciplina llamada estadística matemática que establece las
bases teóricas de las técnicas estadísticas. La palabra «estadísticas» se refiere al
resumen de resultados estadísticos, habitualmente descriptivos, como en
estadísticas económicas, estadísticas criminales, etcétera.
Población
La población es el conjunto de personas o animales de la misma especie que
se encuentran en un momento y lugar determinado.

Es decir, aunque la palabra población sea usualmente más usada para hacer
alusión a una comunidad humana, también puede aplicar a otros animales.

Cabe señalar que puede hablarse de poblaciones de países, localidades o


cualquier delimitación geográfica con autonomía política. Así, conocer la población
de una ciudad es importante, por ejemplo, para saber cuántas personas están
habilitadas para emitir su voto.

Vale mencionar que la ciencia que estudia las poblaciones humanas se llama
demografía, analizando cómo se distribuyen y cómo evolucionan en el tiempo.

Características de la población
Entre las características de una población destacan:

Es un colectivo que está en constante evolución. Sus individuos de mayor edad


irán falleciendo, mientras que irán naciendo nuevos integrantes del grupo. Así,
dependiendo de la tasa de natalidad y de mortalidad, la edad promedio de la
población podría subir o bajar.

Un individuo puede pertenecer a una población y a otra al mismo tiempo. Por


ejemplo, quienes forman parte de la población de Lisboa también forman parte de
la población portuguesa.

Las poblaciones son estudiadas desde la estadística, a partir de la cual se buscan


hallar determinados indicadores como la media de la expectativa de vida.

Muestra
Una muestra estadística es un subconjunto de datos perteneciente a una
población de datos. Estadísticamente hablando, debe estar constituido por un
cierto número de observaciones que representen adecuadamente el total de los
datos.

La estadística, como rama de las matemáticas, se encarga de recoger datos,


ordenarlos y analizarlos. Es decir, cuando queremos estudiar un determinado
fenómeno recurrimos a la estadística. Un buen ejemplo de fenómeno que estudia
la estadística, es el salario medio de los ciudadanos de un país

En este sentido, por cuestiones de tiempo y coste, no podemos recoger la


totalidad de los datos. Esta totalidad de los datos es lo que se conoce como
población de datos o, simplemente, población.

¿Por qué se trabaja con muestras estadísticas?

Para explicar porque se utiliza una muestra estadística en lugar de la población


total, vamos a recurrir al ejemplo planteado anteriormente.

Supongamos que queremos estudiar un fenómeno cualquiera. En nuestro caso,


ese fenómeno es el salario medio de los ciudadanos de un país. La población de
datos está formada por todos y cada uno de los trabajadores del país. Claro que
por razones de tiempo y coste sería imposible ir preguntando a cada trabajador
cual es su salario anual. Tardaríamos mucho tiempo o necesitaríamos muchos
recursos.

En este punto aparece el concepto de muestra estadística. En lugar de preguntar


a los millones de trabajadores de un país o región, tan solo recogemos una
pequeña cantidad de datos. Por ejemplo, preguntamos a 100.000 personas. Esta
tarea sigue siendo complicada, pero es mucho más asequible preguntar a 100.000
personas que preguntar a 30 millones.

Esta pequeña cantidad de datos ha de ser representativa. Es decir, debe


representar adecuadamente a la población. Si las 100.000 personas a las que
preguntamos se concentran en barrios ricos, obtendremos datos que no son
representativos. El salario medio nos saldría mucho más alto de lo que es en
realidad.
Características de una muestra estadística representativa
Si se quiere hacer una buena investigación, la calidad de la muestra estadística
es esencial. De nada sirve realizar las métricas estadísticas más complejas con
los modelos más sofisticados si la muestra estadística está sesgada. Es decir, si la
muestra no es representativa.

A la hora de obtener una muestra representativa existen ciertos aspectos que el


investigador debe conocer de antemano. Entre esos aspectos se encuentran las
características de una muestra representativa. Las características de una muestra
representativa son las siguientes:

 Tamaño suficientemente grande: Cuando trabajamos con muestras


estamos, normalmente, trabajando con una cantidad de datos inferior a la
población. Ahora bien, para que una muestra estadística sea representativa
deberá ser lo suficientemente grande como para considerarse
representativa. Por ejemplo, si nuestra población está formada por 10
millones de datos y escogemos 10, es difícil que sea representativa. Eso sí,
no siempre a mayor tamaño la muestra es más representativa.

 Aleatoriedad: La selección de los datos de una muestra estadística debe


ser aleatoria. Es decir, debe ser totalmente al azar. Si en lugar de realizarlo
al azar, realizamos un proceso de selección de datos planificado, estamos
introduciendo un sesgo a la obtención de datos. Por tanto, para evitar que
la muestra sea sesgada y, por tanto, conseguir que sea una muestra
representativa, debemos hacer una selección aleatoria.

Variables
Una variable estadística es una característica que puede fluctuar y cuya
variación es susceptible a adoptar diferentes valores, los cuales pueden medirse u
observarse. Las variables adquieren valor cuando se relacionan con otras
variables, es decir, si forman parte de una hipótesis o de una teoría. En este caso
se las denomina constructos o construcciones hipotéticas.
A partir de este concepto se puede mencionar que una variable es la que permite
relacionarla con algún problema o fenómeno, el cual vamos a investigar y buscar
posible soluciones.

Mediante este concepto se puede mencionar que las variables tienen una
clasificación:

 categóricas

 numéricas

Las variables categóricas se dividen de la siguiente forma:

 Dicotómicas

 Nominales

 Ordinales

Y las variables numéricas se dividen de la siguiente manera:

 Continua

 Discreta

Podemos definir como variable cualitativa, toda aquella variable que, como su
propio nombre indica, expresa una cualidad, característica o modalidad. Se
conoce como atributo o categoría a cada modalidad que se presenta, y la
medición de la misma es la clasificación de dichos atributos.

Datos
Los datos representan un fragmento de una cantidad, medida, descripción o
palabra, los cuales son agrupados o clasificados de una determinada manera para
generar de información.

En forma general, los datos solo sirven después de ser procesados según una
intención y relevancia.
Las bases de datos, por ejemplo, agrupan los datos en estructuras lógicas y
sistemáticas para luego ser analizadas o procesadas según un propósito.

En informática, los datos alimentan todo los sistemas. La identificación de los


datos es generado por el sistema de estructura de datos del programa informático.
La representación de estos datos son los que inciden en la creación de algoritmos
o instrucciones.

En una investigación, la recolección de datos sirve para obtener información


relevante para la generación de una hipótesis o para apoyar los argumentos
expuestos mediante el análisis de datos. Una forma de recolección de información
es la encuesta.

Algunas de las formas para la recopilación de datos son hechas, por ejemplo, a
través de encuestas o datos estadísticos, este último se define como resultados
que ayudan a inferir sobre probabilidades.

Los datos como algo genérico, se usa para referirse, por ejemplo, a:

 Datos personales: indican nombre, sexo, dirección, número de teléfono,


dirección de correo electrónico, etc,

 Datos curiosos: se refieren a hechos interesantes que sirven para asombrar


o entretener.

Tipos de datos
En programación, los tipos de datos es la forma en que se clasifican para ser
usados para la generación de un proceso, programa o instrucción.

Los tipos de datos se clasifican en:

 Datos numéricos: comporta todos los tipos de números sean ellos enteros,
decimales, reales o exponenciales.
 Datos alfanuméricos: son caracteres alfabéticos, numéricos o especiales
que no son usados para operaciones matemáticas. También se incluye lo que se
llaman cadenas que son datos más extensos como, por ejemplo, la dirección de
alguien.
 Datos lógicos: responden a la pregunta con un verdadero (true) o falso
(false).
Conclusión
Bibliografía

También podría gustarte