martes, 9 de octubre de 2018

TEMA 0: ¿QUÉ ES LA ESTADÍSTICA?

Fuente: Autor Mario Orlando Suárez Ibujes (2010). Conceptos básicos de estadística descriptiva e inferencial. documento en linea 

HISTORIA
Establecer con absoluta claridad y precisión el proceso de desarrollo de esta ciencia que actualmente se llama Estadística, es una tarea difícil ya que la información que se dispone es fragmentada, parcial y aislada.

Es seguro que desde la antigüedad se realizaron inventarios de habitantes, bienes, productos, etc. Estos inventarios o censos (palabra derivada del latín cencere que significa valuar o tasar) se realizaron con fines catastrales, tributarios y militares.

En Egipto ya en el año 3050 a. c se tiene noticias de estadísticas destinadas a fines semejantes a los señalados y especialmente en la construcción de las pirámides.

En China en el año 2000 a. c. se conocen estudios similares. El nacimiento de Cristo coincide con la realización de un censo poblacional en gran escala en el Imperio Romano. Durante mucho tiempo se entendía por "estadística" la información relacionada con el gobierno, la palabra misma se deriva del latín statisticus o estatus que significa "del estado".

Ya en nuestra era, en el año 727, los árabes realizaron estadísticas similares en lo que hoy es España. En Inglaterra en el año 1083 y 1662 y el Alemania en 1741, se llevaron a cabo censos referentes a defunciones, nacimientos, enfermedades, posesión de bienes, migraciones y otros problemas y los datos obtenidos se utilizaron en la previsión y planificación. En América se realizaron encuestas mediante el sistema de "quipus".

El desarrollo científico de la estadística comienza recién en el siglo XVII, con la introducción en el pensum de estudio de las universidades en Alemania.
A comienzos del siglo XX, una nueva aportación de la escuela inglesa, preocupada por problemas de índole agropecuaria y biométrica coloca a la estadística en el tramo final de su establecimiento como ciencia.

En general las primeras aplicaciones de la estadística tuvieron que ver directamente con las actividades del estado. Se cree que la primera persona que hizo uso de la palabra estadística fue Godofredo Achenwall (1719-1772), profesor y economista alemán, escribió sobre el descubrimiento de una nueva ciencia que llamó estadística (palabra derivada de Staat que significa gobierno) y que definió como "el conocimiento profundo de la situación respectiva y comparativa de cada estado".

DEFINICIÓN
Existen muchas definiciones de Estadística, pero en síntesis la podemos definir como la ciencia rama de la Matemática que se ocupa de recolectar, organizar, presentar, analizar e interpretar información cuantitativa para obtener conclusiones válidas, solucionar problemas, predecir fenómenos y ayudar a una toma de decisiones más efectivas.

Otra definición: Conjunto de métodos científicos ligados a la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.

Otra definición: "Arte de la decisión en presencia de incertidumbre".

APLICACIONES
La Estadística anteriormente sólo se aplicaba a los asuntos del Estado, pero en la actualidad la utilizan las compañías de seguros, empresarios, comerciantes, educadores, etc. No hay campo de la actividad humana que no requiera del auxilio de esta ciencia, así, por ejemplo:

- El educador mediante la estadística podrá conocer si un estudiante lee muy bien o regular, si la asistencia es normal o irregular, si la estatura está en relación con la edad, media aritmética de rendimiento escolar en un período determinado, etc.

- El hombre de negocios realiza encuestas estadísticas para determinar la reacción de los consumidores frente a los actuales productos de la empresa y en el lanzamiento de los nuevos.

- El economista emplea una amplia gama de estadísticas para estudiar los planes de los consumidores y efectuar pronósticos sobre las tendencias de las actividades económicas.

- El gerente de una empresa eléctrica proporciona un buen servicio a la comunidad mediante la variación estacional de las necesidades de carga.

- El sociólogo trata de auscultar la opinión pública mediante encuestas, para determinar su preferencia por un candidato presidencial, o su posición frente a determinados problemas económicos, políticos o sociales.

- El geólogo utiliza métodos estadísticos para determinar las edades de las rocas.

- El Genetista determina las semejanzas entre los resultados observados y esperados en una experiencia genética se determina estadísticamente.

FINALIDAD
Conocer las características de un grupo de casos de estudio.
Comparar entre los resultados actuales y los obtenidos en experiencias pasadas para determinar las causas que han influenciado en los cambios.
Predecir lo que pude ocurrir en el futuro de un fenómeno.

OBJETIVOS
Describir numéricamente las características de los conjuntos de observaciones. Esta etapa consiste en recopilar, organizar, tabular y presentar gráficamente los datos, proporcionando una visión cuantitativa de los fenómenos observados.

Analizar los datos de manera objetiva con el fin de disponer de un concepto claro de universo o población y adoptar decisiones basadas en la información proporcionada por los datos de la muestra.

Estimar o predecir lo que sucederá en el futuro con un fenómeno de una manera relativamente aceptable, así, por ejemplo, podemos estimar cuál será la población del país dentro de un determinado número de años conociendo la actual.

MÉTODOS
Recopilación. - Consiste en la obtención de datos relacionados con el problema motivo de estudio, utilizando instrumentos, tales como: cuestionarios, entrevistas, informes, memorias, etc.

Organización. - Consiste en realizar una crítica, corrección, clasificación y tabulación de los datos obtenidos en el paso anterior.

Presentación. - Consiste en mostrar datos de manera significativa y descriptiva. Los datos deben colocarse en un orden lógico que revele rápida y fácilmente el mensaje que contienen. La presentación se la puede hacer a través de gráficos estadísticos.

Análisis. - Consiste en descomponer el fenómeno en partes y luego examinar cada una de ellas con el objetivo de lograr una explicación, haciendo uso, en su mayoría, de los cálculos matemáticos.

Interpretación. - Consiste en un proceso mental, mediante el cual se encuentra un significado más amplio de los datos estadísticos con el objetivo de llegar a conclusiones para la toma de decisiones y solución de problemas.

¿POR QUÉ LA ESTADÍSTICA?
¿Usaron la estadística Galileo, Newton y Einstein?
En ciertas ciencias (Biología, Ciencias Humanas, algunos campos de la Física, ...) aparece el concepto de experimento aleatorio (experimento que repetido en las "mismas condiciones" no produce el mismo resultado) y asociado al mismo el de variable aleatoria.

Una variable no aleatoria (asociada al resultado de una experiencia que sí produce el mismo resultado) está caracterizada por un valor para cada condición.

Una variable aleatoria está caracterizada por la llamada función densidad de probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles valores para cada condición.

Los objetivos de la investigación científica se pueden entender, de un modo muy general, en términos de encontrar y describir las variables de interés y las relaciones entre ellas, para el problema en estudio.

CLASIFICACIÓN DE LA ESTADÍSTICA
1-Estadística Descriptiva o Deductiva
Es un proceso mediante el cual se recopila, organiza, presenta, analiza e interpreta datos de manera tal que describa fácil y rápidamente las características esenciales de dichos datos mediante el empleo de métodos gráficos, tabulares o numéricos, así, por ejemplo:

Supóngase que un docente de Matemática calcula la calificación promedio de uno de sus cursos a su cargo. Como solo se está describiendo el desempeño del curso, pero no hace ninguna generalización acerca de los diferentes cursos, en este caso el maestro está haciendo uso de la Estadística Descriptiva.

Otro ejemplo, Según la Asociación de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que la delgadez sea sinónimo de éxito social. Muchos jóvenes luchan para conseguir el “físico ideal” motivados por modelos, artistas o por la publicidad comercial. Durante el mes de marzo del año 2006, en el colegio “Alcántara” de la ciudad de Talca, después de las vacaciones de verano, se observó con precaución a 27 alumnos con síntomas de anorexia, registrándose los siguientes signos visibles:

Dieta Severa
Uso de Ropa Holgada
Miedo a Engordar  
Dieta Severa
Dieta Severa
Hiperactividad
Uso de Laxantes
Uso de Laxante
Uso de Ropa Holgada  
Miedo a Engordar
Dieta Severa
Dieta Severa
Uso de Ropa Holgada
Dieta Severa
Uso de Laxantes 
Dieta Severa  
Hiperactividad
Hiperactividad  
Hiperactividad
Uso de Laxantes
Uso de Ropa Holgada 
Dieta Severa
Uso de Ropa Holgada
Miedo a Engordar
Uso de Ropa Holgada
Uso de Laxantes
Dieta Severa

a) Resuma la información anterior en una tabla de distribución de frecuencias.
Respuesta: Tabla de distribución de los signos visibles de 27 alumnos con síntomas de anorexia, en el colegio Alcántara de la ciudad de Talca durante el mes de marzo del año 2006.

Signo Visible
Número de alumnos
Porcentaje de alumnos
Dieta severa
 Miedo a engordar
 Hiperactividad
Uso de laxantes
Uso de ropa holgada
9
3
4
5
6
33,3
11,1
14,8
18,5
22,2
Total
27
100,0

b) Construya un gráfico adecuado para resumir la información anterior. 
Respuesta: Gráfico de distribución de los signos visibles de 27 alumnos con síntomas de anorexia, en el colegio Alcántara de la ciudad de Talca durante el mes de marzo del año 2006.




En conclusión: Trata de describir las variables aleatorias en las "muestras".

2-Estadística Inferencial o Inductiva
Llamada también inferencia estadística, la cual consiste en llegar a obtener conclusiones o generalizaciones que sobrepasan los límites de los conocimientos aportados por un conjunto de datos. Busca obtener información sobre la población basándose en el estudio de los datos de una muestra tomada a partir de ella, así, por ejemplo:

Supóngase ahora que el docente de Matemática utiliza el promedio de calificaciones obtenidas por uno de sus cursos para estimar la calificación promedio de los 5 cursos a su cargo. Como se está realizando una generalización acerca los diferentes cursos, en este caso el maestro usa la Estadística Inferencial.

Otro ejemplo, Si dada una muestra de 20 de una población de 450 individuos y se obtiene que el ingreso promedio muestral es de Bs. 2.500 entonces se dice que la población de 450 individuos gana en promedio Bs. 2.500

En conclusión: Trata de la generalización hacia las poblaciones de los resultados obtenidos en las muestras y de las condiciones bajo las cuales estas conclusiones son válidas. Se enfrenta básicamente con dos tipos de problemas:
 -Estimación, que puede ser puntual o por intervalos.
 -Contraste de hipótesis.

CONCEPTOS Y DEFINICIONES BÁSICAS

POBLACIÓN
Llamado también universo o colectivo es el conjunto de todos los elementos que tienen una característica común.

Una población puede ser finita o infinita. Es población finita cuando está delimitada y conocemos el número que la integran, así, por ejemplo: Estudiantes de la Universidad UTN. Es población infinita cuando a pesar de estar delimitada en el espacio, no se conoce el número de elementos que la integran, así, por ejemplo: Todos los profesionales universitarios que están ejerciendo su carrera.

MUESTRA
Es un subconjunto de la población. Ejemplo: Estudiantes de 2do Semestre de la Universidad UTN. Sus principales características son:

Representativa. - Se refiere a que todos y cada uno de los elementos de la población tengan la misma oportunidad de ser tomados en cuenta para formar dicha muestra.

Adecuada y válida. - Se refiere a que la muestra debe ser obtenida de tal manera que permita establecer un mínimo de error posible respecto de la población.

Para que una muestra sea fiable, es necesario que su tamaño sea obtenido mediante procesos matemáticos que eliminen la incidencia del error. Para muestras pequeñas se acostumbra a que ésta no sea menor al 30% de la población.


Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula:

Donde:
n = el tamaño de la muestra. N = tamaño de la población.
Desviación estándar de la población que, generalmente cuando no se tiene su valor, suele utilizarse un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en relación al 99% de confianza equivale 2,58, valor que queda a criterio del encuestador.
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.

Ejemplo ilustrativo: Calcular el tamaño de la muestra de una población de 1000 elementos.
Solución:
Se tiene N=1000, y como no se tiene los demás valores se tomará o=0,5 , Z = 1,96 y e = 0,05. Reemplazando valores en la fórmula se obtiene:


ELEMENTO O INDIVIDUO
Unidad mínima que compone una población. El elemento puede ser una entidad simple (una persona) o una entidad compleja (una familia), y se denomina unidad investigativa.

DATOS ESTADÍSTICOS
Son medidas, valores o características susceptibles de ser observados y contados. Como, por ejemplo, la edad de los estudiantes de la Universidad UTN.

Los datos estadísticos pueden ser clasificados en cualitativos (la diferencia entre ellos es de clase y no de cantidad), cuantitativos (representan magnitudes), cronológicos (difieren en instantes o períodos de tiempo) y geográficos (referidos a una localidad).

Los datos estadísticos se obtienen de fuentes primarias (obtenidos directamente sin intermediarios valiéndose de observaciones, encuestas, entrevistas y sondeos de opinión) y fuentes secundarias (obtenidos a través de intermediarios valiéndose de textos, revistas, documentos, publicaciones de prensa, y demás trabajos hechos por personas o entidades).

CENSO
Es una técnica de recolección de datos estadísticos que se realiza a toda la población.

ENCUESTA
Es la técnica que nos permite recolectar datos estadísticos que se realiza una muestra de la población.
Se clasifica en:

- Descriptiva. - Cuando registra datos referentes a las características de los elementos o individuos.

- Explicativa. - Cuando averigua las causas o razones que originan los fenómenos.

- Mixtas. - Cuando es descriptiva y explicativa.

Por muestreo. - Cuando recolecta información de grupos representativos de la población. Su estructura es:

- Nombre de la institución que auspicia la encuesta.
- Tema de la encuesta.
- Objetivos de la encuesta.
- Datos informativos: Lugar, fecha, y otros datos que se considere necesario según la naturaleza de la información estadística a encuestarse.
- Instrucciones para el encuestado para que sepa la forma de llenar la encuesta.
- Cuestionario o listado de preguntas (cerradas, abiertas, o ambas a la vez) sobre los diferentes aspectos motivo de estudio.
- Frase de agradecimiento al encuestado como, por ejemplo, ¡Gracias por su colaboración!

Los diferentes tipos de preguntas pueden ser:
- Abiertas. - Son aquellas en la cual el encuestado construye la respuesta de manera libre según su opinión y de la manera que él desea. Ejemplo: ¿Qué piensa usted sobre la política educativa del actual gobierno?

- Cerradas o dicotómicas. - Sólo pueden ser contestadas por un "sí" o por un "no". Ejemplo: ¿Está usted de acuerdo con la política educativa del actual gobierno?
Si ( ) No ( )

Como es obvio, la respuesta será forzosamente una de las alternativas planteadas: Las preguntas cerradas son fáciles de tabular y facilitan la cuantificación mediante la asignación de puntuaciones.

- Preguntas de elección múltiple o categorizada: Se trata en cierto modo de preguntas cerradas que, dentro de los extremos de una escala permiten una serie de alternativas de respuestas cuyos matices son fijados de antemano. Presentan dos formas: En abanico y de estimación.

- Preguntas con respuesta en abanico: Estas preguntas permiten contestar señalando una o varias respuestas presentadas junto con la pregunta. Por ejemplo: Indique otras alternativas que considere importantes para mejorar la educación en nuestro país.

- Preguntas de Estimación: Son preguntas cuantitativas que introducen diversos grados de intensidad creciente o decreciente para un mismo ítem. Ejemplos:
-¿Cómo calificaría la política educativa del gobierno actual?
Excelente ( ) Muy Buena ( ) Regular ( ) Deficiente ( )
-¿En qué porcentaje está de acuerdo con la política educativa del gobierno actual?
100% ( ) 75% ( ) 50% ( ) 25% ( ) 0% ( )
- ¿Le interesa conocer el modelo educativo vigente?
Nada ( ) Poco ( ) Algo ( ) Mucho ( )
¿Piensa culminar sus estudios superiores?
Sí ( ) Probablemente Sí ( ) No ( ) Aún no decido ( )

VARIABLE
Son caracteres susceptibles a cambio y pueden tener diferentes valores en cada elemento o individuo.

Clasificación de las variables 
- Variable Cualitativa
Son atributos que se expresan mediante palabras no numéricas. Como, por ejemplo, profesión, religión, marca de automóvil, estado civil, sexo, raza, etc.

- Variable Cuantitativa
Es toda magnitud representada por números. Como, por ejemplo, peso, estatura, número de habitantes, etc.

- Variable Discreta
Es una característica cuantitativa representada por números enteros o exactos, que generalmente resultan del proceso de conteo como, por ejemplo: número de estudiantes de la promoción del año anterior. El número de alumnos en tu salón de clases (1, 2, 3, 4, 5).

- Variable Continua
Es una característica cuantitativa que puede tomar cualquier valor representado por un número racional, que generalmente resultan del proceso de medición como, por ejemplo, tiempo destinado a estudiar Estadística, la masa (2,3 kg, 2,4 kg, 2,5 kg...) o la altura (1,64 m, 1,65 m, 1,66 m...), o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría permiten que exista un valor entre dos variables.

NIVELES DE MEDICIÓN

- Nivel Nominal
Cuando los datos sólo pueden contarse y clasificados en categorías, no existe un orden específico entre las clases. Como, por ejemplo, se cuentan cuántos hombres y cuántas mujeres asisten a determinado evento.

- Nivel Ordinal
Cuando se ordenan los datos por jerarquías, una categoría es mayor que otra. Como, por ejemplo, excelente es mejor que bueno o bueno es mejor que regular. Otro ejemplo: Una persona puede tener mucho o poco dinero.

- Nivel de Intervalos
Cuando se incluye todas las características del nivel ordinal, pero la diferencia entre los valores tiene un significado medido en unidades iguales que son comunes y constantes, que permiten asignar números reales a todos los miembros de la clase ordenada, facilitando el establecimiento de diferencias en grados de propiedad y entre objetos sobre la base de una medida. Como, por ejemplo: La diferencia entre 70 kilogramos y 60 kilogramos, es de 10 kilogramos. Otro ejemplo: Si la temperatura de hoy es de 20 grados centígrados y la de ayer fue de 25 grados centígrados, se sabe que la de hoy es 5 grados centígrados más baja que la de ayer.

- Nivel de Razón o Cociente
Este es el nivel de medición "más alto", tiene todas las características del nivel de intervalos y además en este nivel de medición el cero tiene significado (así si se tiene 0 dólares, entonces no se poseen fondos), y la razón (o cociente) entre dos números también es significativa (Un estudiante obtiene una calificación de 3/10 y otro 6/10, el segundo estudiante obtiene el doble que el primero).

FRECUENCIAS

- Frecuencia Absoluta
Es el número de veces que se repite el valor de cada variable. La suma de frecuencias absolutas es siempre al total de datos observados.

- Frecuencia Relativa
Indica la proporción con que se repite un valor. Es el cociente entre la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es siempre 1.

- Frecuencia Acumulada
Indica el número de valores que son menores o iguales que el valor dado. Es la suma de la frecuencia absoluta primera con la segunda, este valor con la tercera, y así sucesivamente.

- Frecuencia Porcentual
Llamada también frecuencia relativa porcentual. Se obtiene multiplicando la frecuencia relativa por 100. La suma de las frecuencias porcentuales es siempre 100%. 

- Frecuencia Relativa Acumulada
Es la suma de la frecuencia relativa primera con la segunda, este valor con la tercera, y así sucesivamente.

- Frecuencia Relativa Acumulada Porcentual
Indica el número de valores que son menores o iguales que el valor dado. Se obtiene multiplicando la frecuencia relativa acumulada por 100.

PARA REFLEXIONAR Y ELABORAR EN TU CUADERNO
Lea cuidadosamente cada una de las siguientes interrogantes y conteste según sus conocimientos, no importa si se equivoca. La presente evaluación puede ser resuelta de manera grupal o individual. Siempre trabaje con disciplina, honradez y buena voluntad. Recuerde que el éxito se refleja en nuestro trabajo y hay que lograrlo, tarea tras tarea, y merecer ese logro.

1-Según la naturaleza de los siguientes enunciados, escriba en el paréntesis la letra V si es verdadero o la F si es falso. Si su respuesta es F escriba el ¿por qué? de su respuesta.

1) La Estadística se encarga del estudio de las características cualitativas del fenómeno.
2) A la Estadística le interesan los fenómenos de tipo cuantitativo.
3) A la Estadística solamente le interesa la recopilación de datos.
4) Los fines de la estadística son conocer las características de los fenómenos, analizarlos y predecir lo que sucederá en el futuro.
5) Los objetivos de la Estadística son recopilar, organizar, tabular y presentar gráficamente los datos, proporcionando una visión cuantitativa de los fenómenos observados.
6) Los métodos de la Estadística son recopilar, clasificar, tabular y presentar datos para la toma de decisiones y solución de problemas.
7) La estadística descriptiva busca obtener información sobre la población basándose en el estudio de los datos de una muestra tomada a partir de ella.
8) La estadística inferencial se preocupa de llegar a conclusiones basados en la muestra y luego hacerlos válidos para toda la población.
9) La muestra es el conjunto de todos los elementos que tienen una característica común
10) Las partes de una tabla o cuadro estadístico son: título, conceptos o columna Matriz y cuerpo del cuadro.

2-Conteste a las siguientes preguntas:
11) Sugiera 5 referentes de información que usted suponga son de tipo estadístico.
12) ¿Qué piensa usted que es la Estadística?
13) ¿Para qué sirven los censos poblacionales o de alguna otra índole?
14) Redacte un pensamiento que indique la importancia de la Estadística.
15) ¿Para qué sirven los gráficos estadísticos? Enumere los que usted conoce.
16) ¿Qué son las medidas de tendencia central? Enumere las que usted conoce.
17) Defina con sus propias palabras lo que entiende por medidas de dispersión. Enumere las que usted conoce.
18) ¿Qué entiende por medidas de forma?
19) ¿En qué se diferencian la correlación y la regresión?


20) ¿Cuál es la aplicación principal de las series cronológicas?

No hay comentarios.:

Publicar un comentario