miércoles, 6 de mayo de 2009

UNIDAD IV

MUESTREO Y POLACIONES

Muestra:

"Se llama muestra a una parte de la población a estudiar que sirve para representarla".

"Una muestra es una colección de algunos elementos de la población, pero no de todos".

MUESTREO

En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población.

Al elegir una muestra se espera que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, obteniendo resultados parecidos que si se realizase un estudio de toda la población.

Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio fiable , debe cumplir ciertos requisitos, lo que lo convertiría en una muestra representativa.

En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral.

4.1 METODOS DE MUESTREO

En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población.

Al elegir una muestra se espera que sus propiedades sean extrapolables a la población Este proceso permitan ahorrar recursos, obteniendo resultados parecidos que si se realizase un estudio de toda la población.

Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio fiable (que represente a la población), debe cumplir ciertos requisitos, lo que lo convertiría en una muestra representativa.

En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral.

4.2 ERROR DE MUESTREO

La muestra debe seleccionarse a partir de la población objetivo o de estudio procurando que sea representativa de la población. Se controlará que las características de la muestra sean una aproximación de las características de la población con un margen de error tolerable y conocido. Autores como Hopkins, K., Hopkins, B. Y Glass, S. (1997) entre otros hacen énfasis en este criterio porque en investigación es más importante la representatividad de la muestra que la preocupación por el tamaño de la misma.

La estadística inferencial es un medio para la toma de decisiones con base en información limitada. Se utiliza la información proveniente de la observación de las muestras y lo que se conoce acerca del error de muestreo para establecer conclusiones generalizables a la población. Un instrumento básico de esta disciplina lo constituye la hipótesis de nulidad o explicación que propone una relación casual, sosteniendo que no hay ninguna relación entre las variables y que cualquier relación que se observe es una función de la casualidad.

Un investigador debe aceptar o rechazar la hipótesis de nulidad a un deternimado =0.05). Toda decisión que ela= 0.01, anivel de significancia estadística (investigador tome pudiera ser aceptada o errónea, pudiendo cometer errores de tipo I y de tipo II. El error de tipo I consiste en rechazar una hipótesis de nulidad verdadera, cuando la hipótesis nula es en realidad verdadera. El error de tipo II consiste en aceptar una hipótesis de nulidad que es en realidad falsa.

4.3 DISTRIBUCION MUESTRAL DE MEDIAS

El estudio de determinadas características de una población se efectúa a través de diversas muestras que pueden extraerse de ella.

El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita. Una población finita en la que se efectúa muestreo con reposición puede considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición.

Consideremos todas las posibles muestras de tamaño n en una población. Para cada muestra podemos calcular un estadístico (media, desviación típica, proporción,...) que variará de una a otra. Así obtenemos una distribución del estadístico que se llama distribución muestral.

Las dos medidas fundamentales de esta distribución son la media y la desviación típica, también denominada error típico.

Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las distribuciones muéstrales son normales y en esto se basarán todos los resultados que alcancemos.

4.4 ERROR ESTANDAR DE LA MEDIA

El error estándar puede ser usado para calcular intervalos dentro de los cuales hay una determinada confianza de que se encuentra el valor poblacional. Así, si se toma cierta estadística calculada de la muestra (un porcentaje, por ejemplo) y se le suma y resta dos veces su error estándar, se obtiene un intervalo al cual se le asigna una confianza de 95 por ciento de que contiene, en este caso, el porcentaje poblacional.

Si los hogares y las mujeres incluidas en la muestra hubieran sido seleccionadas en forma simple al azar, podrían utilizarse directamente las fórmulas muy conocidas que aparecen en los textos de estadística para el cálculo de errores estándar y límites de confianza, y para la realización de pruebas de hipótesis. Sin embargo, como se ha señalado, el diseño empleado es complejo, por lo cual se requiere utilizar fórmulas especiales que consideran los efectos de la estratificación y conglomeración.

4.5 INTERVALOS DE CONFIANZA

Se llama intervalo de confianza en estadística a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestral, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa por 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.

4.6 ESTIMACION DE PROPORCIONES

En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño.

La estimación se divide en tres grandes bloques, cada uno de los cuales tiene distintos métodos que se usan en función de las características y propósitos del estudio:

  • Estimación puntual:
    • Método de los momentos;
    • Método de la máxima verosimilitud;
    • Método de los mínimos cuadrados;
  • Estimación por intervalos.
  • Estimación bayesiana.



olga gpe dominguez lopez

miércoles, 29 de abril de 2009

UNIDAD III CURVA NORMAL

UNIDAD III

LA CURVA NORMAL

3.1 CARACTERISITCAS

La curva normal representa una distribución teórica de probabilidades, o sea que describe la relación entre una variable aleatoria y la frecuencia con que se presentan sus valores. Tiene forma de campana, y se la conoce también como curva de Gaus

La curva normal tiene forma de campana con un solo pico justo en el centro de la distribución.
La media, mediana y moda de la distribución aritmética son iguales y se localizan en el pico.
La mitad del área bajo la curva está a la derecha del pico, y la otra mitad está a la izquierda.

La distribución normal es simétrica respecto a su media.
La distribución normal es asintótica - la curva se acerca cada vez más al eje x pero en realidad nunca llega a tocarlo.

DISTRIBUCION NORMAL ESTANDAR

Una distribución normal que tiene media igual a 0 y desviación estándar igual a 1 se denomina distribución normal estándar.

Valor z: la distancia entre un valor seleccionado, designado como X, y la población media μ, dividida entre la desviación estándar de la población σ,

3.2 AREA BAJO LA CURVA

Definimos el área bajo la curva como:

Límite de la sumatoria de Riemann cuando n tiende a Infinito

3.3 PUNTAJES ESTANDAR Y LA CURVA NORMAL

PUNTAJES ESTANDAR: se define como la razón de la desviación del valor entre la desviación estándar y se denota por:

PROBABILIDAD DE LA CURVA NORMAL

Una propiedad interesante de la curva normal es que su localización y forma se determinan completamente por los valores de la media y la desviación estándar

El valor de la media establece el centro de la curva, mientras que el valor de la desviación estándar determina la extensión del esparcimiento. Puesto que todas las curvas normales, que representan distribuciones teórica, tienen un área total de 1, al aumentar el valor de la desviación típica la curva debe reducirse en altura, extendiéndose a partir de la media.

El hecho que la forma de una curva normal quede completamente determinada por su desviación estándar permiten reducir todas las curvas normales o que se aproximen a un patrón, por un simple cambio de variables.

Si la Variable Pm posee una distribución teórica ordinaria como promedio (x) y una desviación estándar (S), la nueva variable que se obtendrá esta reducción es la variable Z dada por la relación:

Probabilidad de un suceso es el número al que tiende la frecuencia relativa asociada al suceso a medida que el número de veces que se realiza el experimento crece.

Un experimento aleatorio se caracteriza porque repetido muchas veces y en idénticas condiciones el cociente entre el número de veces que aparece un resultado (suceso) y el número total de veces que se realiza el experimento tiende a un número fijo. Esta propiedad es conocida como ley de los grandes números, establecida por Jakob Bernouilli. Tiene el inconveniente de variar la sucesión de las frecuencias relativas de unas series de realizaciones a otras, si bien el valor al que se aproximan a medida que el número de realizaciones aumenta se mantiene estable

La primitiva de una función gaussiana es la función de error.

Estas funciones aparecen en numerosos contextos de las ciencias naturales, ciencias sociales, matemáticas e ingeniería. Algunos ejemplos:

  • En estadística y teoría de probabilidades, las funciones gaussianas aparecen como la función de densidad de la distribuicin normal, la cual es una distribución de probabilidad límite de sumas complicadas, según el teorema del limite central.
  • Una función gaussiana es la función de onda del estado fundamental del oscilador armónico quántico.
  • Los orbitales moleculares usados en química computacional son combinaciones lineales de funciones gaussianas llamados orbitales gaussianos.
  • Matemáticamente, la función gaussiana juega un papel importante en la definición de los polinomios de Hermite.
  • Consecuentemente, están también asociadas con el estado de vacío en la teoría quántica de campos. Los rayos gaussianos se usan en sistemas ópticos y de microondas.
  • Las funciones gaussianas se utilizan como filtro de suavizado en el procesamiento digital de imágenes.

En páginas de Internet que prestan el servicio de compra y venta de bienes y servicios, muchos pseudo estadistas ofrecen software fraudulento que según sus vendedores, se basa en la campana de Gauss para predecir el número ganador de la lotería ofreciendo hasta el 100% de efectividad. Es una modalidad de estafa basada en la falta de conocimiento de las victimas.

domingo, 19 de abril de 2009