You are on page 1of 33

UNIVERSIDAD ALAS PERUANAS

FACULTAD DE INGENIERÍA Y ARQUITECTURA


ESCUELA PROFESIONAL DE INGENIERÍA DE MINAS

CURSO: GEOESTADÍSTICA I

DOCENTE DEL CURSO

ING. KROVER W. LAZARTE PONCE

Ing. Krover W. Lazarte P. 1


4. CONTENIDO ANALÍTICO

SEMANA 5
CAPITULO III: ANALISIS DE DATOS Y VARIOGRAFIA
3.1 Análisis de datos mediante histogramas. Construcción de histogramas
experimentales.
3.2 Modelado de Histogramas: Distribución Normal. Distribución
Lognormal. Distribución exponencial. etc.
SEMANA 6
3.3 Simulaciones de distribuciones: Teorema del límite central. Método
de la transformada inversa. Método de Montecarlo.

Ing. Krover W. Lazarte P. 2


Conceptos Basicos:
FILAS O COLUMNA DE DATOS
Una fila de datos consiste en datos recopilados que no han sido organizados
numéricamente; por ejemplo. Leyes de minerales por Nombre.
ORDENACIONES
Una ordenación es un conjunto de datos numéricos en orden creciente o
decreciente. La diferencia entre el valor mayor y el valor menor se denomina
Rango de ese conjunto de datos. Ejemplo los valores de cada Mineral
TABLA DE FRECUENCIA
Al resumir grandes colecciones de datos, es útil distribuirlas en clases o categorías
y determinar el numero de elementos u observaciones que pertenecen a cada
clase , llamada frecuencia de clase .
La distribución tabular de lo datos por clases junto con las correspondientes
frecuencias de clase se denomina distribución de frecuencia o tabla de frecuencia.

Ing. Krover W. Lazarte P. 3


Tabla de Frecuencia
PESO EN GRAMOS NUMERO DE PAQUETES
1828 - 1902 5
1903 - 1977 11
1978 - 2052 8
2053 - 2127 5
2128 - 2202 1
TOTAL 30

INTERVALOS DE CLASE Y LIMITES DE CLASE


Un símbolo que define una clase como 1978 – 2052 en tabla frecuencia se llama intervalo
de clase.
Los números extremos 1978 y 2052 se llaman limite inferior y limite superior de clase
respectivamente.
Cuando un intervalo de clase carece de un limite inferior o superior se llama intervalo de
clase abierto.
FRONTERAS DE CLASE O LIMITES REALES ( FC )
Frecuencia de clase inferior (FCI)
Frecuencia de clase superior (FCS)

Ing. Krover W. Lazarte P. 4


Tabla de Frecuencia
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE ( C )
Es la diferencia entre la frontera de clase superior e inferior. Si todos los intervalos de
clase de una distribución de frecuencia tienen la misma anchura la denotaremos por C.

MARCA DE CLASE (MC )


Es el punto medio del intervalo de clase y se calcula promediando los limites superior e
inferior de clase. De la tabla de frecuencia tenemos que la marca de clase del tercer
intervalo es:

FRECUENCIA RELATIVA ( FR )
La frecuencia relativa de un intervalo de clase es igual a su frecuencia absoluta dividida
por la frecuencia total de todos los intervalos de clases. y se expresa generalmente en % .

Ing. Krover W. Lazarte P. 5


EL HISTOGRAMA
“Consiste en un conjunto de rectángulos con base en el eje X, centro en las
marcas de clase , longitudes iguales a los tamaños de los intervalos de
clase y áreas proporcionales a la frecuencias de clase”.
Si los intervalos de clase tienen todos la misma anchura, las alturas de los
rectángulos son proporcionales a las frecuencias de clase, de ahí que es
usual tomar las alturas iguales a las frecuencias de clase. En caso contrario
deben ajustarse las alturas.

Ing. Krover W. Lazarte P. 6


Representar la variación del histograma
¿Qué aprendemos del histograma?
 Estimación de la forma de densidad
 Tipo de Distribución (Normal o Log-Normal).
 Distribución exponencial.
 Distribución Uni-modal o Multi-modal.
 Aparición de Valores extremos y Outliers (Valores atípicos).
 Variabilidad del fenómeno.

Ing. Krover W. Lazarte P. 7


Representar la variación del histograma
Tratar datos con una distribución Sesgada o Asimétrica:

Transformación logarítmica (Ln o log)

Ing. Krover W. Lazarte P. 8


El coeficiente de sesgo (CS) o Asimetría:
CS o Asimetría Negativo Curva Simétrica CS o Asimetría Positivo

Ing. Krover W. Lazarte P. 9


El coeficiente de sesgo (CS) o Asimetría:

Ing. Krover W. Lazarte P. 10


Ejemplo: Fe, MoS2 y Cu Assays
Figure: Three examples of drill-core assay
data presented as histograms: (A) negative
skewness of 277 Fe assays, (B) approximate
symmetry of 224 MoS2 values, and (C)
positive skewness of 309 Cu values. B.I., bar
(class) interval in percent metal; N, number
of drill-core assays.

A normal probability density function


(smooth symmetric curve) has been fitted in
(B) with the same mean and standard
deviation as the data of the histogram. Data
from Becker and Hazen (1961).

Ing. Krover W. Lazarte P. 11


POLIGONO DE FRECUENCIA
Un polígono de frecuencia es
un grafico de líneas de las
frecuencias con relación a las
marcas de clase.
Se obtiene conectando los
puntos medios de las partes
superiores de los rectángulos
del histograma.
Puede ser en valores
absolutos o en valores
relativos, cuando se obtiene a
partir de los histogramas en
valores absolutos y en valores
relativos respectivamente.

Ing. Krover W. Lazarte P. 12


OJIVAS VALORES ABSOLUTOS
Figura: La grafica que
recoge las frecuencias
acumuladas por debajo
de cualquier frontera de
clase superior respecto a
dicha frontera se llama
polígono de frecuencias
acumuladas u ojiva.
Estas ojivas pueden ser
mayor que o menor que
en valores absolutos o en
valores relativos

Ing. Krover W. Lazarte P. 13


DISTRIBUCION DE FRECUENCIAS ACUMULADAS
“La frecuencia total acumulada de
todos los valores menores que la
frontera de clase superior de un
intervalo dado se denomina frecuencia
acumulada hasta ese intervalo
inclusive”.
Una tabla de frecuencias acumuladas se
denomina distribución de frecuencias
acumuladas.

Figure: Illustration of the relation


between a histogram (shaded), a
cumulative histogram (dashed bars),
and a cumulative curve (smooth).

Ing. Krover W. Lazarte P. 14


REGLAS GENERALES PARA CONSTRUIR UNA DISTRIBUCIÓN DE
FRECUENCIA
Existen muchos procedimientos para construir tablas de frecuencia y aunque su
uso es cada vez mas limitado. Debido a que los paquetes estadísticos lo hacen
esta labor .
1.- Hallar el rango de los datos
2.- Dividir el rango en un numero adecuado de intervalos de clases (NIC) del
mismo tamaño; generalmente se suelen tomar entre 5 y 20 intervalos de clases
según los datos. También hay una regla que dice que el numero de intervalos es
igual a la raíz cuadrada del numero de datos cuando este no es muy grande. Si el
numero de datos es muy grande trabajamos con logaritmos.

3.- Hallar el tamaño del intervalo escogiendo como C el valor impar posterior al
obtenido de la división del rango entre el numero de intervalo ,en caso de que el
resultado sea par.

Ing. Krover W. Lazarte P. 15


4.- Encontrar la frontera de clase inferior (FCI1) del primer intervalo usando
la siguiente formula :

Si el valor encontrado para la frontera de clase inferior del primer intervalo


termina en entero se le resta o se le suma 0.5 , en caso contrario se deja
igual.

5.- Formar la tabla de frecuencia sumándole a frontera de clase inferior el


valor de C, para posteriormente restarle y sumarle a cada frontera de clase
0.5 y obtener los limites superior e inferior de cada intervalo.

6.- Utilizar una hoja de conteo para determinar cuantas observaciones o


datos caen dentro de cada intervalo de clase, es decir , hallar la frecuencia.
Para realizar el conteo se debe decidir si se trabaja con intervalos abiertos
por la izquierda y cerrado por la derecha o cerrado por la izquierda y
abierto por la derecha . Esto se debe hacer para evitar el doble conteo.
Ing. Krover W. Lazarte P. 16
Histograma: Aplicación en Minería
El histograma es la distribución de datos en rangos de valores, más llamado
diagrama de frecuencias. Para una serie de 1050 datos de leyes Au (Oro) , con
valores que fluctúan de 0.011 a 2.381 gr/t , se establece rangos de datos de igual
tamaño. Para cada uno de estos rangos se contabiliza el número de muestras que
le pertenecen.

Esta tabla indica un cuadro de distribución de frecuencias, el intervalo número 1,


se entiende que se inicia en 0.011 y termina en 0.090, en este intervalo caen 423
muestras, en el siguiente intervalo caen 322.
“Es importante anotar que este tipo de distribución de frecuencias de leyes de
muestras de depósitos de minerales, es normal y lógico la presencia de mayor
frecuencia o presencia de muestras en los rangos de menor valor.
Esto se debe a que en minería, siempre se encontrará en una prospección,
exploración o toma de muestras para la explotación, más valores de baja ley que
altas.
Ing. Krover W. Lazarte P. 17
Histograma: Aplicación en Minería
Si graficamos las frecuencias, según los valores de los intervalos en el eje
horizontal, encontramos el siguiente gráfico.

Observamos una distribución Normal, propia de las muestras de los depósitos de


minerales. En este punto podemos notar la presencia de una cola de datos que
podría indicar la presencia de datos erráticos, los cuales podrían ajustarse a los
intervalos más cercanos a la distribución log normal.
Ing. Krover W. Lazarte P. 18
Histograma: Aplicación en Minería
DIFERENCIA ESTADISTICA DE MUESTRAS EN DOMINIOS GEOLÓGICOS

Ing. Krover W. Lazarte P. 19


Ejemplo: Exploración y Estadística de datos de Plata – Proyecto
Río Blanco.
Localización.
Espacialmente todas las muestras disponibles están distribuidas en el área de
SOHO y de HENRY´S HILL, como se muestra en el plano base siguiente. Se
muestra también el histograma de Ag y en color rojo los valores de la zona de
SOHO:

Ing. Krover W. Lazarte P. 20


Parámetros Geoestadísticos - Proyecto Rio Blanco
Histogramas por Dominios
La información presentada en las tablas representan los parámetros
encontrados para los dominios de Molibdeno (Mo) definidos por el área de
geología del proyecto.

Cut Top Mo ppm

1.- 99 Diques

2.- 601 Mo_Low 1200


3.- 603 Mo_Hig 3000

Ing. Krover W. Lazarte P. 21


Parámetros Geoestadísticos - Proyecto Rio Blanco
Histogramas por Dominios

Ing. Krover W. Lazarte P. 22


3.2 Modelado de Histogramas:
Distribución Normal.
La distribución de probabilidad conocida como distribución normal es, por
la cantidad de fenómenos que explica, la más importante de las
distribuciones estadísticas.
A la distribución normal también se la denomina con el nombre de
campana de Gauss, pues al representar su función de probabilidad, ésta
tiene forma de campana.

Para indicar que una variable aleatoria


(v.a.) sigue una distribución normal de
media µ y desviación estándar S
usaremos la expresión: X ≈ N( µ,s).

Ing. Krover W. Lazarte P. 23


Normal Distribution – Distribución Normal

Figure: Example of a normal


(Gaussian) probability
density function (PDF). The
curve is symmetric about the
mean value, X m = 0.76.
Spread (dispersion) is
measured by the standard
deviation, s = 0.28. The
distribution simulates a Cu-
grade distribution for which
two arbitrary cutoff grades,
0.4 and 0.9, are shown.

Ing. Krover W. Lazarte P. 24


Definición de distribución de probabilidad normal:
La Normal es la distribución de probabilidad más importante. Multitud de
variables aleatorias continuas siguen una distribución normal o
aproximadamente normal.
Características para cualquier distribución de probabilidad.
 La curva normal tiene forma de campana y un solo pico en el centro de la
distribución. De esta manera, la media aritmética, la mediana y la moda de
la distribución son iguales y se localizan en el pico. Así, la mitad del área
bajo la curva se encuentra a la derecha de este punto central y la otra
mitad está a la izquierda de dicho punto.
 La distribución de probabilidad normal es simétrica alrededor de su media.
 La curva normal desciende suavemente en ambas direcciones a partir del
valor central. Es asintótica, lo que quiere decir que la curva se acerca cada
vez más al eje X pero jamás llega a tocarlo. Es decir, las “colas” de la curva
se extienden de manera indefinida en ambas direcciones.
Ing. Krover W. Lazarte P. 25
Definición de función de densidad de probabilidad:
La probabilidad de que una variable aleatoria (v.a.) X tome un valor
determinado entre dos números reales a y b coincide con el área
encerrada por la función

(función de densidad de
probabilidad) entre los
puntos a y b, es decir :

Como hemos comentado anteriormente,


observar que:

Ing. Krover W. Lazarte P. 26


La distribución normal estándar:

Se observó que no existe una sola distribución de probabilidad normal,


sino una “familia” de ellas. Como sabemos, cada una de las distribuciones
puede tener una media ( µ ) o una desviación estándar distinta (σ). Por
tanto, el número de distribuciones normales es ilimitado y sería imposible
proporcionar una tabla de probabilidades para cada combinación de µ y σ.
Para resolver este problema, se utiliza un solo “miembro” de la familia de
distribuciones normales, aquella cuya media es 0 y desviación estándar 1
que es la que se conoce como distribución estándar normal, de forma que
todas las distribuciones normales pueden convertirse a la estándar,
restando la media de cada observación y dividiendo por la desviación
estándar.

Ing. Krover W. Lazarte P. 27


La distribución normal estándar:

Primero, convertiremos la distribución real en una distribución normal


estándar utilizando un valor llamado Z, o estadístico Z que será la
distancia entre un valor seleccionado, designado X, y la media µ , dividida
por la desviación estándar σ.
Formalmente, si X∼N(µ,σ) , entonces la V.A. Z=(X- µ)/ σ se distribuye
según una normal de media 0 y desviación estándar 1, i.e.: Z∼N(0,1) ,
que es la distribución llamada normal estándar o tipificada.
De esta manera, un valor Z mide la distancia entre un valor especificado de
X y la media aritmética, en las unidades de la desviación estándar. Al
determinar el valor Z utilizando la expresión anterior, es posible encontrar
el área de probabilidad bajo cualquier curva normal haciendo referencia a
la distribución normal estándar en las tablas correspondientes.

Ing. Krover W. Lazarte P. 28


La distribución normal estándar:

Así pues, para averiguar el


área anterior utilizaremos
la tabla que encontraremos
al final de este apartado.
Dicha tabla nos
proporciona la probabilidad
de que la V.A. normal
estándar Z tome un valor
situado a la izquierda de un
número c, i.e.: P(Z<c). En
otras palabras, esta tabla
nos da el valor del área
encerrada por f(x) entre ∞
y c.

Ing. Krover W. Lazarte P. 29


La distribución normal estándar:

Ejemplo: la figura
muestra la
distribución normal
estándar derivado
de los valores Z

Ing. Krover W. Lazarte P. 30


Distribución Lognormal
Muchas variables no se distribuyen de manera gaussiana, sin embargo,
aplicando alguna transformación es posible convertir los datos a una forma
que esté distribuida de esa manera.
La transformación logarítmica se aplica en muchos casos, en especial
cuando el rango de las observaciones abarca varios órdenes de magnitud.
Una variable aleatoria X cuyos logaritmos Y = ln(X) están distribuidos de
manera normal, se dice que sigue una distribución lognormal cuya PDF es:

donde µ y σ son la media y desviación estándar de Y.


La relación entre estos parámetros y los de la variable original X es:

• En este caso la variable sigue una distribución Gaussiana


estándar N(0,1).
Ing. Krover W. Lazarte P. 31
Distribución Exponencial
Hay dos casos especiales importantes de la distribución gamma, que
resultan de restricciones particulares sobre los parámetros α y β. El
primero es cuando se tiene α = 1, entonces la distribución gamma se
reduce a la distribución exponencial, con PDF:

Esta ecuación es analíticamente integrable, de modo que la CDF estádada


por:

Un uso importante de la distribución exponencial en ciencias atmosféricas


es en la caracterización de la distribución del tamaño de gotas de lluvia
(Marshall-Palmer).
Ing. Krover W. Lazarte P. 32
Ciencia Tecnologia y Medio Ambiente

Para uso restringido para KL. Todos los derechos reservados. Ninguna
parte de esta presentación puede ser reproducida o utilizada en ninguna
forma o por ningún medio sin permiso explícito de Krover Lazarte.

You might also like