Professional Documents
Culture Documents
Geoestadstico de Datos
Integrantes:
Eduardo Retamales
Javier Rosas
Fabin Crdenas
Profesor:
Xavier Emery
Curso:
MI4040
Fecha de entrega:
4 de julio 2013
0
Abstract
The following report presents aexploratory analysis and a variografics analysis of data from a
Database of cupper law ,where thas laws of soluble copper (CuS) and total copper ( CuT) was
obtained from drilling of exploration.
This report provides a comprehensive analysisof a statistical nature, in order to find
Trends and relation ships between different types of data. This is to estimate the law of CuS
and CuT blocks.
As main objective, were calculated the resources of CuS and CuT.
Was usedas an essential tool the computer program"ISATIS", whichwasimported the data of
the project 1 "Datos.xls". Exploratory and variografics analysis was performed of the data,
continuing
with the cross-validation.It was createda grid of blocks with the purpose of estimating local
laws of CuS and CuT.
Finally ,were calculated resources in tonnage, average grades and quantities.
1
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Contenido
Abstract ......................................................................................................................................... 1
Introduccin .................................................................................................................................. 3
Anlisis Exploratorio de Datos ...................................................................................................... 4
Cobre soluble ............................................................................................................................ 4
Cobre Total ................................................................................................................................ 5
Desagrupamiento ...................................................................................................................... 6
Otras herramientas geoestadsticas.......................................................................................... 7
Mapas Variogrficos .................................................................................................................. 9
Variograma experimental CuT ................................................................................................ 11
Variograma modelo de CuT..................................................................................................... 12
Variograma experimental CuS................................................................................................ 14
Variograma modelado Cobre soluble ..................................................................................... 14
Validacin por Jack-Knife ............................................................................................................ 17
Creacin de Grilla ........................................................................................................................ 23
Preparacin a la creacin de Grillas ........................................................................................ 23
Creacin y ajuste de la grilla.................................................................................................... 25
2
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Introduccin
El presente informe tiene como objetivo calcular los recursos in situ y los recursos
recuperables de cobre total (CuT) y cobre soluble (CuS) mineral que estn disponibles, lo cual
se obtiene a travs de informacin de sondajes de exploracin, esto en el contexto del
Proyecto N2 del curso Anlisis Estadstico y Geoestadstico de datos.
Para aquello se har un anlisis geoestadstico completo de una base de datos con
informacin sobre ley de cobre total y cobre soluble y sus respectivas coordenadas geogrficas
y cota. Dicha base de datos cuenta con 1546 muestras.
El anlisis se inicia con el proceso de importacin de datos desde el archivo Datos.xls
al software Isatis; posteriormente se realiza un estudio exploratorio de datos que permite
identificar la existencia de errores, anomalas e informacin redundante en la muestra. Se
eliminarn las muestras errneas de manera que se trabajar sobre una base de datos ms
confiable.
Luego se procede a realizar el anlisis variogrfico para cada variable, e identificar las
direcciones de mxima variacin, para luego ajustar un modelo variogrfico necesario para el
kriging.
Antes de realizar el kriging es necesario hacer la validacin cruzada para verificar tanto
el modelo variogrfico como para la vecindad de bsqueda. Adems se debe definir la
correspondiente grilla y el tamao de la discretizacin de bloques.
Una vez hecho el kriging, se presentan los datos obtenidos para cada variable a travs
de histogramas de estimacin y varianza, y del mapa a escala de colores que representan la
distribucin espacial de las variables y su varianza.
Finalmente se calculan los recursos disponibles a travs de la curva de Tonelaje-Ley,
y en especial para una ley de corte del Cu de 0,35%.
3
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Cobre soluble
En primer lugar, se elabor el mapa de los datos (figura 1-A):
4
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Cobre Total
A continuacin se elaboraron el mapa de datos sin el outlier detectado (en el mismo punto en
que se excluy el valor de CuS - fig. 5) y el histograma (fig. 4). Se puede observar que se
tomaron mediciones de CuT y CuS en los mismos puntos, lo cual en general es conveniente
para los estudios geoestadsticos. Esta observacin se ratifica al revisar las coordenadas en el
archivo Excel.
5
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Desagrupamiento
A continuacin se muestran los cambios en los estadsticos principales de las muestras de CuS
y CuT al realizar un desagrupamiento por el mtodo de las celdas, con celdas de 100[m] X
100[m] X 10[m], pues 100 m se consider el espaciamiento promedio de datos en ambos ejes
del mapa, y 10 [m] cubren el rango de cotas (alturas) que se tiene. Se observa un gran efecto
sobre los estadsticos, debido a los tres claros clusters que se observan en los mapas.
Tabla 1. Estadsticos principales para el CuS, antes (raw) y despus (weighted) del desagrupamiento.
Tabla 2.Estadsticos principales para el CuT, antes (raw) y despus (weighted) del desagrupamiento.
6
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Nube de dispersin o correlacin: se observa en la figura 7 que hay una altsima correlacin
entre ambas variables, dndose que en los sectores de mayor ley de CuT hay mayor ley de CuS,
lo cual hace sentido.
7
MI4040 Anlisis Estadstico y Geoestadstico de Datos
8
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Mapas Variogrficos
Plano de
referencia
N
Direcciones
N Pasos
Largo
Paso
Tolerancia en
distancia
Tolerancia en
direccin
Mnimo de
pares
Sin
rotacin
18
12
50 [m]
1 [paso]
1 [sector]
CuT
9
MI4040 Anlisis Estadstico y Geoestadstico de Datos
CuS
En las figuras se observa que existen dos direcciones preferenciales de anisotropa: N40E y
N130E, que son perpendiculares y por tanto sern las utilizadas para la elaboracin de los
variogramas direccionales.
10
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Ancho de
banda
170 [m]
Altura de
banda
10 [m]
Tolerancia
en ngulo
10
Paso*
N Pasos*
75 [m]
Tolerancia en
distancia
0.5 pasos
Figura 10. A la izquierda se muestra el variograma de CuT con un paso de 50 [m]. A la derecha,
con un paso de 75 [m]; este ltimo fue el variograma elegido para elaborar el variograma
modelado, dado que es ms suave, haciendo ms fcil la evaluacin y ajuste visual de dicho
modelo.
11
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Se realiz una validacin cruzada de este modelo, con kriging ordinario (por defecto). Se
consider un umbral de errores estandarizados de 2.5 (los datos son considerados "mal
estimados", y marcados con un crculo relleno en la figura 12, cuando el error estandarizado
est fuera del intervalo [-2.5, 2.5]). Adems, se utiliz para estimar una vecindad mvil en
forma de elipse de radio mayor 200 [m] en la direccin N40E y radio menor 125 [m] (y radio
de altura 10 [m]).
12
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Los valores de la media y varianza del error son cercanos a cero, es decir, son
aceptables. La varianza del error estandarizado es relativamente cercana a 1, sin
embargo sera deseable que fuese mayor (vanse valores en tabla 5).
Los datos "mal estimados" fueron 24, que corresponden a un 2% del total de 1190
datos.
Relacionado a lo anterior, la figura 12-B muestra que a pesar que hay una cierta
dispersin, la mayora de los valores son cercanos a la diagonal, es decir, estn bien
estimados.
Todo lo anterior valida el modelo, es decir, lo hace digno de ser utilizado en el kriging.
Tabla 5. Estadsticos relacionados a la validacin cruzada del modelo variogrfico desarrollado para el CuT.
13
MI4040 Anlisis Estadstico y Geoestadstico de Datos
14
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Se realiz una validacin cruzada de este modelo, con kriging ordinario (por defecto). Se
consider un umbral de errores estandarizados de 2.5 (los datos son considerados "mal
estimados", y marcados con un crculo relleno en la figura 12, cuando el error estandarizado
est fuera del intervalo [-2.5, 2.5]). Adems, se utiliz para estimar una vecindad mvil en
forma de elipse de radio mayor 200 [m] en la direccin N40E y radio menor 125 [m] (y radio
de altura 10 [m]).
Los resultados obtenidos en la validacin se enumeran a continuacin:
Los valores de la media y varianza del error son cercanos a cero, es decir, son
aceptables. La varianza del error estandarizado es relativamente cercana a 1, sin
embargo sera deseable que fuese mayor (vanse valores en tabla 5).
Los datos "mal estimados" fueron 17, que corresponden a un 1.4% del total de 1190
datos.
Relacionado a lo anterior, la figura 12-B muestra que a pesar que hay una cierta
dispersin, la mayora de los valores son cercanos a la diagonal, es decir, estn bien
estimados.
Todo lo anterior valida el modelo, es decir, lo hace digno de ser utilizado en el kriging,
lo cual no quiere decir que no se podran encontrar mejores aproximaciones.
Tabla 6. Estadsticos relacionados a la validacin cruzada del modelo variogrfico desarrollado para el CuS.
15
MI4040 Anlisis Estadstico y Geoestadstico de Datos
16
MI4040 Anlisis Estadstico y Geoestadstico de Datos
pozos.
En los mapas de datos (figura 13) se observa claramente la mayor suavidad (homogeneidad)
de los datos estimados, tenindose un comportamiento espacial general similar a la realidad,
pero con mucha menor dispersin. Lo anterior es tpico de cualquier estimacin por kriging y
para evitar este tipo de inexactitudes se necesita utilizar mtodos multivariables de estimacin
geoestadstica.
17
MI4040 Anlisis Estadstico y Geoestadstico de Datos
En los histogramas se observa nuevamente que los datos estimados tienden a ser ms bajos:
las fracciones estimadas son ms altas que las reales hacia los valores ms bajos y hacia los
valores ms altos (extremos) las fracciones estimadas son ms bajas que las reales. En el
mismo sentido, el mximo estimado es mucho menor que el real y la media estimada es
considerablemente menor que la real. El hecho que la dispersin de los datos estimados es
menor que la de los datos reales, ya percibido en los mapas, se vuelve a notar aqu al comparar
las desviaciones estndar.
18
MI4040 Anlisis Estadstico y Geoestadstico de Datos
En la figura 15-A se observa que la varianza del Kriging es mxima en dos sectores (amarillos):
esto implica que la confiabilidad de los datos estimados es mnima justo en esos dos sectores.
Adems, se observa en la figura 13 que justamente en estos sectores hay un gran error (una
gran diferencia entre datos estimados y reales).
En la figura 15-B se muestra la nube de correlacin entre los valores reales (CuT) y estimados
(Krig CuT). Se observa una gran masa de datos bien estimados (la lnea negra es una diagonal,
pues los ejes usados no son de la misma escala), pero tambin una gran cantidad de datos mal
estimados.
19
MI4040 Anlisis Estadstico y Geoestadstico de Datos
De forma similar a lo ocurrido con el CuT, en los mapas de datos se observa claramente mayor
suavidad (homogeneidad) en los datos estimados, tenindose sin embargo un
comportamiento
espacial
general
similar
a
los
datos
reales.
En los histogramas se observa nuevamente que los datos estimados tienden a ser ms bajos:
las fracciones estimadas son ms altas que las reales hacia los valores ms bajos y hacia los
valores ms altos (extremos) las fracciones estimadas son ms bajas que las reales. En el
mismo sentido, el mximo estimado es mucho menor que el real y la media estimada es menor
que la real. El hecho que la dispersin de los datos estimados es menor que la de los datos
reales, ya percibido en los mapas, se vuelve a notar aqu al comparar las desviaciones
estndar.
20
MI4040 Anlisis Estadstico y Geoestadstico de Datos
En la figura 15-A se observa que la varianza del Kriging es mxima en dos sectores (amarillos y
rojos): esto implica que la confiabilidad de los datos estimados es mnima justo en esos dos
sectores.
En la figura 15-B se muestra la nube de correlacin entre los valores reales (CuT) y estimados
(Krig CuT). Se observa una gran masa de datos bien estimados (la lnea negra es una diagonal,
pues los ejes usados no son de la misma escala), pero tambin una gran cantidad de datos mal
estimados.
Respecto del anlisis realizado para la estimacin de CuT y CuS de pozos (la validacin jackknife), se puede concluir que los modelos de variograma desarrollados permiten representar la
continuidad espacial de la variable, pues dan origen a buenas estimaciones en prcticamente
todo el espacio. Sin embargo, y como en cualquier estimacin por kriging, hay inexactitudes y
errores que pueden sesgar decisiones tomadas en base a estas estimaciones; lo anterior es
21
MI4040 Anlisis Estadstico y Geoestadstico de Datos
inevitable y algunas formas de disminuir este sesgo son utilizar otros mtodos de estimacin o
tomar ms datos en terreno (pues a mayor cantidad de datos mejor es la estimacin obtenida
en base a ellos).
22
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Creacin de Grilla
Preparacin a la creacin de Grillas
Para la creacin de las grillas es necesario ajustar los valores filtrados, es decir sin datos
aberrantes ni duplicados, lo ms posible usando bloques de 10x10x10 hasta obtener una
discretizacin apta para utilizar la tcnica de krigging posteriormente.
Dado que nuestro banco de inters se encuentra alrededor de la cota 2885m, nos pareci
necesario graficar en un mapa bsico las cotas y de esta forma encontrar estadsticas y
posiblemente datos aberrantes.
En rojo podemos ver la cota que sale del banco de inters, y aqu su valor en las estadsticas,
que correspondera al mximo:
23
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Luego de quitar los valores aberrantes tanto por concepto de ley y cota, tenemos el siguiente
mapa bsico, en donde apreciamos que todos los valores estn cercanos a la cota 2885m,
Y la estadstica lo confirma:
Por lo tanto ahora se est en condiciones de comenzar a trabajar sobre este banco de inters,
comenzando por el ajuste de las grillas y seleccionando una zona de inters para el krigging.
24
MI4040 Anlisis Estadstico y Geoestadstico de Datos
El primer paso para lograr un ajuste de la grilla a nuestros datos de sondaje fue
obtener los valores mnimos y mximos para la ubicacin regional de datos, es decir para el
este, norte y la cota. Para lograrlo se hizo uso de las estadsticas proporcionadas por Isatis:
Con estos valores es posible comenzar la discretizacin, comenzando con valores iniciales para
la cota de 2.88 km, para la coordenada Este de 0.08km y para la coordenada Norte de 0.15km.
Usando bloques de 10x10x10 son necesarios 2 bloques en la cota, 92 bloques hacia el Este
y 125 bloques hacia el Norte para cubrir los datos obtenidos por sondaje hasta el ltimo punto.
25
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Por lo tanto tenemos una grilla tridimensional formada por 23000 Nodos o bloques de
10x10x10 . Pero como se puede apreciar de mapas bsicos obtenidos en nuestra primera
etapa de anlisis, muchos de estos datos se encuentran aislados y por lo tanto hay zonas en
donde hacer krigging simplemente no sera representativo, esto nos lleva a pensar que la zona
de trabajo debe reducirse a una filtrada, en donde las estimaciones obtenidas si tengan una
cercana a la realidad.
Para establecer una zona de seleccin a partir de los 23000 bloques debemos usar los datos
tanto de cobre soluble como de cobre total y a partir de eso obtener dos zonas distintas,
representativas para cada tipo de cobre.
26
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Luego se procede a desechar aquellos bloques que no estn en la cercana de los datos
obtenidos por sondaje, a fin de crear una zona de seleccin representativa, obteniendo como
resultado lo siguiente:
La seleccin se realiz sobre una grilla de 23000 bloques, de los cuales 8286 fueron
desestimados y 14714 seleccionados para el proceso de Krigging.
27
MI4040 Anlisis Estadstico y Geoestadstico de Datos
La seleccin se realiz sobre una grilla de 23000 bloques, de los cuales 8580 fueron
desestimados y 14420 seleccionados para el proceso de Krigging.
28
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Es de notar que la discretizacin de bloques se hizo de 10x10x1, dado que se obtenan valores
muchos ms estables de CVV al momento de ejecutar los test.
Los resultados obtenidos se presentan en los siguientes histogramas y mapas.
29
MI4040 Anlisis Estadstico y Geoestadstico de Datos
30
MI4040 Anlisis Estadstico y Geoestadstico de Datos
31
MI4040 Anlisis Estadstico y Geoestadstico de Datos
32
MI4040 Anlisis Estadstico y Geoestadstico de Datos
33
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Conclusiones
Isatis es una herramienta bastante eficiente al momento de trabajar con variables
regionalizadas, se pueden realizar una gran cantidad de anlisis univariables y multivariables.
El modelamiento del variograma experimental debe ser lo mas exacto posible, pues de
ello depende la mayor parte de la estimacin por kringing, la mayor parte de los datos mal
estimados (varianza mayor a 2,5) ocurren por esta razn.
La estimacin por kriging es bastante til al momento de estimar los recursos de un
yacimiento, ya que ste es un estimador insesgado, lineal y de varianza mnima, sin embargo
se debe tener cuidado ya que el kriging tiende a acercar las estimaciones a la media,
disminuyendo la frecuencia de los datos extremos (que en algunos casos suele ser el de mayor
inters, por ejemplo, el oro).
34
MI4040 Anlisis Estadstico y Geoestadstico de Datos
Bibliografa
-Emery, Xavier; Ctedras MI4040-2Anlisis estadstico y geoestadstico de datos, Semestre
Primavera 2012, U-cursos, Material Docente.
-Emery, Xavier; Gua y Manual ISATIS, Semestre Primavera 2012, U-cursos, Material Docente.
-Emery, Xavier; Laboratorio ALGES, ALGES 1: Estudio exploratorio de datos.
-Emery, Xavier; Laboratorio ALGES, ALGES 2: Variograma.
-Caballero, Enrique; Memoria de ttulo,Prediccin Multivariable De Recursos Recuperables,
Abril 2012.
35
MI4040 Anlisis Estadstico y Geoestadstico de Datos