You are on page 1of 8

 2)

 Funciones  de  distribución  de  probabilidad.  Histogramas.  


Función  de  distribución  de  probabilidad  (o  función  de  densidad  de  probabilidad):  
Es  una  función  matemá0ca  de  una  o  varias  variables  que  describe  la  probabilidad    
de  obtener  un  conjunto  específico  de  valores  para  la(s)  variable(s)  considerada(s).  

Un  paso  previo  a  la  obtención  de  una  función  de  distribución  es  la  generación  de  un  
histograma  a  par0r  del  conjunto  de  datos.  En  Matlab:  

La  función  hist(data,x)  genera  un  histograma  de  los  datos  en  las  posiciones  dadas  
por  el  vector  x(  ),  o  dicho  de  otra  forma:  agrupa”  los  datos  del  vector  data(  )  en  un  
número  de  grupos  igual  a  length(x).  Cada  uno  de  estos  grupos  está  centrado  en  el    
correspondiente  valor  de  x(  )  y  nos  da  información  de  como  se  distribuyen  los  datos  
almacenados  en  data()  en  los  dis0ntos  grupos  definidos  por  x()
data(  )  con0ene:  
 4  veces  el  número  1  
 4  veces  el  número  2  
 3  veces  el  número  3  
 5  veces  el  número  4  
 3  veces  el  número  5  
 2  veces  el  número  6   1  
 2)  Funciones  de  distribución  de  probabilidad.  Histogramas.  

Ejemplo  ilustra>vo:  
U0lizando  los  datos  de  precipitación  del  ejercicio  anterior:    
rES  =  [50  48  55  44  47  13  8  18  39  78  60  55]  (mm  lluvia  promedio  por  mes  en  España)  
rMA  =  [62  42  70  35  35  4  1  3  32  94  71  56]  ]  (mm  lluvia  promedio  por  mes  en  Madrid)  
rLO  =  [58  39  51  49  54  53  48  56  58  62  61  63]  (mm  lluvia  promediopor  mes    en  Londres)  
Se  pide:  pintar  un  histograma  para  cada  conjunto  de  datos,  u0lizando  intervalos  
de  medida  de  precipitación  definidos  por  x=0:20:80,para  obtener  una  figura  
   similar  a  la  que  se  incluye  debajo.  

2  
 2)  Funciones  de  distribución  de  probabilidad.  Histogramas.  
La  función  de  distribuión  de  probabilidad  se  puede  obtener  normalizando  el  histograma.  
Así,  para  una  variable  discreta,  normalizar  corresponde  a  dividir  por  el  número  total  de  
datos.  Para  una  variable  con0nua  x,  definida  en  un  intervalo  [xmin,  xmax]  ,  la  función    
distribución  correspondiente  p(x)  debe  sa0sfacer:  

(nótese  que  imponer  esta  condición  es  equivalente  a  imponer  la  condición  obvia  de  que  
la  probabilidad  de  que  la  variable  esté  en  el  intervalo  en  el  que  puede  tomar  valores  es    
igual  a  1)  

Ejemplo  ilustra>vo:  

Considérense  el  conjunto  de  datos  siguiente:  


data  =  [9  2  8  7  1  3  4  8  3  2  3  10  9  3  8  9]  
Crear  un  histograma  normalizado,  
como  el  que  se  muestra  a  la  derecha,  
que  cuan0fique  la  probabilidad  de  encontrar    
en  data()  cada  uno  de  los  valores  
definidos  por  x  =  [1  2  3  4  5  6  7  8  9  10].    
3  
 2)  Funciones  de  distribución  de  probabilidad.  Histogramas.  
Función  de  distribución  Gaussiana  o  normal:  Es  una  distribución  muy  ú0l  que  aparece  
en  un  gran  número  de  contextos  en  asica.  Está  definida  por  dos  parámetros:  el  valor    
medio  (μ)  y  la  desviación  estandar  (σ).    

(Nota:  68%  y  95%  de  las  observaciones  estarán  dentro  de  1σ  y  2σ,  respec0vamente)  
Ejercicio  para  hacer  en  clase  (Parte  1):  
1.  U0liza  la  función  randn() para  generar  un  conjunto  aleatorio  de  N  datos  
             centrados  en  x=0  y  con  desviación  estándar    σ=1.

2.  Crea  un  histograma  a  par0r  de  los  datos  obtenidos  en  el  apartado  anterior.  

3.    Normaliza  el  histograma  obtenido  en  el  apartado  anterior  para  obtener  la  
         función  de  probabilidad.  Compara  gráficamente  el  resultado  obtenido  con  
         la  expresión  analí0ca  correspondiente.  

4.  Usar  la  función  randn() para  generar  un  conjunto  N  de  números  aleatorios  
           distribuidos  uniformemente  en  el  intervalo  [0,1]  y  repe0r  los  apartados  1-­‐3.  
4  
 2)  Funciones  de  distribución  de  probabilidad.  Histogramas.  
Ejercicio  para  hacer  en  clase  (Parte  2):  

Hacer  una  gráfica  de  la  distribución  de  probabilidad  Gaussiana  normalizada  obtenida  
en  la  parte  anterior  del  ejercicio  (  u0lizando  la  función  randn()  )  para  diferentes  
valores  del  número  total  de  puntos  N  y  para  diferentes  valores  del  número  total  
de  intervalos.  

5  
Generadores  de  números  aleatorios  en  MATLAB  que  sigan  una  distribución  de  probabilidad  
uniforme:  
 rand(m,n):  genera  una  matriz  “m  x  n”  con  una  distribución  uniforme  de  números    
aleatorios  en  el  intervalo  [0,1]:  

Ejemplo  de  uso:  


>>  A=rand(20,1)  
>>  A=A*100    %crea  números  aleatorios  entre  0  y  100  
>>  hist(A)    %pinta  el  histograma  correspondiente  

randi():  
   randi(imax):  genera  un  entero  aleatorio  entre  0  y  imax  (distr.  uniforme)  
                                   randi(imax,n):  genera  una  matriz  “n  x  n”  y  la  llena  de  enteros  aleatorios  
         entre  0  y  imax.  
   randi([imin,  imax],n,m):    genera  una  matriz  “n  x  m”  con  números  enteros  
         aleatorios  distribuidos  en  el  intervalo  [imin,imax]  
           
Ejemplo  de  uso:  
>>  r  =  randi([-­‐10  10],1,1000)  %  crea  una  matriz  de  número  enterso  aleatorios  que  
siguen  una  distribución  uniforme  dentro  del  conjunto  de  números  enteros  
[-­‐10  -­‐9  -­‐8  ….  8  9  10]  

6  
Introducción  al  método  de  Montecarlo.  

El  método  de  Montecarlo  sirve  para  designar  a  un  0po  de  métodos  númericos  que  se    
basa  en  el  muestreo  aleatorio  (“random  sampling”).  

Como  ejemplo,  veamos  como  el  método  de  Montecarlo  se  puede  u0lizar  para  calcular  
el  valor  del  número  π:  

1.  Distribuimos  aleatoriamente  y  uniformemente      


puntos  sobre  un  “cuadrado  unidad”  [1,0]x[0,1]  

2.  Determinamos  cuales  de  esos  puntos  están    


dentro  de  la  zona  sombreada  de  la  figura.  

3.  El  porcentaje  de  los  puntos  que  están  dentro  de  la  
zona  sombreada  con  respecto  a  todos  los  puntos  es  
una  aproximación  a  π/4.  
Ejemplo  de  código  en  matlab:  

>>n  =  1000000;  #  number  of  Monte  Carlo  samples  


>>x  =  rand(n,  1);  #  sample  the  input  random  variable  x  
>>y  =  rand(n,  1);  #  sample  the  input  random  variable  y  
>>isInside  =  (x.ˆ2  +  y.ˆ2  <  1);  #  is  the  point  inside  a  unit  circle?  
>>percentage  =  sum(isInside)  /  n;  #  compute  sta0s0cs:  the  inside  percentage  
>>piEs0mate  =  percentage  *  4  

You might also like