You are on page 1of 45

ECC3014

ENGINEERING
STATISTICS
Normal Distribution

• The  normal  distribution  (also  called  the 


Gaussian  distribution)  is  by  far  the  most 
commonly  used  distribution  in  statistics.  This 
distribution  provides  a  good  model  for  many, 
although not all, continuous populations.  

• The  normal  distribution  is  continuous  rather 


than  discrete.    The  mean  of  a  normal 
population  may  have  any  value,  and  the 
variance may have any positive value.
Normal R.V :  Pdf, Mean 
and Variance
• The  probability  density  function  of  a  normal 
population  with  mean    and  variance  2  is 
given by
1
f ( x) = , - �< x < �
2
- ( x- ) / 2 2
e
 2p
• If X ~ N(, 2), then the mean and variance of X 
are given by
X = 
•  =
2
X
2
68 – 95 – 99% Rule

• This  figure  represents  a  plot  of  the  normal  probability 


density function with mean  and standard deviation .
• Note  that  the  curve  is  symmetric  about  ,  so  that    is  the 
median  as  well  as  the  mean.    It  is  also  the  case  for  the 
normal population.
 About 68% of the population is in the interval   . 
 About 95% of the population is in the interval   2.
 About 99.7% of the population is in the interval   3.
Standard Units

• The  proportion  of  a  normal  population  that  is 


within a given number of standard deviations of 
the mean is the same for any normal population. 
 
• For  this  reason,  when  dealing  with  normal 
populations,  we  often  convert  from  the  units  in 
which  the  population  items  were  originally 
measured to standard units.  
• Standard  units  tell  how  many  standard 
deviations an observation is from the population 
mean.  
Standard Normal 
Distribution
• In general, we convert to standard units by subtracting 
the mean and dividing by the standard deviation. 
•  Thus, if x is an item sampled from a normal population 
with  mean    and  variance  2,  the  standard  unit 
equivalent of x is the number z, where

x-
z=

• The  number  z  is  sometimes  called  the  “z­score”  of  x.   
The  z­score  is  an  item  sampled  from  a  normal 
population  with  mean  0  and  standard  deviation  of  1.   
This  normal  population  is  called  the  standard  normal 
population.
Example

Aluminum  sheets  used  to  make  beverage  cans 


have  thicknesses  (in  thousandths  of  an  inch)  that 
are  normally  distributed  with  mean  10  and 
standard  deviation  1.3.    A  particular sheet is 10.8 
thousandths of an inch thick.  Find the z­score.

Refer  to  example  3.  The  thickness  of  a  certain 


sheet has a z­score of -1.7.  Find the thickness of 
the  sheet  in  the  original  units  of  thousandths  of 
inches.
Finding Areas Under the 
Normal Curve
• The  proportion  of  a  normal  population  that  lies 
within a given interval is equal to the area under 
the  normal  probability  density  above  that 
interval.  
• This  would  suggest  integrating  the  normal  pdf, 
but  this  integral  does  not  have  a  closed  form 
solution.  
Finding Areas Under the 
Normal Curve
• So,  the  areas  under  the  standard  normal  curve 
(mean  0,  variance  1)  are  approximated 
numerically  and  are  available  in  a  standard 
normal table or z table.  

• We  can  convert  any  normal  into  a  standard 


normal  so  that  we  can  compute  areas  under  the 
curve.  

• The table gives the area in the left­hand tail of the 
curve.    Other  areas  can  be  calculated  by 
subtraction or by using the fact that the total area 
under the curve is 1.
Example

1) Find the area under normal curve to the left of 
z = 0.47.  
Answer: 0.6808
2) Find the area under the curve to the right of z = 
1.38.
Answer: 0.0838

3) Find the  area under the  normal curve between 


z = 0.71 and z = 1.28.
Answer: 0.1386
4) What z­score corresponds to the 75th percentile 
of a normal curve? Answer: approximately 0.67
Confidence Intervals

• Point estimates:
– as an estimate of population mean (point estimate is 
sample mean)
–   as  an  estimate  of  a  success  probability  (point 
estimate is sample proportion)
• These point estimates are almost never exactly equal to the 
true  values  they  are  estimating  because  they  are  single 
points.
• In order for the point estimate to be useful, it is necessary 
to describe just how far off from the true value it is likely to 
be.
• One way to estimate how far our estimate is from the true 
value is to report an estimate of the standard deviation, or 
uncertainty.
Example
• Assume  that  a  large  number  of  independent 
measurements  from  a  normal  population,  all 
using  the  same  procedure,  are  made  on  the 
diameter  of  a  piston.    The  sample  mean  of  the 
measurements is 14.0 cm, and the uncertainty in 
this quantity, which is the standard deviation of 
the sample mean, is 0.1 cm. 

• So,  we  have  a  high  level  of  confidence  that  the 


true diameter is in the interval (13.7, 14.3). This 
is  because  it  is  highly  unlikely  that  the  sample 
mean will differ from the true diameter by  more 
than three standard deviations.
Example

• On  the  other  hand,  it  is  not  too  unlikely  the 
sample  mean  to  differ  from  the  true  value  by 
more than one standard deviation.

• Therefore,  a  lower  level  of  confidence  that  the 


true diameter is in the interval (13.9, 14.1)

• The  intervals  (13.7,  14.3)  and  (13.9,  14.1)  are 


confidence  interval  for  the  true  diameter  of  the 
piston
Large Sample Confidence 
Interval for a Population Mean

• Recall  the  previous  example:  Since  the 


population mean will not be exactly equal to the 
sample  mean  of  14,  it  is  best  to  construct  a 
confidence interval around 14 that is likely to 
cover the population mean. 

• We  can  then  quantify  our  level  of  confidence 


that the population mean is actually covered by 
the interval.  

•                   
Constructing CI

• To  see  how  to  construct  a  confidence  interval, 


let    represent  the  unknown  population  mean 
and let  2 be the unknown population variance.  
Let  X1,…,  X100  be  the  100  diameters  of  the 
pistons.  

X
• The observed value of      is the mean of a large 
sample,  and  the  Central  Limit  Theorem 
specifies  that  it  comes  from  a  normal 
distribution  with  mean    and  whose  standard 
deviation is                       .
 X =  / 100
Illustration of Capturing 
True Mean
• Here  is  a  normal  curve,  which  represents  the 
distribution of    .
X

• The middle 95% of the curve, extending a distance 
1.96 X
of                on either side of the population mean 
,  is  indicated.    The  following  illustrates  what 
happens if       lies within the middle 95% of the 
X
distribution:
Illustration Not 
Capturing True Mean
• If the sample mean lies outside the middle 95% of 
the curve:  
– Only 5% of all the samples that could have been drawn 
fall into this category.  
– For  those  more  unusual  samples,  the  95%  confidence 
X  1.96 X
interval                     fails to cover the true population 
mean .
Computing a 95% 
Confidence Interval
X  1.96 X
• The 95% confidence interval (CI) is                   .

• So, a 95% CI for the mean is 14  1.96(0.1). We can 
use  the  sample  standard  deviation  as  an  estimate 
for  the  population  standard  deviation,  since  the 
sample size is large.

• We can say that we are 95% confident, or confident 
at the 95% level, that the population mean diameter 
for pistons lies, between 13.804 and 14.196. 
Warning:  The  methods  described  here  require  that  the  data  be  a  random 
sample  from  a  population.    When  used  for  other  samples,  the  results  may 
not be meaningful.
Question
• Does  this  95%  confidence  interval  actually  cover  the 
population mean ? 
•  
 It depends on whether this particular sample happened to 
be  one  whose  mean  came  from  the  middle  95%  of  the 
distribution, or whether it was a sample whose mean was 
unusually  large  or  small,  in  the  outer  5%  of  the 
population.

 There is no way to know for sure into which category this 
particular sample falls.  

 In  the  long  run,  if  we  repeatedly  constructed  these 


confidence  intervals,  then  95%  of  the  samples  will  have 
means in the middle 95% of the population and 95% of the 
Extension

• We are not always interested in computing 95% 
confidence intervals.  Sometimes, we would like 
to have a different level of confidence.

• We can use the same reasoning we did for 95% 
confidence  intervals  to  compute  confidence 
intervals with various confidence levels.
Specific Confidence 
Interval for   
s
• X is a 68% interval for .
n
s
• X  1.645 is a 90% interval for .
n

• X  1.96 s is a 95% interval for .


n

• X  2.58 s is a 99% interval for .


n

• X  3 s is a 99.7% interval for .


n
Example

• The  sample  mean  and  standard  deviation  for  the 


fill weights of 100 boxes are and s =0.1.
• Find  an  85%  confidence  interval  for  the mean  fill 
weight of the boxes.

Answer: 1.44
Standard error: 0.01
85% CI  12.05
Sampling distribution

• Random sample (finite population)
– A  set  of  observation  X1,  X2,  X3,  ……….Xn  constitute  a 
random  sample  of  size  n  from  a  finite  population  of 
size N. If it is chosen so that each subset of n of the N 
elements of the population has the same population of 
being selected.
Sampling distribution

• Random sample (infinite population)
– A  set  of  observation  X1,  X2,  X3,  ……….Xn  constitute  a 
random sample of size n from the infinite population  
f(x) of :
• Each  Xi  is  a  value  of  a  random  variable  whose 
distribution is given by f(x)
• These n random variable are independent
Standard Error (SE) = 
Central Limit Theorem

• If    is  the  mean  of  a  random  sample  of  size  n 


taken from a population having the mean µ and 
the finite variance then

Z=
Central Limit Theorem

• A random variable having t­ distribution (known 
mean) (n< 30) 
• If    is  the  mean  of  a  random  sample  of  size  n 
taken  from  a  normal  population  having  the 
mean µ and the finite variance then
            =        then,          t =
         and v = n­1
Sampling distribution of 
variance
• If    is  the  variance  of  random  sample  of  size  n 
taken from normal population having , then
            =     = 
   and 
     v = n­1
Sampling distribution of 
variance
A random variable having F­ distribution

• If  and  are the variance of independent random 
couples size n1  and n2    respectively, taken from 2 
normal  population  having  the  same  variance 
then 
            = 
   and 
     v1 = n1­1                  v2 = n2­1
Sampling distribution of 
variance
A random variable having F­ distribution
• Property  of  the  F  distribution  that  its  F­critical 
values  for  the  left  and  right  tails  of  the 
distribution are related by      

• where  F1­α  is  the  F­value  which  has  area 


(probability)  α to the left of it under the F curve 
(for the given two parameters)     
Why?

• We  need  this  to  decide  a  statement  concerning  a 


parameter is true or false
• Truth about null hypothesis in population
Accept (Ho) Reject (Ho)
  (Ha) is true Correct  Type I 
                                                                        
decision Error
(Ha) is false Type II Correct 
Error decision
Ho : null hypothesis
Ha : alternate hypothesis
Example

• A  manufacturer  of  fuse  claims  that  with  20% 


overload,  the  fuse  will  blow  in  12.40  min  on 
average. To test this claim, a sample of 20 of fuse 
was  subjected  to  20%  overload,  and  the  times  it 
took them to blow had a mean of 10.63 min and 
std. deviation of 2.48 min. Data is assumed to be 
from normal population. At 99% CI, test can we 
support or refuse the manufacturer’s claim?

Answer:
Example

• If  a  gallon  can  of  paint  covers  on  the  average 


513.3 ft2  with standard deviation of 31.5ft2, what 
is the probability that the mean area covered by 
a  sample  of  40  of  these  1­gallon  cans  will  be 
anywhere from 510.0 to 520.0 ft?

Answer:
Example

• An optical firm purchases glass to be ground into 
lenses, past experiment that  of refractive index 
is  1.26  x  10­4  .  The  firm  rejects  if  the  variance  of 
20  pcs,  selected  at  random  exceeds  2.00  x  10­4  . 
Assuming that the sample values may be looked 
upon  as  a  random  sample  from  a  normal 
population,  what  is  the  probability  that  a 
shipment will be rejected?
Answer:

The probability of error rejected is less than 0.05


Example

• If  2  independent  random  samples  of  size  n1=7 


and n2 = 13 are taken from a normal population, 
what  is  the  probability  that  the  variance  of  the 
first  sample  will  be  at  least  3  times  as  large  as 
that of the second sample?

Answer:

Used the table to get the probability : Answer: 0.05


There is a 5% probability that the variance of the first sample
will be at least 3 times of the second
Finding values of F­
corresponding
•  = 

Example
Find the value for  = 20 degree of freedom

Answer:
Maximum Error of the 
Estimate
• The  maximum  error  of  the  estimate  is  the 
maximum  likely  difference  between  the  point 
estimate  of  a  parameter  and  the  actual value of 
the parameter
Example

• An  industrial  engineer  intends  to  use  the  mean 


of random sample of size  n = 150 to estimate the 
average  mechanical  aptitude  of  assembly  line 
workers  in  a  large  industry.  If  on  the  basis 
experiment,  he  assume  σ  =  6.2  for  such  data. 
What  can  he  assert  with  probability  0.99  about 
the maximum size of his error?

Answer: Max error, E = 1.30


Example

• In six determination of the melting point of tin, a  
chemist obtained the  = 232.26  with s= 0.14 If he 
uses this mean as actual melting point of tin, what 
can  the  chemist  assert  with  98%  confidence  about 
the maximum error?

Answer: Max error, E = 0.19


The chemist can assert with 98% confidence that his figure for
melting point of tin is at most 0.19
Example

• A  research  worker  wants  to  determine  the 


average  time  it  takes  a  mechanic  to  rotate  the 
tyre of a car, and  she wants to be able to assert 
with  95%  confidence  that  the  mean  of  her 
sample is off by at  most 0.50 minute. If she can 
presume from past experiment that  σ = 1.6 min, 
how large the sample will she have to take?

Answer: number of sample = 39.3 or 40 samples


Interval Estimation

• Large sample

• Small sample (30)
 
Example

• A  random  sample  size  n  =  100  is  taken  from  a 


population  with  σ  =  5.1.  Given  that  the  sample 
mean  is    =  21.6,  construct  a  95%  confidence 
interval for the population mean, µ 

Answer:
Example

• The  mean  weight  loss  of  n  =  16  grinding  balls 


after  a  contain  length  of  time  in  mill  slurry  is 
3.42  g  with  std.  deviation  of  0.68g.  Construct  a 
99%  a  confidence  interval  for  the  true  mean 
weight loss

Answer:
Thank You

You might also like