You are on page 1of 9

FACULTAD DE :CIENCIAS BIOLOGICAS

ESCUELA PROFESIONAL :CIENCIAS BIOLOGICAS


SEMESTRE :2017-II
ASIGNATURA :BIOESTADSTICA
TEMA :INTRODUCCIN AL R
LABORATORIO N :01_A
SEMANA N07 :1RA PC LABORATORIO
SEMANA N14 :2DA PC LABORATORIO
PROFESOR : Lic. Fernando Cesar Camones Gonzales

I. INTRODUCCIN AL R

En este curso todo el software que se utiliza es software libre. Soy de la opinin de
que en educacin universitaria se debe utilizar exclusivamente software libre.

1. Referencia: Una referencia en castellano muy til puede ser


http://knuth.uca.es/moodle/course/view.php?id=37.
Su contenido est basado en la estadstica bsica en R, pero sin embargo, su
contenido va ms all del silabo del curso, puede usarlo como invitado o en todo
caso se puede registrar para acceder a mayor informacin.
2. Lo primero: Vamos a empezar con el manejo bsico del lenguaje R. Una visin general
del software y sus posibilidades la podemos encontrar en http://www.r-project.org/.
3. Instalacin: Los pasos a seguir son los siguientes: Bajamos el programa de la
siguiente direccin http://cran.rproject.org/. Y seguir las indicaciones sugeridas dentro del
contenido del punto 1.
4. Inicio de una sesin: En el escritorio tenemos el icono de R. Simplemente
clicando el icono iniciamos la sesin de trabajo.
5. Instalacin de un paquete R: tiene muchos paquetes que extienden el R base
que acabamos de instalar. De hecho, es casi imposible realizar un anlisis
estadstico por sencillo que sea sin utilizar paquetes de R. se sigue el siguiente
camino para instalar un paquete estadstico en R:
packages/install/readr, foreing/enter (ver grfico 01)

readr
foreing
lmtest
Rcmdr

La siguiente direccin web tiene una relacin actualizada y comentada de estos


paquetes, su contenido cubre de manera generosa la asignatura de bioestadstica:
http://cran.r-project.org/web/views/Environmetrics.html
Grfico 01. Instalacin de un paquete estadstico

6. Lectura y escritura de datos y repaso de estadstica descriptiva:


Supongamos que hemos recogido unos datos y queremos analizarlos con
R. Hemos de leer estos datos desde R. Hay muchas opciones para
hacerlo.

a) Base de datos del propio R


Creando un R Script:

R Script: SEMANA_01_A_INTRODUCCIN AL R.R


#apertura de la base de datos
#cmo conseguir ayuda con R
?airquality
#Base de datos
data(airquality)
attach(airquality)
head(airquality)
#Eliminando datos faltantes
Solar.R2<-Solar.R[!is.na(Solar.R)]
Solar.R2
#Repaso de estadstica descriptiva
n<-length(Solar.R2)
n
#Seleccin de casos
#seleccin de casos en un nuevo vector: y
y = Solar.R2[Solar.R2 > 170 & Solar.R2 <= 185]
y
#Cmo guardar un grfico en pdf
pdf("histograma_ejemplo.pdf")
hist(Solar.R2)
dev.off()
#La mxima radiacin solar
which.max(Solar.R2)
#aplicando la funcin raz cuadrada
sqrt(Solar.R2)[1:6]
#Media muestral
Media<-mean(Solar.R2)
Media
#de otro modo se obtiene la media muestral
sum(Solar.R2)/length(Solar.R2)
#Percentiles
#1er paso ordenar los datos
sort(Solar.R2)
#Cuntos datos son <= 185 contar a mano o utilizar: la funcin
ecdf
Fn = ecdf(Solar.R2)
Fn(185) ##[1] 0.4041096,la proporcin de datos inferiores a 185
es 40.4%
#otra manera de calcular la posicin <=185:quantiles
quantile(Solar.R2,probs = 0.4041096)##40.4% 184.7877
#La mediana muestral es el percentil de orden 0,5
median(Solar.R2)
#otra manera de calcular la mediana:quantiles
quantile(Solar.R2,probs = 0.5)
#Cuando p = 0,25 al percentil le llamamos cuartil inferior.
##Si p=0,75 tenemos el cuartil superior.
quantile(Solar.R2,probs = c(0.25,0.75))
#Varianza y desviacin estndar muestrales
var(Solar.R2)
sd(Solar.R2)
#Rango
range(Solar.R2)
diff(range(Solar.R2))
#minimo
min(Solar.R2)
#maximo
max(Solar.R2)
#diferencia
R<-max(Solar.R2)-min(Solar.R2)
R
#Rango intercuartlico: Una medida ms robusta que el rango.
IQR(Solar.R2)
#La funcin summary
summary(Solar.R2)

b) Introducir datos desde el teclado: uso de la funcin c


concatenar:

Tarea N01: Ejercicios (entregar la siguiente sesin: 01


por grupos)
eficiencia<-c(19,59,89,96,66,80,7,49,89,98,91,98)
eficiencia
intensidad<-c(1,1,1,1,1,1,3,3,3,3,3,3)
intensidad
tiempo<-c(10,20,30,40,10,20,30,40,10,20,30,40)
tiempo
ph<-c(7.5,6,9,7.5,6,9,7.5,6,9,7.5,6,9)
ph
Eficiencia<-data.frame(intensidad,tiempo,ph,eficiencia)
Eficiencia

Se pide:
1. Leer los datos.
2. Calcular la media, mediana, los percentiles de orden 0,1 y 0,9.
Varianza, desviacin estndar, rango, rango intercuartilico, la funcin
sumary. Utilizando la variable eficiencia
3. Analizar e interpretar cada estadstico.
II. USO DE LAS TABLAS ESTADSTICAS EN R

El manejo de las tablas de probabilidad en R es importante mencionar que las tablas


se encuentran en el paquete stats.

1. Entrando al R Studio, podemos ubicar de la siguiente manera el paquete stats:

Borrar
pantalla=Control + L

En el paquete stats encontramos las cuatro distribuciones de probabilidad ms


importantes de acuerdo al contenido del silabo: hacemos click en stats, luego en Q
qnorm y pnorm
a) La Distribucin normal:

Si en la consola del R escribimos:>?qnorm


Aparecen 4 opciones, de los cuales utilizaremos solo dos:
pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)

qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE) o


qnorm(p, mean = 0, sd = 1, lower.tail = TRUE) ----Izquierda
qnorm(p, mean = 0, sd = 1, lower.tail = FALSE)----Derecha

b) La Distribucin t de Student: qt y pt
Si en la consola del R escribimos:>?qt

Aparecen 4 opciones, de los cuales utilizaremos solo dos:


pt(q, df, ncp, lower.tail = TRUE, log.p = FALSE)

qt(p, df, ncp, lower.tail = TRUE, log.p = FALSE) o

qt(p, df, lower.tail = TRUE) -------Izquierda


qt(p, df, lower.tail = FALSE)-------Derecha

c) La Distribucin Chi cuadrado: qchisq y pchisq

Si en la consola del R escribimos:>?qchisq


Aparecen 4 opciones, de los cuales utilizaremos solo dos:
pchisq(q, df, ncp = 0, lower.tail = TRUE, log.p = FALSE)
qchisq(p, df, ncp = 0, lower.tail = TRUE, log.p = FALSE)

qchisq(p, df, ncp = 0, lower.tail = TRUE, log.p = FALSE) o

qchisq(p, df, lower.tail = TRUE)---------izquierda


qchisq(p, df, lower.tail = FALSE)-------Derecha

d) La Distribucin F: qf y pf
Si en la consola del R escribimos:>?qf
Aparecen 4 opciones, de los cuales utilizaremos solo dos:
pf(q, df1, df2, ncp, lower.tail = TRUE, log.p = FALSE)
qf(p, df1, df2, ncp, lower.tail = TRUE, log.p = FALSE)

qf(p, df1, df2, ncp, lower.tail = TRUE, log.p = FALSE)


qf(p, df1, df2, lower.tail = TRUE) ---------izquierda
qf(p, df1, df2, lower.tail = FALSE)-------Derecha
e) Ejercicio N02: resuelva los siguientes casos y entregar la
prxima sesin 01, de acuerdo a lo comentado en clases:
1. Obtener el valor en una distribucin normal de Z para un valor de alfa de 0.05
2. Obtener el valor de la probabilidad correspondiente a los siguientes valores de
Z=1.825 y Z=-2.78
3. Obtener el valor de t0 para alfa=0.05 con 12 gl
4. Obtener el valor de alfa para to=1.897 con 15 gl
5. Obtener el valor de chicuadrada para un alfa=0.01, 34 gl
6. Obtener el valor de alfa para un chicuadrada=6.65, gl=23
7. Obtener el valor de F para alfa=0.01, 12 y 34 gl
8. Obtener el valor de Alfa para F=12.45, 23 y 12 gl

Lima, 18-agosto-2017

You might also like