rnas
Shared by: SUSB
-
Stats
- views:
- 1
- posted:
- 8/9/2011
- language:
- Spanish
- pages:
- 30
Document Sample


Principios de
Estad´ıstica
Datos ıstica
Principios de Estad´
a
Gr´ficas de
Pie
a
Gr´ficas de
barras ıa e
Leonardo Collado Torres y Mar´ Guti´rrez Arcelus
a
Gr´ficas de
mosaicos
o
Licenciatura en Ciencias Gen´micas, UNAM
www.lcg.unam.mx/~lcollado/index.php
www.lcg.unam.mx/~mgutierr/index.php
e
Cuernavaca, M´xico
Febrero - Junio, 2009
1 / 30
o a
Sesi´n pr´ctica con small RNAs
Principios de
Estad´ıstica
Datos 1 Datos
a
Gr´ficas de
Pie
a
Gr´ficas de
barras
a
2 Gr´ficas de Pie
a
Gr´ficas de
mosaicos
a
3 Gr´ficas de barras
a
4 Gr´ficas de mosaicos
2 / 30
Intro
Principios de
Estad´ıstica
Datos ıculo:
Lo que hoy vamos a ver viene del siguiente art´
a
Gr´ficas de
Pie
Sorting of Small RNAs into Arabidopsis Argonaute
Gr´ficas de
a
Complexes Is Directed by the 5’ Terminal Nucleotide
barras
ıculo encuentran que AGO reconoce
En dicho art´
a
Gr´ficas de
mosaicos o
informaci´n de la secuencia en el extremo 5’, y vamos a
usar datos de ellos.
ı, o a ı
En s´ la informaci´n suplementaria est´ disponible aqu´ o
ıculo desde NCBI.
pueden encontrar el art´
a
Por ahora, pueden ver el PDF en la p´gina de cursos.
3 / 30
Datos para R
Principios de
Estad´ıstica
Datos
a
Gr´ficas de
Pie
e
Ya les arregl´ las tablas suplementarias 1 y 2 para poder
Gr´ficas de
a
usarlas en R.
barras
a
La 1 ahora es rnas.csv que est´ disponible en datos.
a
Gr´ficas de
mosaicos
a
La 2 ahora es mirnas.csv est´ en el mismo folder.
ı,
En s´ si alguien gusta, le recomiendo que compare los
archivos Excel originales con los .csv que les proporciono.
Sobre todo por las notas.
4 / 30
A trabajar!
Principios de
Estad´ıstica
o o
Bueno, a trabajar. Por favor ap´yense en el c´digo
Datos
a o
disponible sobre esta clase. Pronto entregar´n el c´digo,
a
Gr´ficas de
Pie u
tal que lo podamos correr sin ning´n problema.
Gr´ficas de
a Les recuerdo, usen:
barras
Gr´ficas de
a
Emacs; en un buffer tengan su script y en el otro buffer
mosaicos abran R.
R en Windows usando un editor de textos. Por ejemplo, el
a
que ya viene con R. Tendr´n que usar copy paste seguido.
El comando savehistory. Sin embargo, el output de este lo
a
tendr´n que depurar.
ıneas de c´digo nuevas que
Intenten comentar todas las l´ o
a
usen. Pues luego ser´ parte de la tarea.
5 / 30
Creando rnas
Principios de
Estad´ıstica
Datos
a
Gr´ficas de
Pie Primero vamos a imitar la figura 2.b de la parte ”Total”.
Gr´ficas de
a
barras
Pero para eso necesitamos datos. Lean el archivo
Gr´ficas de
a
rnas.csv
mosaicos
¿Alguien sabe que es un csv y como se lee?
Una vez que tengan el objeto rnas, chequenlo. Usen head
o tail por ejemplo.
6 / 30
Filtrando rnas
Principios de
Estad´ıstica
Datos
Gr´ficas de
a o
Bueno, este data.frame tiene informaci´n que por ahora
Pie
o
no nos interesa. Pues despliega informaci´n por miRNAs,
a
Gr´ficas de
barras tasiRNAs, etc.
Gr´ficas de
a
mosaicos
Vamos a filtrar los datos y crear el objeto rnas2. Hay que
ıas
quedarnos con solo las categor´ generales y no las
ıas.
subcategor´
> rnas2 <- rnas[c(1, 5, 14, 17, 18,
+ 21, 26, 27, 28, 29), ]
7 / 30
Las.... bueno, pie
Principios de
Estad´ıstica
a a
Son tal vez las gr´ficas m´s sencillas de hacer y
Datos
a
probablemente las m´s odiadas.
Gr´ficas de
a > `?`(pie)
Pie
Gr´ficas de
a
a
Solo chequen la ayuda de pie. Ver´n que dice: Pie charts
barras are a very bad way of displaying information. The eye is
Gr´ficas de
a
mosaicos
good at judging linear measures and bad at judging
relative areas. A bar chart or dot chart is a preferable way
of displaying this type of data.
a o
Bueno, hagamos nuestra gr´fica de pie de la secci´n de
”Total”.
> pie(rnas2[, 1], labels = rownames(rnas2),
+ col = rainbow(10), cex = 0.6,
+ main = "Total")
8 / 30
Pie de ”Total”
Principios de
Estad´ıstica
Total
Datos
a
Gr´ficas de Annotated repeats.c
Pie
a
Gr´ficas de
barras
a
Gr´ficas de
mosaicos NatsiRNAs
Dispersed repeats
TasiRNAs
miRNAs
Mitochondrial
Chloroplast
Non−coding RNAs
Others.d
Protein−coding genes
9 / 30
Logramos imitar una :)
Principios de
Estad´ıstica
a
La gr´fica es MUY parecida a la del art´ e
ıculo. En ´l, juntan
a los cloroplastos y mitocondrias en una categor´ıa.
Datos
a
Adem´s, usan otros colores.
a
Gr´ficas de
Pie
ı
En la nuestra tenemos problemas para leer los nombres, as´
a
Gr´ficas de
barras o
que mejor usamos la funci´n legend.
Gr´ficas de
a > pie(rnas2[, 1], labels = NA, col = rainbow(10),
mosaicos
+ main = "Total")
> legend("bottom", rownames(rnas2),
+ col = rainbow(10), xpd = T,
+ inset = -0.15, pch = 20, cex = 0.7,
+ ncol = 3)
o
Si se sienten perdidos con los argumentos de la funci´n
a a
legend, entender´n r´pido si checan la ayuda de dicha
o
funci´n.
10 / 30
Logramos imitar una :)
Principios de
Estad´ıstica
Datos
a
Gr´ficas de
Pie
a
Gr´ficas de
barras a
Ahora ya saben hacer el resto de las gr´ficas de la figura
Gr´ficas de
a ıculo :)
2.b de art´
mosaicos
11 / 30
Pie 2 de ”Total”
Principios de
Estad´ıstica
Total
Datos
a
Gr´ficas de
Pie
a
Gr´ficas de
barras
a
Gr´ficas de
mosaicos
q miRNAs q Dispersed repeats q Chloroplast
q TasiRNAs q Non−coding RNAs q Mitochondrial
q NatsiRNAs q Protein−coding genes
q Annotated repeats.c q Others.d
12 / 30
Creando mirnas
Principios de
Estad´ıstica
Datos
Gr´ficas de
a a
Ahora imitaremos a una gr´fica de barras que usan en la
Pie
Gr´ficas de
a
figura 3.c Al igual que antes, necesitamos DATA!!!
barras
Lean el archivo mirnas.csv como lo hicimos antes con
a
Gr´ficas de
mosaicos rnas.csv.
> mirnas <- read.csv("http://www.lcg.unam.mx/~lcol
+ header = T, row.names = 1)
Acuerdense de explorar el objeto mirnas.
13 / 30
EL truco de los factor
Principios de
Estad´ıstica
Ahora, quiero que me encuentren para Total, AGO1, 2, 4 y
Datos
5 que porcentaje de las secuencias que encuentran
Gr´ficas de
a
empiezan con U, A, C y G.
Pie
No es taaaaaaaaaaan complicado wuahahaha :P. Primero
a
Gr´ficas de
barras n
les voy a ense˜ar un truco con datos de clase factor.
a
Gr´ficas de
mosaicos
> head(unclass(mirnas[, 1]))
[1] 4 3 4 3 4 3
Corran el anterior sin el head. Ahora vean que pasa si lo
acoplo a un which. Igual, vuelvan a hacerlo sin head.
> head(which(unclass(mirnas[, 1]) ==
+ 1))
[1] 49 80 82 120 122 123
14 / 30
Obtiendo nuestra matriz resultado
Principios de
Estad´ıstica
Datos
Gr´ficas de
a ıan
Ahora deber´ entender esto:
Pie
> res <- NULL
a
Gr´ficas de > for (j in 2:6) {
barras
+ temp <- NULL
a
Gr´ficas de + for (i in 1:4) {
mosaicos
+ temp <- c(temp, sum(mirnas[which(unclass(mirnas[,
+ 1]) == i), j]))
+ }
+ res <- cbind(res, temp/sum(temp))
+ }
15 / 30
Agregandole nombres
Principios de
Estad´ıstica
Datos
a
Gr´ficas de
Pie
Gr´ficas de
a
Bueno, ahora simplemente le agrego nombres a nuestra
barras matriz res usando listas.
a
Gr´ficas de
mosaicos > dimnames(res)[[1]] <- c("A", "C",
+ "G", "U")
> dimnames(res)[[2]] <- colnames(mirnas)[2:6]
16 / 30
Barplot
Principios de
Estad´ıstica
Datos
a
Gr´ficas de
Pie Bien, ahora simplemente usaremos barplot para hacer
Gr´ficas de
a a
nuestra gr´fica de barras.
barras
> barplot(res, ylim = c(0, 1), col = rainbow(4),
a
Gr´ficas de
mosaicos + main = "miRNAs")
> legend("bottom", dimnames(res)[[1]],
+ pch = 20, col = rainbow(4),
+ inset = -0.2, ncol = 4, xpd = T)
17 / 30
Barras para miRNAs
Principios de
Estad´ıstica
miRNAs
1.0
Datos
a
Gr´ficas de
Pie 0.8
a
Gr´ficas de
barras
a
Gr´ficas de
0.6
mosaicos
0.4
0.2
0.0
Total AGO1 AGO2 AGO4 AGO5
q
A q
C q
G q
U
18 / 30
w00t
Principios de
Estad´ıstica
Datos e a
¿Qu´ tal eh? Se parece bastante a la gr´fica 3.c parte de
Gr´ficas de
a miRNAs, aunque los datos difieren un poco por lo cual no
Pie
e
son id´nticas.
a
Gr´ficas de
barras a
No es la mejor gr´fica... pero es mejor que la siguiente.
a
Gr´ficas de
mosaicos > barplot(res, beside = T, ylim = c(0,
+ 1), col = rainbow(4), main = "miRNAs")
> legend("topright", dimnames(res)[[1]],
+ pch = 20, col = rainbow(4))
u a
¿C´al es la diferencia primordial entre las dos gr´ficas a
o
nivel de c´digo?
19 / 30
Barras 2 para miRNAs
Principios de
Estad´ıstica
miRNAs
1.0
Datos
q
A
Gr´ficas de
a q
C
Pie 0.8 q
G
q
U
a
Gr´ficas de
barras
a
Gr´ficas de
0.6
mosaicos
0.4
0.2
0.0
Total AGO1 AGO2 AGO4 AGO5
20 / 30
Level up!
Principios de
Estad´ıstica
Datos
Gr´ficas de
a ıa
En nuestro taller de RNAs, Mar´ y yo estuvimos de
Pie
Gr´ficas de
a
a
acuerdo en que ese no es el mejor tipo de gr´fica.
barras
ıo
Es tiempo de que puedan usar el poder´ de R tal como se
a
Gr´ficas de
mosaicos los mostramos en la primera clase :)
> `?`(mosaicplot)
n e
¿Complicado, verdad? Bueno, les ense˜ar´ un ejemplo que
pueden repetir felizmente.
21 / 30
Empezando..
Principios de
Estad´ıstica
Datos
Usemos nuestra matriz res que creamos antes para la
a
Gr´ficas de
Pie a
gr´fica de barra. Para que funcione como queremos,
Gr´ficas de
a tenemos que usar la transversa de nuestra matriz, por eso
barras
Gr´ficas de
a
el t().
mosaicos
> mosaicplot(t(res), main = "Mosaic plot de miRNAs
+ col = rainbow(4))
> legend("bottom", dimnames(res)[[1]],
+ pch = 20, col = rainbow(4),
+ inset = -0.2, ncol = 4, xpd = T)
22 / 30
Mosaico de miRNAs
Principios de
Estad´ıstica
Mosaic plot de miRNAs
Datos Total AGO1 AGO2 AGO4 AGO5
G C A
a
Gr´ficas de
Pie
a
Gr´ficas de
barras
a
Gr´ficas de
mosaicos
U
q
A q
C q
G q
U
23 / 30
Creando res2
Principios de
Estad´ıstica
Datos
Gr´ficas de
a
a
En realidad, es nuestra misma gr´fica de barras pero con
Pie espacios extras. Lo que pasa es que nuestros datos en res
Gr´ficas de
a
barras
a ı
est´n ya en porcentajes (valores de 0 a 1) as´ que no nos
Gr´ficas de
a
sirven.
mosaicos
> colSums(res)
Total AGO1 AGO2 AGO4 AGO5
1 1 1 1 1
o
Repitamos la creaci´n de la matriz res pero manteniendo
valores absolutos.
24 / 30
Creando res2
Principios de
Estad´ıstica
> res2 <- NULL
Datos > for (j in 3:6) {
a
Gr´ficas de
+ temp <- NULL
Pie + for (i in 1:4) {
+ temp <- c(temp, sum(mirnas[which(unclass(mirnas[,
a
Gr´ficas de
barras + 1]) == i), j]))
+ }
a
Gr´ficas de
mosaicos + res2 <- cbind(res2, temp)
+ }
> dimnames(res2)[[1]] <- c("A", "C",
+ "G", "U")
> dimnames(res2)[[2]] <- colnames(mirnas)[3:6]
> colSums(res2)
AGO1 AGO2 AGO4 AGO5
1299561 128686 20186 30660
25 / 30
Y Waldo?
Principios de
Estad´ıstica
Datos
a
Gr´ficas de
Pie
a
Gr´ficas de
barras ¿Alguien nota lo que cambie?
Gr´ficas de
a > ncol(res) == ncol(res2)
mosaicos
[1] FALSE
26 / 30
Nuestro nuevo mosaicplot
Principios de
Estad´ıstica
Datos
Indeed, ya no me interesan los datos de ”Total”.
a
Gr´ficas de
Pie a
Ahora si repitamos nuestra gr´fica de mosaico. Solo le voy
Gr´ficas de
a
barras
a cambiar un poco como se imprime el texto usando el
Gr´ficas de
a
argumento las.
mosaicos
> mosaicplot(t(res2), main = "Mosaic plot de miRNA
+ col = rainbow(4), las = 2)
> legend("bottom", dimnames(res)[[1]],
+ pch = 20, col = rainbow(4),
+ inset = -0.2, ncol = 4, xpd = T)
27 / 30
Mosaico 2 de miRNAs
Principios de
Estad´ıstica
Mosaic plot de miRNAs
Datos
AGO1
AGO2
AGO4
AGO5
a
Gr´ficas de A
C
Pie G
a
Gr´ficas de
barras
a
Gr´ficas de
mosaicos
U
q
A q
C q
G q
U
28 / 30
Concluyendo
Principios de
Estad´ıstica
Datos
a
Gr´ficas de
Pie
Gr´ficas de
a
barras
a a
Esa gr´fica dice mucho m´s que la que usaron en el
Gr´ficas de
a
ıculo. Como ven, la mayor´ de los miRNAs est´n
art´ ıa a
mosaicos
ıa
asociados con AGO1, y de estos, la mayor´ tienen una U
en el extremo 5’.
29 / 30
Tarea :P
Principios de
Estad´ıstica
Ahora la parte fuera de clase....
Datos
o
Averiguen como usar la funci´n pdf y sobre todo con el
a
Gr´ficas de
Pie argumento onefile.
Gr´ficas de
a
barras
n e
Tienen hasta la ma˜ana del mi´rcoles para subir a Cursos
Gr´ficas de
a
su script de R que genere solo un archivo PDF como
mosaicos a
output. Este archivo PDF debe contener 7 gr´ficas.
a
Las 5 gr´ficas de pie de la figura 2.b
Las 2 importantes que hicimos en clase para la figura 3.c
(la de barras y la de mosaico).
a a
Como ven, su tarea est´ pr´cticamente hecha por nosotros
:) Claro, faltan los comentarios y que le cambien el
o
nombre del archivo al hom´logo de lcollado.R ;)
30 / 30
Get documents about "