rnas

Shared by: SUSB
Categories
Tags
-
Stats
views:
1
posted:
8/9/2011
language:
Spanish
pages:
30
Document Sample
scope of work template
							Principios de
 Estad´ıstica



Datos                                       ıstica
                         Principios de Estad´
  a
Gr´ficas de
Pie

  a
Gr´ficas de
barras                                        ıa    e
                Leonardo Collado Torres y Mar´ Guti´rrez Arcelus
  a
Gr´ficas de
mosaicos
                                               o
                   Licenciatura en Ciencias Gen´micas, UNAM
                   www.lcg.unam.mx/~lcollado/index.php
                   www.lcg.unam.mx/~mgutierr/index.php



                                             e
                              Cuernavaca, M´xico
                             Febrero - Junio, 2009


                                                                   1 / 30
                    o    a
                Sesi´n pr´ctica con small RNAs

Principios de
 Estad´ıstica



Datos            1 Datos
  a
Gr´ficas de
Pie

  a
Gr´ficas de
barras
                     a
                 2 Gr´ficas de Pie
  a
Gr´ficas de
mosaicos




                     a
                 3 Gr´ficas de barras



                     a
                 4 Gr´ficas de mosaicos



                                                 2 / 30
                Intro

Principios de
 Estad´ıstica



Datos                                                             ıculo:
                    Lo que hoy vamos a ver viene del siguiente art´
  a
Gr´ficas de
Pie
                        Sorting of Small RNAs into Arabidopsis Argonaute
Gr´ficas de
  a
                        Complexes Is Directed by the 5’ Terminal Nucleotide
barras
                                ıculo encuentran que AGO reconoce
                    En dicho art´
  a
Gr´ficas de
mosaicos                     o
                    informaci´n de la secuencia en el extremo 5’, y vamos a
                    usar datos de ellos.
                        ı,            o                   a               ı
                    En s´ la informaci´n suplementaria est´ disponible aqu´ o
                                           ıculo desde NCBI.
                    pueden encontrar el art´
                                                        a
                    Por ahora, pueden ver el PDF en la p´gina de cursos.




                                                                              3 / 30
                Datos para R

Principios de
 Estad´ıstica



Datos

  a
Gr´ficas de
Pie
                                 e
                    Ya les arregl´ las tablas suplementarias 1 y 2 para poder
Gr´ficas de
  a
                    usarlas en R.
barras
                                                      a
                        La 1 ahora es rnas.csv que est´ disponible en datos.
  a
Gr´ficas de
mosaicos
                                                    a
                        La 2 ahora es mirnas.csv est´ en el mismo folder.
                        ı,
                    En s´ si alguien gusta, le recomiendo que compare los
                    archivos Excel originales con los .csv que les proporciono.
                    Sobre todo por las notas.




                                                                                  4 / 30
                A trabajar!

Principios de
 Estad´ıstica

                                                    o             o
                    Bueno, a trabajar. Por favor ap´yense en el c´digo
Datos
                                                                a      o
                    disponible sobre esta clase. Pronto entregar´n el c´digo,
  a
Gr´ficas de
Pie                                                    u
                    tal que lo podamos correr sin ning´n problema.
Gr´ficas de
  a                 Les recuerdo, usen:
barras

Gr´ficas de
  a
                        Emacs; en un buffer tengan su script y en el otro buffer
mosaicos                abran R.
                        R en Windows usando un editor de textos. Por ejemplo, el
                                                 a
                        que ya viene con R. Tendr´n que usar copy paste seguido.
                        El comando savehistory. Sin embargo, el output de este lo
                             a
                        tendr´n que depurar.
                                                 ıneas de c´digo nuevas que
                    Intenten comentar todas las l´         o
                                        a
                    usen. Pues luego ser´ parte de la tarea.


                                                                                5 / 30
                Creando rnas

Principios de
 Estad´ıstica



Datos

  a
Gr´ficas de
Pie                 Primero vamos a imitar la figura 2.b de la parte ”Total”.
Gr´ficas de
  a
barras
                    Pero para eso necesitamos datos. Lean el archivo
Gr´ficas de
  a
                    rnas.csv
mosaicos
                    ¿Alguien sabe que es un csv y como se lee?
                    Una vez que tengan el objeto rnas, chequenlo. Usen head
                    o tail por ejemplo.




                                                                               6 / 30
                Filtrando rnas

Principios de
 Estad´ıstica



Datos

Gr´ficas de
  a                                                         o
                    Bueno, este data.frame tiene informaci´n que por ahora
Pie
                                                             o
                    no nos interesa. Pues despliega informaci´n por miRNAs,
  a
Gr´ficas de
barras              tasiRNAs, etc.
Gr´ficas de
  a
mosaicos
                    Vamos a filtrar los datos y crear el objeto rnas2. Hay que
                                                  ıas
                    quedarnos con solo las categor´ generales y no las
                              ıas.
                    subcategor´
                    > rnas2 <- rnas[c(1, 5, 14, 17, 18,
                    +      21, 26, 27, 28, 29), ]




                                                                            7 / 30
                Las.... bueno, pie

Principios de
 Estad´ıstica
                                      a      a
                    Son tal vez las gr´ficas m´s sencillas de hacer y
Datos
                                         a
                    probablemente las m´s odiadas.
Gr´ficas de
  a                 > `?`(pie)
Pie

Gr´ficas de
  a
                                                       a
                    Solo chequen la ayuda de pie. Ver´n que dice: Pie charts
barras              are a very bad way of displaying information. The eye is
Gr´ficas de
  a
mosaicos
                    good at judging linear measures and bad at judging
                    relative areas. A bar chart or dot chart is a preferable way
                    of displaying this type of data.
                                             a                      o
                    Bueno, hagamos nuestra gr´fica de pie de la secci´n de
                    ”Total”.
                    > pie(rnas2[, 1], labels = rownames(rnas2),
                    +        col = rainbow(10), cex = 0.6,
                    +        main = "Total")

                                                                               8 / 30
                Pie de ”Total”

Principios de
 Estad´ıstica
                                                                  Total

Datos

  a
Gr´ficas de                                                                Annotated repeats.c
Pie

  a
Gr´ficas de
barras

  a
Gr´ficas de
mosaicos                                                                                        NatsiRNAs
                           Dispersed repeats
                                                                                                TasiRNAs
                                                                                                miRNAs
                                                                                                Mitochondrial
                                                                                                Chloroplast




                                      Non−coding RNAs
                                                                                 Others.d
                                           Protein−coding genes




                                                                                                                9 / 30
                Logramos imitar una :)

Principios de
 Estad´ıstica
                          a
                    La gr´fica es MUY parecida a la del art´            e
                                                            ıculo. En ´l, juntan
                    a los cloroplastos y mitocondrias en una categor´ıa.
Datos
                          a
                    Adem´s, usan otros colores.
  a
Gr´ficas de
Pie
                                                                             ı
                    En la nuestra tenemos problemas para leer los nombres, as´
  a
Gr´ficas de
barras                                       o
                    que mejor usamos la funci´n legend.
Gr´ficas de
  a                 > pie(rnas2[, 1], labels = NA, col = rainbow(10),
mosaicos
                    +      main = "Total")
                    > legend("bottom", rownames(rnas2),
                    +      col = rainbow(10), xpd = T,
                    +      inset = -0.15, pch = 20, cex = 0.7,
                    +      ncol = 3)
                                                                         o
                    Si se sienten perdidos con los argumentos de la funci´n
                                      a a
                    legend, entender´n r´pido si checan la ayuda de dicha
                         o
                    funci´n.
                                                                              10 / 30
                Logramos imitar una :)

Principios de
 Estad´ıstica



Datos

  a
Gr´ficas de
Pie

  a
Gr´ficas de
barras                                                     a
                    Ahora ya saben hacer el resto de las gr´ficas de la figura
Gr´ficas de
  a                           ıculo :)
                    2.b de art´
mosaicos




                                                                           11 / 30
                Pie 2 de ”Total”

Principios de
 Estad´ıstica
                                                               Total

Datos

  a
Gr´ficas de
Pie

  a
Gr´ficas de
barras

  a
Gr´ficas de
mosaicos




                              q   miRNAs                q   Dispersed repeats      q   Chloroplast
                              q   TasiRNAs              q   Non−coding RNAs        q   Mitochondrial
                              q   NatsiRNAs             q   Protein−coding genes
                              q   Annotated repeats.c   q   Others.d



                                                                                                       12 / 30
                Creando mirnas

Principios de
 Estad´ıstica



Datos

Gr´ficas de
  a                                          a
                   Ahora imitaremos a una gr´fica de barras que usan en la
Pie

Gr´ficas de
  a
                   figura 3.c Al igual que antes, necesitamos DATA!!!
barras
                   Lean el archivo mirnas.csv como lo hicimos antes con
  a
Gr´ficas de
mosaicos           rnas.csv.
                   > mirnas <- read.csv("http://www.lcg.unam.mx/~lcol
                   +      header = T, row.names = 1)
                   Acuerdense de explorar el objeto mirnas.




                                                                        13 / 30
                EL truco de los factor

Principios de
 Estad´ıstica
                    Ahora, quiero que me encuentren para Total, AGO1, 2, 4 y
Datos
                    5 que porcentaje de las secuencias que encuentran
Gr´ficas de
  a
                    empiezan con U, A, C y G.
Pie
                    No es taaaaaaaaaaan complicado wuahahaha :P. Primero
  a
Gr´ficas de
barras                            n
                    les voy a ense˜ar un truco con datos de clase factor.
  a
Gr´ficas de
mosaicos
                    > head(unclass(mirnas[, 1]))
                    [1] 4 3 4 3 4 3
                    Corran el anterior sin el head. Ahora vean que pasa si lo
                    acoplo a un which. Igual, vuelvan a hacerlo sin head.
                    > head(which(unclass(mirnas[, 1]) ==
                    +      1))
                    [1]   49   80   82 120 122 123

                                                                            14 / 30
                Obtiendo nuestra matriz resultado

Principios de
 Estad´ıstica



Datos

Gr´ficas de
  a                            ıan
                    Ahora deber´ entender esto:
Pie
                    > res <- NULL
  a
Gr´ficas de          > for (j in 2:6) {
barras
                    +     temp <- NULL
  a
Gr´ficas de          +     for (i in 1:4) {
mosaicos
                    +         temp <- c(temp, sum(mirnas[which(unclass(mirnas[,
                    +             1]) == i), j]))
                    +     }
                    +     res <- cbind(res, temp/sum(temp))
                    + }




                                                                                  15 / 30
                Agregandole nombres

Principios de
 Estad´ıstica



Datos

  a
Gr´ficas de
Pie

Gr´ficas de
  a
                    Bueno, ahora simplemente le agrego nombres a nuestra
barras              matriz res usando listas.
  a
Gr´ficas de
mosaicos            > dimnames(res)[[1]] <- c("A", "C",
                    +      "G", "U")
                    > dimnames(res)[[2]] <- colnames(mirnas)[2:6]




                                                                           16 / 30
                Barplot

Principios de
 Estad´ıstica



Datos

  a
Gr´ficas de
Pie                Bien, ahora simplemente usaremos barplot para hacer
Gr´ficas de
  a                          a
                   nuestra gr´fica de barras.
barras
                   > barplot(res, ylim = c(0, 1), col = rainbow(4),
  a
Gr´ficas de
mosaicos           +      main = "miRNAs")
                   > legend("bottom", dimnames(res)[[1]],
                   +      pch = 20, col = rainbow(4),
                   +      inset = -0.2, ncol = 4, xpd = T)




                                                                  17 / 30
                Barras para miRNAs

Principios de
 Estad´ıstica
                                                miRNAs



                       1.0
Datos

  a
Gr´ficas de
Pie                    0.8
  a
Gr´ficas de
barras

  a
Gr´ficas de
                       0.6




mosaicos
                       0.4
                       0.2
                       0.0




                             Total   AGO1           AGO2            AGO4   AGO5
                                      q
                                            A   q
                                                    C   q
                                                            G   q
                                                                     U

                                                                                  18 / 30
                w00t

Principios de
 Estad´ıstica



Datos                  e                                  a
                   ¿Qu´ tal eh? Se parece bastante a la gr´fica 3.c parte de
Gr´ficas de
  a                miRNAs, aunque los datos difieren un poco por lo cual no
Pie
                         e
                   son id´nticas.
  a
Gr´ficas de
barras                              a
                   No es la mejor gr´fica... pero es mejor que la siguiente.
  a
Gr´ficas de
mosaicos           > barplot(res, beside = T, ylim = c(0,
                   +      1), col = rainbow(4), main = "miRNAs")
                   > legend("topright", dimnames(res)[[1]],
                   +      pch = 20, col = rainbow(4))
                      u                                              a
                   ¿C´al es la diferencia primordial entre las dos gr´ficas a
                             o
                   nivel de c´digo?



                                                                               19 / 30
                Barras 2 para miRNAs

Principios de
 Estad´ıstica
                                            miRNAs



                       1.0
Datos
                                                              q
                                                                   A
Gr´ficas de
  a                                                           q
                                                                   C
Pie                    0.8                                    q
                                                                   G
                                                              q
                                                                   U
  a
Gr´ficas de
barras

  a
Gr´ficas de
                       0.6




mosaicos
                       0.4
                       0.2
                       0.0




                             Total   AGO1    AGO2    AGO4   AGO5


                                                                       20 / 30
                Level up!

Principios de
 Estad´ıstica



Datos

Gr´ficas de
  a                                                ıa
                    En nuestro taller de RNAs, Mar´ y yo estuvimos de
Pie

Gr´ficas de
  a
                                                                a
                    acuerdo en que ese no es el mejor tipo de gr´fica.
barras
                                                         ıo
                    Es tiempo de que puedan usar el poder´ de R tal como se
  a
Gr´ficas de
mosaicos            los mostramos en la primera clase :)
                    > `?`(mosaicplot)
                                                        n e
                    ¿Complicado, verdad? Bueno, les ense˜ar´ un ejemplo que
                    pueden repetir felizmente.




                                                                         21 / 30
                Empezando..

Principios de
 Estad´ıstica



Datos
                    Usemos nuestra matriz res que creamos antes para la
  a
Gr´ficas de
Pie                   a
                    gr´fica de barra. Para que funcione como queremos,
Gr´ficas de
  a                 tenemos que usar la transversa de nuestra matriz, por eso
barras

Gr´ficas de
  a
                    el t().
mosaicos
                    > mosaicplot(t(res), main = "Mosaic plot de miRNAs
                    +       col = rainbow(4))
                    > legend("bottom", dimnames(res)[[1]],
                    +       pch = 20, col = rainbow(4),
                    +       inset = -0.2, ncol = 4, xpd = T)




                                                                       22 / 30
                Mosaico de miRNAs

Principios de
 Estad´ıstica
                                         Mosaic plot de miRNAs

Datos                            Total   AGO1           AGO2            AGO4   AGO5




                         G C A
  a
Gr´ficas de
Pie

  a
Gr´ficas de
barras

  a
Gr´ficas de
mosaicos
                         U




                                          q
                                                A   q
                                                        C   q
                                                                G   q
                                                                         U

                                                                                      23 / 30
                Creando res2

Principios de
 Estad´ıstica



Datos

Gr´ficas de
  a
                                                     a
                    En realidad, es nuestra misma gr´fica de barras pero con
Pie                 espacios extras. Lo que pasa es que nuestros datos en res
Gr´ficas de
  a
barras
                       a                                         ı
                    est´n ya en porcentajes (valores de 0 a 1) as´ que no nos
Gr´ficas de
  a
                    sirven.
mosaicos
                    > colSums(res)
                    Total AGO1 AGO2 AGO4 AGO5
                         1       1     1       1       1
                                       o
                    Repitamos la creaci´n de la matriz res pero manteniendo
                    valores absolutos.




                                                                           24 / 30
                Creando res2

Principios de
 Estad´ıstica

                    >   res2 <- NULL
Datos               >   for (j in 3:6) {
  a
Gr´ficas de
                    +       temp <- NULL
Pie                 +       for (i in 1:4) {
                    +           temp <- c(temp, sum(mirnas[which(unclass(mirnas[,
  a
Gr´ficas de
barras              +               1]) == i), j]))
                    +       }
  a
Gr´ficas de
mosaicos            +       res2 <- cbind(res2, temp)
                    +   }
                    >   dimnames(res2)[[1]] <- c("A", "C",
                    +       "G", "U")
                    >   dimnames(res2)[[2]] <- colnames(mirnas)[3:6]
                    >   colSums(res2)
                       AGO1      AGO2    AGO4    AGO5
                    1299561    128686   20186   30660




                                                                                    25 / 30
                Y Waldo?

Principios de
 Estad´ıstica



Datos

  a
Gr´ficas de
Pie

  a
Gr´ficas de
barras             ¿Alguien nota lo que cambie?
Gr´ficas de
  a                > ncol(res) == ncol(res2)
mosaicos

                   [1] FALSE




                                                  26 / 30
                Nuestro nuevo mosaicplot

Principios de
 Estad´ıstica



Datos
                    Indeed, ya no me interesan los datos de ”Total”.
  a
Gr´ficas de
Pie                                              a
                    Ahora si repitamos nuestra gr´fica de mosaico. Solo le voy
Gr´ficas de
  a
barras
                    a cambiar un poco como se imprime el texto usando el
Gr´ficas de
  a
                    argumento las.
mosaicos
                    > mosaicplot(t(res2), main = "Mosaic plot de miRNA
                    +      col = rainbow(4), las = 2)
                    > legend("bottom", dimnames(res)[[1]],
                    +      pch = 20, col = rainbow(4),
                    +      inset = -0.2, ncol = 4, xpd = T)




                                                                       27 / 30
                Mosaico 2 de miRNAs

Principios de
 Estad´ıstica
                                Mosaic plot de miRNAs

Datos




                                          AGO1




                                                                     AGO2

                                                                            AGO4
                                                                            AGO5
  a
Gr´ficas de                A
                          C
Pie                       G

  a
Gr´ficas de
barras

  a
Gr´ficas de
mosaicos


                          U




                                 q
                                      A   q
                                                 C   q
                                                         G   q
                                                                 U

                                                                                   28 / 30
                Concluyendo

Principios de
 Estad´ıstica



Datos

  a
Gr´ficas de
Pie

Gr´ficas de
  a
barras
                           a                 a
                    Esa gr´fica dice mucho m´s que la que usaron en el
Gr´ficas de
  a
                       ıculo. Como ven, la mayor´ de los miRNAs est´n
                    art´                        ıa                  a
mosaicos
                                                            ıa
                    asociados con AGO1, y de estos, la mayor´ tienen una U
                    en el extremo 5’.




                                                                         29 / 30
                Tarea :P

Principios de
 Estad´ıstica

                    Ahora la parte fuera de clase....
Datos
                                                 o
                    Averiguen como usar la funci´n pdf y sobre todo con el
  a
Gr´ficas de
Pie                 argumento onefile.
Gr´ficas de
  a
barras
                                       n           e
                    Tienen hasta la ma˜ana del mi´rcoles para subir a Cursos
Gr´ficas de
  a
                    su script de R que genere solo un archivo PDF como
mosaicos                                                        a
                    output. Este archivo PDF debe contener 7 gr´ficas.
                                 a
                         Las 5 gr´ficas de pie de la figura 2.b
                         Las 2 importantes que hicimos en clase para la figura 3.c
                         (la de barras y la de mosaico).
                                            a a
                    Como ven, su tarea est´ pr´cticamente hecha por nosotros
                    :) Claro, faltan los comentarios y que le cambien el
                                               o
                    nombre del archivo al hom´logo de lcollado.R ;)


                                                                                30 / 30

						
Related docs
Other docs by SUSB
JORGE_IS
Views: 224  |  Downloads: 0
Quevedo_ Francisco de - Juguetes de la niñez
Views: 26  |  Downloads: 0
Escandalo_Capitulo8
Views: 2  |  Downloads: 0
JOHNSON_
Views: 23  |  Downloads: 0
estudio_escarlata - DOC
Views: 10  |  Downloads: 0
The Mediterranean Vegan
Views: 55  |  Downloads: 0
Flanders-el_diablo_de_cera
Views: 2  |  Downloads: 0
Collins_ Wilkie - El hotel encantado
Views: 9  |  Downloads: 0