Docstoc

bai giang

Document Sample
bai giang Powered By Docstoc
					CHƢƠNG I
Định nghĩa
   Là hệ thống các phƣơng pháp:
    Thu thập
    Trình bày, tóm tắc dữ liệu
   Phân tích; dự đoán

 Nhà quản lý đƣa ra quyết định
CHứC NĂNG CủA THốNG KÊ
 Mô tả đối tƣợng nghiên cứu
 Hiểu biết về tổng thể dựa trên kết quả
  khảo sát
KHÁI NIỆM CƠ BẢN
 Tổng thể
 Mẫu
 Biến
 Dữ liệu
 Các loại thang đo:
 Thang đo định danh
 Thang đo thứ bật
 Thang đo khoảng
 Thang đo tỷ lệ
CHƢƠNG II
Phân loại
Dữ liệu so cấp: là do chính bản thân mình tự
 điều tra. VD
Dữ kiệu thứ cấp: là dữ liệu đƣợc tổng hợp từ
 các nguồn dữ liệu sơ cấp, VD:
Thu thập dữ liệu
 Phỏng vấn trực tiếp:
 Phỏng vấn cá nhân
 Phỏng vấn nhóm
 Phỏng vấn bằng điện thoại
 Phƣơng pháp gửi thƣ:
TRÌNH BÀY DỬ LIỆU
 Bảng phân phối tầng suất
 Biểu đồ phân phối tầng suất
BẢNG PHÂN PHỐI TẦNG SUẤT
-   Bảng gồm 2 cột:
    + Biến nghiên cứu (x)
    + Tầng số (f)

          Trị số biến (Xi)   Tần số (fi)
                 X1              f1
                 X2              f2
              …………..           ………..
                XK              fk
                                k

                               f
                               i 1
                                      i   n
BẢNG PHÂN PHỐI TẦNG SUẤT
     Trị số biến (Xi)           Tần số (fi)

          X1-X2                      f1

         X 2 – X3                    f2



        …………..                      ………..

        XK-1 - XK                    fk

Xác định số nhóm: k=(2n)1/3
                    X max  X min
Khoảng cách nhóm: 
                 h
                            k
Ví dụ:
   Năng suất của một loại cây trồng quan sát
    đƣợc trên 40 điểm thu hoạch nhƣ sau:

153 154 156 157 158 159 159 160 160 160

161 161 161 162 162 162 163 163 163 164

164 164 165 165 166 166 167 167 168 168

170 171 172 173 174 175 176 177 178 179
Giải
   Số nhóm
       k=(2n)1/3
        k=(2*40)1/3=4,3


 Khoảng      cách nhóm:

       X max  X min 179  153
    h                         5,2
             k           5
Giải
Bảng phân phối năng suất

   Năng suất (tạ/ha)       Số quan sát

       153 – 159               7

        159-165                17

        165-171                8

        171-177                6

        177-183                2

                               40
    BiỂU ĐỒ PHÂN PHỐI TẦN SỐ
   Biểu đồ cột
Biểu đồ tần số tích lũy
Biểu đồ tần số tƣơng đối
V dụ
 850    9000   15600       0    8700   22810       0    4330

2400    9000   15600   15700   21100   22810   12230   27770

4920   12156    5740   15700   21100   22810   12230    7080

3212   11800   62360   28033   21100   27200   12620    7080

 465   11800   62360   28033   21100   27200   18985   14500

5170   11800   62360   28033   22810       0    4330   14500

7200    2045   62360   28033   22810       0    4330   37185
Phƣơng pháp nhánh và lá
   VAR00001 Stem-and-Leaf Plot

   Frequency   Stem & Leaf

     23.00      0 . 00000000000111222334444
     16.00      0 . 5555557777788899
     15.00      1 . 000011111222244
     19.00      1 . 5555678888899999999
     36.00      2 . 000111111111122222222223344444444444
     18.00      2 . 555557778888888999
      5.00     3 . 33444
      9.00     3 . 556677888
      3.00     4 . 133
      4.00     4 . 8899
      3.00     5 . 333
     12.00 Extremes (>=62270)

   Stem width: 10000.00
   Each leaf:   1 case(s)
Biểu đồ hộp (BOX PLOT)
CHƢƠNG III
CÁC ĐẶC TRƢNG ĐO LƢỜNG KHUYNH HƢỚNG TẬP
TRUNG

 Trung bình số học
 Trung vị
 Số mod
 Trung bình hình học
Trung bình số học
 Khái niệm:
 Tính chất:
 Bị ảnh hƣởng nhiều đến giá trị đột biến
 Dùng để so sánh giửa hai tổng thể
 Tổng độ lệch với giá trị trung bình số học
  bằng 0
Trung bình số học
   Trung tổng thể:
          N              Trong đó:
           Xi            Xi: giá trị quan sát thứ i
       i 1
              N           N: Tổng số quan sát

VD: Năng suất lao động (Sp/ngƣời)của các CN
  trong công ty nhƣ sau:15,25,17,19,14,16,18
    Ycầu: Tính năng suất LĐ trung bình của CN?
    Giải: Năng suất lao động trung bình
          N
           Xi      15  25  17  19  14  16  18
          i 1
                                                   17,7
              N                    7
Trung bình số học
   Trung bình mẫu:
             n

           X      i
                        Trong đó:
                         Xi: giá trị biến thứ i
      X   i 1
               n         n: Tổng số quan sát

   VD: Số ngày nghỉ trong năm của một mẫu 13
    ngƣời, đƣợc chọn từ số nhân viên của một công
    ty nhƣ sau:
     10   12       15   6    14    2     4    6
     11   15       18   10    8

Kq:10 ngày
Trung bình số học
   Trung bình có trọng số:
            k

           X
           i 1
                       i       fi   Trong đó:
     X        k                     Xi: giá trị biến thứ i
            f  i 1
                           i         fi: tầng số của biến thứ i


VD: Số sản phẩm đạt tiêu chuẩn kỹ thuật
 trong 60 ngày ở một phân xƣởng đƣợc ghi
 nhận nhƣ sau:
Trung bình số học
    Sản phẩm đạt tiêu           Số ngày
     chuẩn kỹ thuật

           450                     20

           500                     28

           600                     12

Tính trung bình các số sản phẩm đạt tiêu chuẩn
  kỹ thuật trong ngày
Giải
   Trung bình các số sản phẩm đạt tiêu chuẩn kỹ
    thuật trong ngày

             k
             X i fi     (450 * 20  500 * 28  600 *12)
            i 1
       X      k
                                                         503
                                       60
              fi
             i 1
Trung bình số học
   Trƣờng hợp nhóm có khoảng cách nhóm:

            k
                        Trong đó:
            mi f i      mi: chỉ số giửa của tổ thứ
      X   i 1
               k
                         fi: tầng số của biến thứ i
            f
             i 1
                    i




   VD: Trong một đợt sản xuất ngƣời ta chọn
    ngẫu nhiên 50 sp và ghi nhận trọng lƣợng
    nhƣ sau:
Trung bình số học
 Trọng lƣợng (gam)             Số sản phẩm
       484 – 490                     5
       490 – 496                    10
       496 – 502                    15
       502 – 508                    13
       508 – 514                     7
         Cộng                       50

    Tính trọng lƣợng trung bình của sản phẩm
Giải
 Trọng lƣợng   Chỉ số giữa   Số sản phẩm
    (gam)
  484 – 490                      5
                  487
 490 – 496        493            10

 496 – 502        499            15

 502 – 508        505            13

 508 – 514        511            7

    Cộng                         50
Giải
   Giá trị trung bình của sản phẩm

      k
      mi fi     487 * 5  493 *10  499 *15  505 *13  511* 7
     i 1
X      k
                                                                499,84
                                       50
       fi
      i 1
Số Trung Vị
 Khái niệm:
 Kí hiệu: Me
 Đặc điểm:
 Là mỗi dãy số chỉ có một số trung vị
 Không bị ảnh hƣởng bởi giá trị đột biến
  của dãy số
 Có thể tính từ các thang đo: tỷ lệ, khoảng,
  thứ bậc
Xác Định Số Trung Vị
 Số liệu mẫu:
 n lẻ
Số trung vị Me=X(n+1)/2
 n chẵn
                          X n / 2  X ( n / 2 ) 1
                   Me 
                                     2
   VD: VD: Số ngày nghỉ trong năm của một
    mẫu 16 ngƣời, đƣợc chọn từ số nhân viên của
    một công ty, ghi nhận nhƣ sau:

10      12    15     6     14         2         4    6
11      15    18    10      8         7        10    12
Dữ liệu nhóm có khoảng cách
   Xác định chỉ số trung vị về khối lƣợng
     Trọng lƣợng (gam)            Số sản phẩm
         484 – 490                      5
         490 – 496                      10
         496 – 502                      15
         502 – 508                      13
         508 – 514                      7
            Cộng                        50
   KQ: 500gam
Dữ liệu nhóm có khoảng cách
 Bƣớc 1: Tính tần số tích lũy
 Bƣớc 2: Xác định nhóm chứa Me
 Bƣớc 3: Tính Me

                                 n
                                    S Me1
        M e  X Me(m in)  hMe   2
                                    f Me
Giải
   Xác định chỉ số trung vị về khối lƣợng
                                                 Tổ
    Trọng lƣợng   Số sản phẩm     Tầng số tích   chứa
       (gam)                          lũy        số
                                                 trung
     484 – 490          5              5         vị
    490 – 496          10              15
    496 – 502          15              30
    502 – 508          13              43
    508 – 514           7              50
   n/2=25
   Số trung vị:
                                n
                                   S Me1
       M e  X Me(m in)  hMe   2
                                   f Me

   Thế số vào ta đƣợc

                     25  15
       M e  496  6          500
                       15
Số Mod
 Khái niệm
 Ký hiệu: M0
 Đặc điểm:
 Không bị ảnh hƣờng bởi giá trị đột biến
 Sử dụng thang đo khác: định danh, thứ
  bật
 Một dãy có thể có nhiều giá trị mod, có
  dãy số không có mod
Cách tính mod
 Trƣờng hợp không có khoảng cách tổ
VD
Trƣờng hợp có khoảng cách tổ:
  Xác định mật độ phân phối tần số
 Tổ nào có mật độ phân phối lớn nhất thì tổ
  đó chứa mod

                                        f M 0  f M 0 1
M 0  X M 0 (min)  hM 0
                           ( f M 0  f M 0 1 )  ( f M 0  f M 0 1 )
Số mod
   Xác định chỉ số mod về khối lƣợng
     Trọng lƣợng    Mật độ phân         Số sản phẩm
        (gam)           phối
      484 – 490         5/6                 5
      490 – 496         10/6                10
      496 – 502         15/6                15
      502 – 508         13/6                13
      508 – 514          7/6                7
         Cộng                               50

    MĐPP lớn
    nhất                          Tổ chứa mod
Số mod
   Chỉ số mod về khối lƣợng:
   Ta có:
                                             f M 0  f M 0 1
    M 0  X M 0 (m in)  hM 0
                                ( f M 0  f M 0 1 )  ( f M 0  f M 0 1 )

   Thế số vào ta đƣợc

                           15  10
      M 0  496  6                        500,3
                    (15  10)  (15  13)
Trung Bình hình học
      GM  n X1 X 2 X 3 ...X n
  VD:Mức độ tăng trƣởng của một công ty từ năm
    1998-2004 nhƣ sau:

Năm      98    99    00    01    02    03    04
Tốc độ     10% 15% 23% 13% 15% 17% 14%
phát triển
hàng năm
  Tính tốc độ phát triển trung bình qua các năm
Khảo sát độ phân tán
   Kn: xem xét đến mức độ khác biệt, dao
    động của các quan sát so với giá trung bình
   VD: có 2 dãy số nhƣ sau:

     10     9     12 13     10     11    15


     14    12     11   8      7    12    16

Ta thấy giá trị trung bình của 2 dãy số là
  giống nhau: 11,4. Tuy nhiên độ phân tán
  của 2 dãy số là khác nhau
Khoảng biến thiên
 R= Xmax-Xnim
 Ƣu điểm: tính tóan dễ dàng
 Nhƣợc điểm:
Không phản ảnh đẩy đủ độ phân tán
Tứ phân vị
 Khái niệm: là 4 trị số chia dãy số thành 4
  phần băng nhau
 Cách xác định tứ phân vị
- Gọi Q1,Q2,Q3 là tứ phân vị đầu, tứ phân` vị
  thứ 2, tứ phân vị thứ 3
 Q1 là giá trị ở vị trí thứ (n+1)/4
 Q2 là số trung vị
 Q3 là giá trị thứ 3x(n+1)/4
 Ví dụ:
     Công ty A có giá trị tăng trƣởng nhƣ sau:
8,5   9   12    13 13,5   15   17   18   19   20   22   25   26   27   28




       Tứ                                     Tứ
       phƣơng             Tứ
                                              phƣơng
       vị thứ             phƣơng
                                              vị thứ
       nhất               vị thứ
                                              ba
                          hai
Độ trải giửa
   Khái niệm: là sự khác biệt giữa số tứ phân
    vị số 1 và thứ 3 thể hiện của 50% dử liệu
    của dãy số
                   R1=Q3 – Q1
Độ lệch tuyệt đối trung bình
   Khái niệm: là trung
    bình của tất cả độ lệch
    tuyệt đối giữa biến và
    số trung bình số học
   Ký hiệu: MAD
   Công thức tính
                     n

                   X      i   X
           MAD     i 1
                           n
 Ví dụ:
8,5   9   12   13 13,5 15   17   18   19   20   22   25   26   27   28




     Giá trị trung bình của dãy số: 18,2%
      MAD  5,28%
 Phƣơng sai
     Khái niệm:
      Trung bình của các độ lệch bình phƣơng giữa các
      giá trị xi với trung bình số học
     Công thức tính:           N
                                     
                                  ( X   )2i
                               2  i 1
     VD:                                   n

8,5   9     12   13 13,5 15   17   18      19   20   22   25   26   27   28
Độ lệch chuẩn
 Khái niệm: là căn bật hai của phƣơng sai
Thể hiện độ lệch trung bình của tất cả các
  quan sát so với giá trị trung bình
Công thức tính:

                         n
                         X i2
                        i 1
           x   2              2
                             N
Hệ số biến thiên
   Khái niệm: đo lƣờng độ phân tán của dãy
    số tính một cách tƣơng đối, đƣợc xác định
    bằng cách so sánh độ lệch tiêu chuẩn với
    trung bình số học
   Công thức tính:

                      
                  cv  x100 %
                      
HÌNH DẠNG PHÂN PHỐI CỦA DÃY SỐ
   Phƣơng pháp : so sánh trung bình và
    trung vị. Ta đƣợc
   Trung bình>trung vị: phân phối lệch phải
HÌNH DẠNG PHÂN PHỐI CỦA DÃY SỐ
   Trung bình=trung vị:phân phối đối xứng
HÌNH DẠNG PHÂN PHỐI CỦA DÃY SỐ
   Trung bình <trung vị: phân phối lệch trái
CHƢƠNG IV
CHƢƠNG IV
ƢỚC LƢỢNG
 Ƣớc lƣợng điểm
 Ƣớc lƣợng khoảng
ƢỚC LƢỢNG ĐIỂM
               mẫu    Tổng thể


 Trung bình:      x      µ


  Tỷ lệ :       ˆ
                p       p


  Phƣơng sai S2         2
ƢỚC LƢỢNG KHOẢNG
   KHOẢNG TIN CẬY CỦA TRUNG BÌNH
 Khoảng tin cậy của tỷ lệ
 Khoảng tin cậy của phƣơng sai
 Khoảng tin cậy cho sự khác biệt giữa
  trung bình hai tổng thể
 Khoảng tin cậy cho sự khác biệt giữa hai tỉ
  lệ tổng thể
 Xác định kích thƣớc mẫu
KHOẢNG TIN CẬY CỦA TRUNG BÌNH
   Biết phƣơng sai tổng thể
                                                                
    x  z / 2       Nghia là x  z / 2          x  z / 2
                 n                         n                      n

 Khi n không đổi  càng lớn thì độ tin cậy
  giảm
 Độ tin cậy và độ lệch chuẩn không đổi, n
  tăng độ tin cậy tăng
 Độ lệch chuẩn và n không đổi, khoảng
  cách ƣớc lƣợng tăng độ tin cậy giảm
VD:
   Một công ty có bảng thu thập kết quả
    trong 15 ngày nhƣ sau:trung bình 1 ngày
    có 267 trang fax, độ lệch chuẩn: 32 trang;
    giả sử số trang fax trong ngày là phân
    phối chuẩn. Y/c ƣớc lƣợng số trang fax
    trong ngày với độ tin cậy 95%
VD2
   Bƣu điện thành phố        Cƣớc trả   Số hộ
    nghiên cứu việc sử dụng   hàng tháng
    điện thoại cố định nhằm
                              <60        10
    tính tóan giá cƣớc hợp
    lý. Một mẫu ngẫu nhiên    60-80      15
    gồm 100 hộ gia đình kết
    quả nhƣ sau               80-100     22
-   Y/c: g/sử: cƣớc đt có     100-120    27
    phân phối chuẩn, ƣớc
    lƣợng mức cƣớc trung      120-140    12
    bình hàng tháng với độ
    tin cậy 95%               140-160    9
-   KQ: 96-109 ngàn           ≥160       5
KHOẢNG TIN CẬY CỦA TRUNG BÌNH
   Chƣa biết phƣơng sai tổng thể

                       s                            s                         s
    x  t n 1; / 2      Nghia là x  t n 1; / 2       x  t n 1; / 2
                        n                            n                         n


tn-1 có phân phối student với n-1 bậc tự do
VD:
   Công ty điện thoại nghiên cứu thời gian
    đƣờng dài. Chọn 20 ngƣời kết quả nhƣ
    sau: thời gian điện thoại trung bình là
    14,8 phút; độ lệch chuẩn 5,6. với độ tin
    cậy 95%; Ƣớc lƣợng thời gian cuộc gọi
    đƣờng dài
VD:
 Một hãng hàng không thực hiện nghiên
  cứu để ƣớc lƣợng thời gian trung bình làm
  thủ tục nhập cảnh cho một khách hàng;
  gồm 16 ngƣời kết quả nhƣ sau:
14;15;14;15;12;18;12;20;22;19;18;19;20;
  19;18;18
Hãy ƣớc lƣợng thời gian trung bình làm thủ
  tục nhập cảnh cho một khách hàng; với độ
  chính xác 95%,với tn-1,/2=2,131
KHOẢNG TIN CẬY CỦA TỶ LỆ
    Với khoảng tin cậy là (1-)x100% của tỷ lệ p; ta
     có khoảng tin cậy đƣợc xác định nhƣ sau:

                         p(1  p)
                         ˆ     ˆ                   p(1  p)
                                                   ˆ     ˆ
            p  z / 2
            ˆ                      p  p  z / 2
                                        ˆ
                            n                         n

                   p (1  p )
                   ˆ      ˆ
 Khi n tăng           n
                              giảm   khoảng cách ƣớc lƣợng
   giảm
VD:
   Một nghiên cứu đƣợc thực hiện nhằm ƣớc
    lƣợng thị phần của sp nội địa đối với mặt
    hàng bánh kẹo. Kết quả điều tra 100
    khách hàng cho thấy có 34 ngƣời dùng
    sản phẩm nội địa. Nhƣ vậy, độ tin cậy
    95%, ƣớc lƣợng thị phần bánh kẹo nội địa
VD:
  Bƣu điện thành phố nghiên   Cƣớc trả   Số hộ
   cứu việc sử dụng điện       hàng tháng
   thoại cố định nhằm tính
   tóan giá cƣớc hợp lý. Một   <60        10
   mẫu ngẫu nhiên gồm 100
   hộ gia đình kết quả nhƣ
                               60-80      15
   sau                         80-100     22
Y/c Ƣớc lƣợng tỷ lệ hộ gia
   đình có cƣớc điện thoại     100-120    27
   mỗi tháng lớn hơn 100
   ngàn, độ tin cậy 95%:       120-140    12
                               140-160    9
                               ≥160       5
Khoảng tin cậy của phƣơng sai
Công thức:

          (n  1) S 2           (n  1) S 2
                        2 
            n1, / 2
             2
                        2        n 1,1 / 2

2n-1   có phân phối 2 với n-1 bậc tự do
VD:
   Một nhà sản xuất quan tâm đến việc biến
    thiên của tỷ lệ tạp chất trong một loại
    hƣơng liệu đƣợc cung cấp. Chọn ngẫn
    nhiên 15 hƣơng liệu cho thấy độ lệch
    chuẩn về tỷ lệ tạp chất là 2,36%. Nhƣ
    vậy, ƣớc lƣợng độ lệch tạp chất với độ ƣớc
    lƣợng 95%
Giải
   Phƣơng sai
     x   2

Ƣớc lƣợng độ lệch chuẩn về tỷ lệ tạp chất
         (n  1) 2               (n  1) 2
                          2 
           n 1, / 2
            2
                                   2n1,1 / 2



2,98<δ2<13,72
VD:
  Bƣu điện thành phố nghiên   Cƣớc trả   Số hộ
   cứu việc sử dụng điện       hàng tháng
   thoại cố định nhằm tính
   tóan giá cƣớc hợp lý. Một   <60        10
   mẫu ngẫu nhiên gồm 100
   hộ gia đình kết quả nhƣ     60-80      15
   sau                         80-100     22
Y/c Ƣớc lƣợng độ lệch chuẩn
   của số hộ sử dụng điện      100-120    27
   thoại độ tin cậy 95%:
                               120-140    12
                               140-160    9
                               ≥160       5
   Phƣơng sai

               N
                ( X i   )2
         2  i 1               1015
                     N

   Ƣớc lƣợng phƣơng sai cƣớc sử dụng điện
    thoai             2
                           (n  1)  2
                                                        (n  1)
                                                  
                                                   2

                                   2
                                    n 1, / 2           2
                                                          n1,1 / 2
  Khoảng tin cậy cho sự khác biệt giữa trung
  bình hai tổng thể
          Mẫu phối hợp từng cập:
                   d                         d                                    d
d  t n 1, / 2        hayd  t n 1, / 2          x   y  d  t n 1, / 2
                    n                          n                                     n
       tn-1 có phân phối chuẩn Student với n-1 bậc tự
          do.
         d trung bình các độ lệch
       VD:
                            Hộ   Lƣợng điện
Vd:                              Trƣớc   sau
                            1    73      69
   Một công ty điện lực
    có kết quả nhƣ sau:     2    50      54
   y/c: ƣớc lƣợng khoảng   3    83      82
    cách trung bình của     4    78      67
    trƣớc và sau khi        5    56      60
    khuyến kích tiết kiệm
                            6    74      73
    điện. Độ tin cậy 95%
                            7    74      75
                            8    87      78
                            9    69      64
                            10   72      72
                            11   77      70
                            12   75      63
Giải: kiểm tra lại
   Sự khác biệt trung bình của 02 mẫu


           d
               (x  y ) f
                    i        i   i
                                      3,41
                        fi
   Độ lệch chuẩn của 02 mẫu
   Ƣớc lƣợng khác biệt trung bình của 02 mẫu

                    Sd                              Sd
     d  tn1, / 2      x   y  d  tn1, / 2
                     n                               n
     hay  0,068   x   y  6,902
Giải
   Độ lệch trung bình


      d  3,4167
   Độ lệch chuẩn:δ=5,4848
   tn-1,/2=2,201

               5,4848                             5,4848
3,41  2,201 x         1   2  3,41  2,201 x
                3,464                              3,464
Khoảng tin cậy cho sự khác biệt giữa trung
bình hai tổng thể
   Mẫu độc lập:

                                                                2
                                                                         y
                                                                          2

                                       ( X  Y )  z / 2        x
                                                                     
                                                             nx          ny
   Hay


                         x
                          2
                                  y
                                   2
                                                                               x2       y
                                                                                          2

    ( X  Y )  z / 2                  x   y  ( X  Y )  z / 2              
                         nx       ny                                          nx         ny
   VD: 02 doanh nghiệp cùng sx sP A. Ta có
    kết quả thống kê nhƣ sau:



    Quý DN_A                     DN_B
          Giá thành   CP sản     GThành   Tỷ trọng
          1 SP        xuất       1 SP
    I     20          1000       19       16
    II    21          1386       20       35
    III   19          1387       18       30
    IV    17          1394       19       19
Yêu cầu
a) so sánh đơn giá trung bình của 02 DN
b) Ƣớc lƣợng độ lệch trung bình về giá của
  sp A của 02 DN với độ tin cậy là 90%
Khoảng tin cậy cho sự khác
biệt giữa hai tỉ lệ tổng thể
   Công thức tính:

                                      px (1  px ) p y (1  p y )
                                      ˆ       ˆ     ˆ       ˆ
             ( px  p y )  z / 2
               ˆ    ˆ                             
                                          nx            ny


hay
                        px (1  px ) p y (1  p y )
                        ˆ       ˆ     ˆ       ˆ
( px  p y )  z / 2
  ˆ    ˆ                                            px  p y
                            nx            ny

                                     px (1  px ) p y (1  p y )
                                     ˆ       ˆ     ˆ       ˆ
        ( px  p y )  z / 2
           ˆ    ˆ                                
                                         nx            ny
Khoảng tin cậy cho sự khác
biệt giữa hai tỉ lệ tổng thể
   Vd:Kết quả điều tra mẫu ngẫu nhiên
    1.000 ngƣời ở 02 tp nhƣ sau: tỉ lệ thất
    nghiệp ở thành phố H là 7,5%; ở thành
    phố K là 7,2%. Hãy ƣớc lƣợng về sự khác
    biệt về tỉ lệ thất nghiệp giữa 02 thành phố
    với độ tin cậy là 90%
                              Hộ   Lƣợng điện
Vd:                                Trƣớc   sau
                              1    73      69
   Một công ty điện lực
    có kết quả nhƣ sau:       2    50      54
   y/c: ƣớc lƣợng sự         3    83      82
    khác biệt tỷ lệ đối với   4    78      67
    các hộ sử dụng điện       5    56      60
    lớn hơn 75 kw điện
                              6    74      73
    trƣớc và sau khi đƣợc
    khuyến khích tiết kiệm    7    74      75
    điện với độ tin cậy là    8    87      78
    96%                       9    69      64
                              10   72      72
                              11   77      70
                              12   75      63
Xác định kích thƣớc mẫu

   Xác định kích thƣớc mẫu trong trƣờng
    hợp ƣớc lƣợng khoảng tin cậy của trung
    bình tổng thể

   Xác định kích thƣớc mẫu trong trƣờng
    hợp ƣớc lƣợng khoảng tin cậy của tỉ lệ
    tổng thể
Xác định kích thƣớc mẫu trong trƣờng hợp ƣớc
lƣợng khoảng tin cậy của trung bình tổng thể
                                 
Từ công thức        x  z / 2
                                  n

                    
gọi      z / 2                sai số ƣớc lƣợng
                    n

Ta đƣợc        ( z / 2 )  2    2
          n
                       2
                          Hộ   Lƣợng điện
Vd:                            Trƣớc   sau
                          1    73      69
   Một công ty điện lực
    có kết quả nhƣ sau:   2    50      54
   y/c: xác định số lƣợng 3   83      82
    quan sát sao cho sai   4   78      67
    số không quá 2kw với 5     56      60
    độ tin cậy là 90%
                           6   74      73
                           7   74      75
                           8   87      78
                           9   69      64
                          10   72      72
                          11   77      70
                          12   75      63
Xác định kích thƣớc mẫu trong trƣờng hợp
ƣớc lƣợng khoảng tin cậy của tỉ lệ tổng thể
   Đặt                      p (1  p )
                             ˆ      ˆ
              z / 2
                                 n
Ta có:

           n
              z / 2   p(1  p
                         2
                          ˆ
                             2
VD:
  Bƣu điện thành phố nghiên   Cƣớc trả   Số hộ
   cứu việc sử dụng điện       hàng tháng
   thoại cố định nhằm tính
   tóan giá cƣớc hợp lý. Một   <60        10
   mẫu ngẫu nhiên gồm 100
   hộ gia đình kết quả nhƣ     60-80      15
   sau                         80-100     22
Y/c xác định số lƣợng quan
   sát sao cho sai số ƣớc      100-120    27
   lƣợng số ngƣời sử dụng
   trên 120 ngàn không quá     120-140    12
   10% và độ chính xác 95%
                               140-160    9
                               ≥160       5
CHƢƠNG V
CHƢƠNG V
CÁC KHÁI NIỆM
 Giả thuyết H0 và H1
 Các loại sai lầm
+ Sai lầm loại 1: Giả thiết H0 đúng nhƣng
  kiểm định cho thấy bác bỏ H0
+ Sai lầm loại 2: Giả thiết H0 sai nhƣng
  kiểm định cho thấy không thể bác bỏ H0
KIỂM ĐỊNH GIẢ THUYẾT
-   Trung bình của tổng thể
-   Tỉ lệ của tổng thể
-   Sự khác biệt hai trung bình của tổng thể
-   Sự khác biệt của hai tỉ lệ tổng thể
     KIỂM ĐỊNH GIẢ THIẾT VỀ
    TRUNG BÌNH CỦA TỔNG THỂ
 Trƣờng hợp n30
Giả thiết H0: µ=µ0
           H1: µ≠µ0
Giá trị kiểm định       X  0
                     z
                        / n
Qui tắc quyết định: Bác bỏ H0 ở mức ý nghĩa
 , nếu Z<-z/2 hay Z> z/2 , z/2 có phân
 phối chuẩn chuẩn hóa
 KIỂM ĐỊNH GIẢ THIẾT VỀ
TRUNG BÌNH CỦA TỔNG THỂ




     z/2

    Bác bỏ H0                    z/2
                không thể Bác bỏ H0     Bác bỏ H0
KIỂM ĐỊNH GIẢ THIẾT VỀ
TRUNG BÌNH CỦA TỔNG THỂ
 n<30
Giả thiết H0: µ=µ0
           H1: µ≠µ0

Giá trị kiểm định      X  0
                    z
                       / n
Qui tắc quyết định: Bác bỏ H0 ở mức ý nghĩa ,
  nếu t<-tn-1,/2 hay t> tn-1,/2
Với tn-1 có phân phối Student với n-1 bật tự do
KIỂM ĐỊNH GIẢ THIẾT VỀ
TRUNG BÌNH CỦA TỔNG THỂ




     Bác bỏ H0                        tn-1./2
                      không thể Bác bỏ H0        Bác bỏ H0
           tn-1,/2
Ví dụ:
Vd:                        Hộ   Lƣợng điện tiêu thụ
                           01           73
   Một công ty điện lực
    có kết quả nhƣ sau:    02           50
   y/c: có ý kiến cho     03           83
    rằng lƣợng điện tiêu   04           78
    thụ trung bình sau khi 05           56
    áp dụng các biện pháp
                           06           74
    tiết kiệm điện là
    75kw. Bạn có ý kiến    07           74
    nhận xét gì?           08           87
                           09           69
                           10           72
                           11           77
                           12           75
KIỂM ĐỊNH GIẢ THIẾT VỀ TỈ
LỆ CỦA TỔNG THỂ
Giả thiết H0: p=p0
           H1: p≠p0

   Giá trị           p  p0
                      ˆ
              z
                   p0 (1  p0 ) / n



   Qui tắc quyết định: Bác bỏ H0 ở mức ý
    nghĩa , nếu Z<-z/2 hay Z> z/2 , z/2 có
    phân phối chuẩn chuẩn hóa
KIỂM ĐỊNH GIẢ THIẾT VỀ SỰ KHÁC BIỆT
CỦA HAI TRUNG BÌNH TỔNG THỂ
 KIỂM ĐỊNH DỰA TRÊN SỰ PHỐI HỢP
  TỪNG CẶP
 KIỂM ĐỊNH DỰA TRÊN NGẪU NHIÊN ĐỘC
  LẬP
KIỂM ĐỊNH DỰA TRÊN SỰ PHỐI HỢP
TỪNG CẶP
   Giả sử H0: µx-µy=D0
            H1: µx-µy≠D0

Giá trị kiểm định:         d  D0
                      t
                           Sd / n

Qui tắc quyết định: Bác bỏ H0 ở mức ý nghĩa 
 nếu: t<-tn-1,/2 hay t> tn-1,/2 với tn-1 có phân
 phối Student với n-1 bậc tự do
Ví dụ:
Kiểm định dự trên mẫu ngẫu
nhiên độc lập
   Giả thuyết H0: µx -µy=D0
                H1: µx -µy≠D0

                         X  Y  D0
Giá trị kiểm định   z
                          2        y
                                     2

                                
                            x


                           nx       ny

Quy tắc quyết định: bác bỏ H0 ở mức ý nhĩa
  nếu z<-z/2 hay z>z/2
KIỂM ĐỊNH GIẢ THIẾT VỀ SỰ KHÁC
BIỆT CỦA HAI TỈ LỆ TỔNG THỂ
   GiẢ thuyết H0: px-py=0
                H1: px-py ≠ 0

Giá trị kiểm định   z
                               px  p y
                               ˆ    ˆ
                                         1  1
                         p0 (1  p0 )(
                         ˆ       ˆ          )
                                         nx n y
Quy tắc quyết định: bác bỏ H0 ở mức ý
 nghĩa , nếu: z<-z/2 hay z>z/2 với z có
 phân phối chuẩn chuẩn hóa
VD
Chƣơng V
Phân tích phƣơng sai 1 yếu tố
   Giả sử ta có k nhóm, n1, n2…nk quan sát ngẫu nghiên
    độc lập từ k tồng thể. Gọi µ1, µ2,… µk lá các trung bình
    của tồng thể, xij là quan sát thứ j của nhóm thứ j. Giả
    sử tổng thể phân phối chuần, phƣơng sai bằng nhau,
    sai số độc lập Đƣợc trình bày nhƣ sau:

                              nhóm
          1              2           …..             k
         x11            x21          …..            xk1
         x12            x22          …..            xk2
         …..           …..           …..            …..
         x1n           x2n           …..            xkn
Phân tích phƣơng sai 1 yếu tố

   Bƣớc 1: tính giá trị trung bình nhóm               và
    tổng thể
                                 ni

                                  xij
                                 j 1
   Trung bình nhóm       xi 
                                      ni
                                      k    ni

                                   x            ij
   Trung bình tổng thể               i 1 j 1
                           x 
                                           n
Phân tích phƣơng sai 1 yếu tố

 Bƣớc 2: tính các đại lƣợng thể hiện sự biến
  thiên nội bộ của từng nhóm (SSW)và giữa các
  nhóm (SSG)
Gọi SS là dại lƣợng đăc trƣng thệ hiện sựn biến
  thiên trong nội bộ của từng nhóm SSi   ( xij  xi ) 2
                                                        i



                                                       j 1



 Tổng biến thiên nội bộ trong từng knhóm
                                       ni     2

SSW=SS1+SS2+….+SSk hay SSW   ( xij  x i )
                                           i 1 j 1

SST là tổng bình các chênh lệch giữa các quan sát
  với trung bình của tổng thể ta có:
               k   ni
        SST   ( xij  x) 2 haySST  SSW  SSG
              i 1 j 1
Phân tích phƣơng sai 1 yếu tố
   Bƣớc 3: tính các ƣớc lƣợng cho phƣơng sai
    chung của K tổng thể

                                           SSW
   Ƣớc lƣợng phƣơng sai trong nhóm: MSW 
                                           nk
                                              SSG
   Ƣớc lƣợng phƣơng sai giửa các nhóm: MSG 
                                              nk
Phân tích phƣơng sai 1 yếu tố
   Bƣớc 4: tính giá trị kiểm định F:

                                              MSG
                                         F
                                              MSW




Quy tắc ra quyết định: Bác bỏ H0 ở mức ý nghĩa ,

     MSG
nếu MSW  Fk 1,n k , với Fk-1,n-k có phân phối F với
 k-1 và k-n bật tự do tƣơng ứng ở tử số và mẫu
    số.
Bảng phân tích anova một yếu tố
Biến        Tổng các    Bật tự   Trung bình các    Giá trị kiểm
thiên       chênh lệch  do       chênh lệnh bình   định F
            bình phƣơng          phƣơng (phƣơng
                                 sai)
Giữa các    SSG         k-1                           MSG
                                        SSG        F
nhóm                              MSG 
                                        k 1          MSW
Trong nội
bộ nhóm                                   SSW
            SSW         n-k      MSW 
                                          nk
Tổng
cộng        SST         n-1
Vdụ
Ngƣời ta thống kê điểm kết quả bắn súng của ba
 nhóm (mở 2 mắt,mở mắt phải, mở mắt trái),
 mỗi nhóm gồm 6 xạ thủ nhƣ sau(thang điểm
 40):
Mở cả hai mắt   Chỉ mở mắt trái Chỉ mở mắt
                                phải
      22              28               33
      27              37               29
      29              34               39
      20              29               33
      18              31               37
      30              33               38
Vdụ
   Gọi   giá trị trung bình của ba nhóm là: µ1, µ2, µ3
   Giả   thiết H0: µ1= µ2= µ3
   Giả   thiết H1: không phải tất cả µi đều bằng nhau
   Kết   quả chạy SPSS nhƣ sau:
Kiểm định TUKEY
 Ta giả thiết so sánh từng cặp trung bình tổng thể
  với nhau
H0: µ1= µ2, µ1 ≠ µ3……
Tiêu chuẩn so sánh turkey:

                      MSW
     T  q ,k ,nk
                       ni

Với q,k,n-k là giá trị tra bảng phân phối q ở mức ý nghĩa , với
   bật tự do k và n-k
Tính giá trị kiểm định

 D  x1  x2 hayD  x 2  x 4
Kiểm định TUKEY
 Quy tắc quyết định: Bác bỏ H0 ở mức ý nghĩa ,
  nếu D≥T
 VD trên:
Ta dễ dàng tính đƣợc:   x1  24,33; x2  32; x3  34,83


Do vậy: D1  x1  x 2  7,67; D2  x1  x3  10,5; D3  x 2  x3  2,83
                              MSW
             T  q ,k ,nk        6,1673
                               ni


=> D1>T, D2>T bác bỏ H0
KIỂM ĐỊNH DẤU
 Kiểm định thực hiện khi tổng thể không có
  phân phối chuẩn và phƣơng sai không
  bằng nhau
 Trong kiểm định ta không quan tân đến độ
  lớn của giá trị trong mẫu, mà ta chỉ quan
  tâm đến dấu (cộng hay trừ) của chênh
  lệch trong kiểm định
KIỂM ĐỊNH DẤU
 Giả thiết H0 a=b
            H1 a≠b
   (a,b lần lƣợc là số lƣợng dấu cộng và trừ)
Giá trị kiểm định:
                    p  p0
                    ˆ
              z
                   p0 (1  p0 )
                        n


Quy tắc bác bỏ: bác bỏ H0, ở mức ý nghĩa  nếu:
z<-z/2 hoặc z>z/2 với z/2 có phân phối chuẩn
  chuẩn hóa
KIỂM ĐỊNH WILCOXON
 Giả thiết H0 µ1= µ2
             H1 µ1 ≠ µ2
 Tính các chênh lệch: di=xi-yi
 Xếp hạng giá trị tuyệt đối của di theo thứ tự tăng
  dần
 Tính tổng hạng cho các giá trị âm và dƣơng
 Giá trị kiểm định:
 T=min[(+),[(+)]
Quy tắc bác bỏ: bác bỏ H0, ở mức ý nghĩa  nếu:
T<-Tn,/2 hoặc T>Tn,/2 với Tn,/2 là giá trị trong
  bảng phân phối của kiểm định Wilcoxon
KIỂM ĐỊNH MANN-WHITNER
   Giả thuyết H0: µ1= µ2
                H1: µ1 ≠ µ2
   Xếp hạng tất cả các gía trị của hai mẫu theo giá
    trị tăng dần
   Cộng các hạng của tất cả các giá trị ở mẫu thứ
    nhất là R1
   Giá trị kiểm định: U1  n1n2  n1 (n1  1)  R1
                                  2

   Khi mẫu lớn thì phân phối của U đƣợc xem
    chuẩn:     nn          n n (n  n  1)
           u  1 2 ;  U  1 2 1 2
                        2

                2                12
KIỂM ĐỊNH MANN-WHITNER
                                      U 1  U
 Giá trị kiểm định bây giờ là: z 
                                        U

Quy tắc bác bỏ: bác bỏ H0, ở mức ý nghĩa  nếu:
z<-z/2 hoặc z>z/2 với z/2 có phân phối chuẩn
  chuẩn hóa
KIỂM ĐỊNH KRUSKAL-WALLIS
Giả thuyết H0 tất cả trung bình của k tổng thể là
  giống nhau hay H0 µ1= µ2=µ3=…….= µk
            H1: µ1 ≠ µ2 ≠ µ3 ≠ ……. ≠ µk
Xếp hạng tất cả các giá trị quan sát của k mẫu theo
  thứ tự tăng dần
Cộng các hạng của tất cả các giá trị ở từng mẫu lại,
  kí hiệu R1,R2…….Rk
Giá trị kiểm định 2       12      k R2
                               n  3(n  1)
                                     i


                       n(n  1) i 1 i
Quy tắc quyết định: Bác bỏ H0 ở mức ý nghĩa 
  nếu:2> 2k-1 với 2k-1 có phân phối 2 với k-1 bậc
  tự do
KIỂM ĐỊNH CHI BÌNH PHƢƠNG
   Kiểm định giả thuyết về phân phối của tổng thể:
   Giả thuyết H0: tổng thể có phân phối theo 1 giả định
    nào đó
               H1: tổng thể không có phân phối nhƣ vậy
   Tính số lƣợng quan sát về nhóm thứ tự khi H0 đúng.
    Tính giá trị Ei=np           O  Ei
   Giá trị kiểm định:     2   i
                                    Ei




   Quy tắc quyết định: bác bỏ H0,ở mức ý nghiã 
    nếu:2> 2k-1 với 2k-1 có phân phối 2 với k-1 bậc tự
    do
KIỂM ĐỊNH CHI BÌNH PHƢƠNG
   Kiểm định về sự độc lập giữa hai biến định
    tính
   Giả thuyết H0: không có mối liên hệ giữa
    hai biến định tính
              H1: tồn tại mối liên hệ giữa hai
    biến định tính
   Tính số lƣợng quan sát mong muốn Eij
    trong trƣờng hợp H0 đúng
                        Ri Ri C j
              Eij  C j   
                        n    n
KIỂM ĐỊNH CHI BÌNH PHƢƠNG

   Giá trị kiểm định     m     k     (Oij  Eij )
                     
                     2

                          i 1 j 1       Eij

   Quy tắc quyết định: Bác bỏ H0 ở mức ý
    nghĩa  nếu:2> 2(m-1)(k-1), với 2(m-1)(k-1)
    có phân phối 2 với (m-1)(k-1) bậc tự do

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:1469
posted:4/6/2010
language:Vietnamese
pages:125
Description: NGAN HANG THUONG MAI