Docstoc

Proses Ekstraksi Teks Pada Citra Dengan Metoda Berbasis Tepi

Document Sample
Proses Ekstraksi Teks Pada Citra Dengan Metoda Berbasis Tepi Powered By Docstoc
					PROSES EKSTRAKSI TEKS DENGAN
MENGGUNAKAN METODE BERBASIS TEPI
PATHYA MADHYASTHA B.
140110070002
BAB I - PENDAHULUAN
•   Latar belakang
•   Identifikasi masalah
•   Pembatasan masalah
•   Maksud dan tujuan penelitian
•   Kegunaan penelitian
•   Metodologi penelitian
•   Sistematika penulisan
LATAR BELAKANG
• Kualitas dan kuantutas penelitian tentang
  cara mendapatkan informasi dari citra
  dijital meningkat

• Tantangan dalama mengekstraksi teks
  pada citra
IDENTIFIKASI MASALAH
Pada penelitian ini permasalahan yang akan
dibahas adalah:

• Bagaimana proses ekstraksi teks pada citra?
• Bagaimana tingkat keakuratan proses ekstraksi
  dan segmentasi teks pada citra setelah
  dianalisis?
PEMBATASAN MASALAH
Pembahasan masalah pada penelitian ini dibatasi oleh
beberapa hal, yaitu:

•   Metode yang digunakan adalah metode berbasis tepi.
•   Teks pada citra uji posisinya horizontal.
•   Teks pada citra uji tidak berwarna putih.
•   Pembuatan perangkat lunak menggunakan Microsoft
    Visual C# 2010 Express Edition.
MAKSUD DAN TUJUAN
PENELITIAN
• Maksud dari penelitian ini adalah untuk
  mengkaji penerapan metode berbasis tepi dalam
  mengekstraksi teks pada sebuah citra dijital.

• Tujuan pada penelitian ini adalah untuk
  mengetahui kemampuan metode berbasis tepi
  dalam mengekstraksi teks pada sebuah citra
  dijital sehingga diperoleh informasi yang berupa
  lokasi sebuah teks pada citra dijital tersebut.
KEGUNAAN PENELITIAN
Kegunaan penulisan skripsi untuk penulis dan pembaca
adalah:

• Sebagai eksplorasi pengetahuan mengenai proses
  ekstraksi teks pada citra dengan menggunakan metode
  berbasis tepi.

• Hasil dari proses ekstraksi teks pada citra, yang berupa
  informasi lokasi teks, dapat digunakan untuk deteksi plat
  nomor, identifikasi gambar sesuai dengan teks yang ada.
METODOLOGI PENELITIAN
Metodologi penelitian yang digunakan pada penelitian ini adalah:
• Mencari dan mengumpulkan literatur yang berhubungan
  dengan konsep dari topik yang menjadi bahan penelitian.
• Mengidentifikasi masalah yang ada pada topik penelitian.
• Mempelajari lebih dalam mengenai konsep dan metoda yang
  digunakan.
• Membuat rancangan penyelesaian masalah.
• Membuat perangkat lunak sebagai alat bantu untuk menguji
  implementasi penyelesaian masalah.
• Melakukan uji coba kinerja perangkat lunak tersebut.
• Melanjutkan hasil penelitian dalam bentuk skripsi.
SISTEMATIKA PENULISAN
Sistematika penulisan pada skripsi ini terdiri dari 5 bab, yaitu:

 •   BAB I PENDAHULUAN;
 •   BAB II TINJAUAN PUSTAKA;
 •   BAB III METODE PENDEKTESIAN TEKS PADA CITRA;
 •   BAB IV PEMBAHASAN DAN HASIL PENELITIAN;
 •   BAB V KESIMPULAN DAN SARAN;
BAB II – TINJAUAN PUSTAKA
•   Pengertian citra dijital
•   Jenis – jenis citra dijital
•   Histogram citra
•   Segmentasi
•   Filter morfologi
•   Pelabelan komponen
•   Deteksi tepi
PENGERTIAN CITRA DIJITAL
• Suatu citra dapat didefinisikan sebagai fungsi dua dimensi
  ����(����, ����), dimana x dan y adalah koordinat spasial dan
  amplitudo f di titik koordinat (����, ����) yang dinamakan intensitas
  atau tingkat keabuan dari citra pada titik tersebut. Ketika nilai
  ����, ���� dan nilai amplitude secara keseluruhan dari f berhingga
  (finite), bernilai diskrit maka dapat dinyatakan bahwa citra
  tersebut adalah citra dijital (Gonzales, Rafael C. Woods,
  Richard E., 2002).
JENIS-JENIS CITRA DIJITAL




Citra Biner adalah         Citra grayscale, yaitu    Citra Warna
citra dijital yang hanya   citra yang nilai pixel-   Setiap piksel pada citra
memiliki dua               nya merepresentasikan     warna (8 bit) hanya
kemungkinan nilai          derajat keabuan atau      diwakili oleh 8 bit
                           intensitas warna putih.   dengan jumlah warna
piksel yaitu hitam dan
                           (Sutoyo, 2009)            maksimum yang dapat
putih. (Putra, 2010)                                 digunakan adalah 256
                                                     warna. (Sutoyo, 2009)
HISTOGRAM CITRA (1)
• Histogram citra adalah grafik yang menggambarkan
  penyebaran nilai-nilai intensitas piksel dari suatu citra atau
  bagian tertentu di dalam citra (Munir, 2004).

                        ��������
                  �������� = ,        ���� = 0, 1, … , ���� − 1
                         ����

   Keterangan:
  • ����= jumlah level warna
  • �������� = jumlah piksel yang memiliki level warna ke i
  • ���� = jumlah seluruh piksel di dalam citra
  • �������� = nilai histogram

           ��������
HISTOGRAM CITRA
1 1 1 3 1 4 4 4 1 0   ��������                              Histogram Citra
                         1.2
3 5 3 5 5 5 5 7 7 0
                               1
0 0 0 2 2 6 6 6 6 6      0.8

5 5 4 4 4 4 4 4 7 3      0.6
                                                                                                    nilai histogram
2 2 0 0 0 0 1 1 1 1      0.4

7 5 5 5 7 7 7 6 3 3      0.2


3 3 3 3 3 3 3 3 7 5            0
                                     0     1        2       3   4      5        6   7      ����
5 5 5 5 5 5 5 5 2 3
                                   Tabel frekuensi kemunculan setiap warna
0 0 0 0 0 0 4 4 4 4
                          ����        0          1        2       3          4        5           6         7
3 3 3 3 3 1 1 1 6 2     ��������        15         12       6       20         13       19          7         8

                         ��������       0.15       0.12     0.06    0.20       0.13     0.19        0.07      0.08
        Citra
SEGMENTASI (1)
• Segmentasi membagi citra ke dalam daerah intensitasnya
  masing-masing sehingga bisa membedakan antara objek dan
  latar belakangnya (Sutoyo, 2009). Segmentasi bisa dilakukan
  dengan berbagai cara, salah satunya dengan menggunakan
  metode pengambangan (thresholding).

• Pengambangan digunakan untuk mempartisi citra dengan
  mengatur nilai intensitas semua piksel berdasarkan parameter
  nilai ambang ����.

                              ����1 �������� ����(����, ����) ≥ ����
                ���� ����, ���� =
                              ����2 �������� ���� ����, ���� < ����
SEGMENTASI (2)
• Berikut merupakan langkah-langkah untuk mendapatkan nilai
  ambang (Gonzales, 2002):




         Ulangi hingga nilai-nilai ����1 dan ����2 tidak berubah lagi
FILTER MORFOLOGI
• Morfologi berarti bentuk dan struktur suatu obyek atau
  susunan internal antar bagian-bagian sebuah obyek. Morfologi
  digital adalah suatu cara untuk menganalisis atau
  mendeskripsikan bentuk dari obyek digital (dalam citra digital)
  (Munir,2004).


  • Operasi Dilasi
  • Operasi Erosi
  • Operasi Opening
  • Operasi Closing
Operasi Dilasi
  • Operasi dilasi dilakukan untuk memperbesar ukuran segmen obyek
    dengan menambah lapisan di sekeliling obyek. Proses perubahan citra
    disesuaikan dengan structuring element pembanding.
Operasi Erosi
  • Operasi erosi adalah kebalikan dari operasi dilasi. Pada operasi ini, ukuran
    obyek diperkecil dengan mengikis sekeliling obyek. Operasi ini juga
    bekerja sesuai dengan structure element pembandingnya.
Operasi Opening
• Operasi pembukaan (Opening) merupakan kombinasi antara
  operasi erosi dan dilasi yang dilakukan secara berurutan,
  tetapi citra asli dierosi terlebih dahulu baru kemudian hasilnya
  didilasi.
Operasi Closing
• Operasi penutupan adalah kombinasi antara operasi dilasi dan
  erosi yang dilakukan secara berurutan. Citra asli didilasi
  terlebih dahulu, kemudian hasilnya dierosi.
PELABELAN KOMPONEN (1)
• Bila citra mengandung objek lebih dari satu maka ciri-ciri
  mendasar objek dapat dihitung secara sendiri-sendiri melalui
  operasi pelabelan, yaitu dengan cara menemukan komponen
  terkoneksi dalam citra karena suatu komponen terkoneksi
  mewakili sebuah objek.
PELABELAN KOMPONEN (2)
Algoritma operasi pelabelan komponen adalah sebagai berikut (Sutoyo,
2009):

1.    Baca citra secara sistematis.
2.    Jika piksel yang sedang dibaca adalah milik objek, maka:
     • jika hanya satu dari dua piksel di sebelah kiri dan atasnya yang punya
       label, salin labelnya.
     • jika keduanya punya label yang sama, salin labelnya.
     • jika keduanya punya label yang berbeda, salin label milik piksel di
       atasnya dan catat kedua label pada tabel ekivalen label.
     • selain itu beri label baru pada piksel ini dan catat nomor label dalam
       tabel.
3.    Jika masih ada piksel yang perLu diperiksa, ulangi langkah 2.
4.    Temukan label terendah untuk setiap pasangan ekivalen dalam
      tabel.
5.    Baca citra, ganti setiap label dengan label terendah dalam ekivalen
      tabel.
PELABELAN KOMPONEN (3)
               1   1      1                 2
               1   1      1         1       2
                                           2

                   3      3         3       3
                   3      3         3       3


 Nomor Label       Label Ekivalen       Label Terendah
     1                   1, 2                  1
     2
     3
PELABELAN KOMPONEN (4)

      1   1   1       1
      1   1   1   1   1


          3   3   3   3
          3   3   3   3
DETEKSI TEPI
• Tepian citra adalah posisi dimana intensitas piksel dari citra berubah dari
  nilai rendah ke nilai tinggi atau sebaliknya (Putra, 2010).

• Salah satu metoda deteksi tepi adalah deteksi tepi berbasis gradient.
  Deteksi tepi dapat dilakukan dengan menghitung selisih antara dua
  buah titik yang bertetangga sehingga didapat besar gradient citra.

                                                   ��������
                                          ��������     ��������
                        ���� ���� ����, ����    = ����     = ��������
                                            ����
                                                   ��������

• Besar gradient dihitung dengan persamaan berikut:

                                                2      2
                         ���� ���� ����, ����   =    �������� + ��������
BAB III – METODOLOGI
PENYELESAIAN MASALAH
• RANCANGAN PENYELESAIAN MASALAH




• CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
  METODE BERBASIS TEPI
RANCANGAN PENYELESAIAN MASALAH
OTSU – THRESHOLD
• Otsu-threshold merupakan metode pengambangan (thresholding) dengan melakukan
  iterasi pada semua nilai ambang batas (threshold) yang memungkinkan.

• Tujuannya adalah untuk menemukan nilai ambang dimana jumlah sebaran piksel pada
  background dan pada foreground adalah yang paling kecil.

                                   2            2         2
                                 �������� = �������� �������� + ���� ��������
                                                      ����


                                                ����−1
                                                ����=1 ����(��������)
                                     �������� =
                                                    ����

                                       ����−1                2
                             2         ����=0 (�������� − �������� ) . ����(��������)
                          ��������   =             ����−1
                                               ����=0 . ����(��������)

                                       ��������                2
                             2         ����=����(�������� − �������� ) . ����(��������)
                          ��������   =             ��������
                                               ����=����. ����(��������)
RANCANGAN PENYELESAIAN MASALAH
REDUKSI NOISE (1)

• Noise yang perlu dihilangkan ada dua macam, yaitu :

  • Noise yang berada pada area yang luas. Untuk mereduksi noise
    tersebut dilakukan dengan menggunakan metode pelabelan
    komponen seperti yang sudah dijelaskan pada bab 2.

  • Noise yang menempati area yang tidak luas. Untuk mereduksi
    noise-noise ini dapat dilakukan dengan menggunakan filter
    morfologi, yaitu proses opening atau closing.
RANCANGAN PENYELESAIAN MASALAH
REDUKSI NOISE (2)
   1   1   1   1   1   1   1   1
   1   1   1   1   1   1   1   1
                                   Noise yang
   1   1   1   1   1   0   0   0
                                   menempati area
   0   0   0   0   0   0   1   0   yang tidak luas
   0   1   1   1   0   1   0   0
   0   0   1   0   0   1   0   0
                                   Noise yang
   1   1   1   1   1   1   1   1   menempati area
   1   1   1   1   1   1   1   1   yang luas
   1   1   1   1   1   0   0   0
   0   0   0   0   0   0   1   0
   0   1   1   1   0   1   0   0
   0   0   1   0   0   1   0   0
RANCANGAN PENYELESAIAN MASALAH
DETEKSI TEPI
• Proses deteksi tepi menggunakan operator Sobel.




             �������� = ����2 + 2����3 + ����4 − ����0 + 2����7 + ����6

             �������� = ����0 + 2����1 + ����2 − ����6 + 2����5 + ����4

                                           2      2
                      ���� ���� ����, ����   =   �������� + ��������
RANCANGAN PENYELESAIAN MASALAH
EDGE GROUPING




1.   Lakukan pemeriksaan piksel per piksel pada citra.
2.   Jika ditemukan citra warna putih pada piksel yang sedang diperiksa,
     maka piksel tersebut menjadi start piksel.
3.   Lakukan pencarian ke sebelah kanan (lihat Gambar) sebesar interval
     maksimum yang disepakati.
4.   Jika ditemukan piksel berwarna putih, maka piksel tersebut akan
     menjadi end piksel dan dilakukan proses filling yaitu proses pemberian
     warna putih. Jika tidak lakukan pencarian untuk piksel lainnya.
5.   Lakukan sampai semua piksel pada citra diperiksa.
RANCANGAN PENYELESAIAN MASALAH
ANALISIS KOMPONEN TERHUBUNG

• Proses analisis komponen – komponen yang terhubung
  dilakukan untuk melihat komponen mana saja yang berupa
  teks dan yang tidak merupakan teks.

• Ketentuan analisisnya sebagai berikut
  1.   Tinggi dan lebar komponen tidak terlalu besar.
  2.   Lebar dari setiap komponen harus lebih besar dari 2 kali
       tingginya.
  3.   Bentuk komponen terhubung membentuk balok
RANCANGAN PENYELESAIAN MASALAH
BOUNDARY TEKS

• Setelah melalui proses analisis komponen terhubung, maka
  akan didapatkan komponen-komponen terhubung yang
  mengandung teks didalamnya.

• Untuk memperjelas teks yang sudah terdeteksi dilakukan
  proses boundary teks untuk mencari batas atas, batas bawah,
  batas kiri dan batas kanan dari komponen terhubung tersebut.
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
           METODE BERBASIS TEPI (1)




                              Contoh Citra Uji

                              (a) Red
                              (b) Green
                              (c) Blue
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (2)

 • Langkah-langkah yang dilakukan pada citra uji untuk
   mengekstraksi teks pada citra adalah sebagai berikut :

1.   Rubah citra uji menjadi citra grayscale.
2.   Lakukan Otsu-threshold untuk merubah citra uji menjadi
     citra biner.
3.   Lakukan reduksi noise pada citra.
4.   Lakukan proses deteksi tepi.
5.   Lakukan proses edge grouping.
6.   Lakukan proses analisis komponen terhubung.
7.   Lakukan proses boundary teks.
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (3)
langkah 1




    Setelah citra uji menjadi citra grayscale, didapat 3 nilai intesitas warna pada
      citra uji, yaitu 0 (warna hitam), 1 (warna abu-abu) dan 2 (warna putih).
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (4)
langkah 2
          90

          80
          70

          60

          50
          40

          30
          20
          10

           0
                          0        1        2




               ����(����)         0        1        2

               ����(��������)       81       55       14
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (5)
langkah 2
    ��������    =    81                                          T=1
                    = 0.54
                150
                                                        90
    ��������        0                                       80
            =
                                                        70
       2        0
    ��������                                                60
            =
                                                        50
                                                        40
    ���� ����   =   55 + 14
                        = 0.46                          30
                  65
                                                        20
    ��������                                                10
            =    1 x 55 + (2 x 14)
                                   = 55.4                0
                        65
                                                                   0       1            2


       2
    ��������    =   ( 1 − 55.4)2 x 55 + ( 2 − 55.4)2 x 14         background       foreground
                                  65
            =   2937.48
                        2         2
      2
    ��������    =   �������� �������� + ���� ��������
                              ����

            =    0.54 x 0 + 0.46 x 2937.48 = 351.24
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (5)
langkah 2


           T=0           T=1          T=2
   ��������             0          0.54          0.9

   ��������             0            0           0.4
      2
   ��������             0            0      32.76
   ��������             1          0.46         0.09

   ��������          55.18         55.4           2

      2
   ��������      2984.5      2937.48              0
     2
   ��������      2984.5       351.24        29.48
                                                     Citra setelah dilakukan proses
 Tabel Hasil Perhitungan Otsu-threshold            pengambangan dengan nilai T = 2
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (6)
langkah 3
• Dengan menggunakan filter morfologi, noise pada citra uji dapat
  dihilangkan.

• Filter morfologi yang akan digunakan adalah operasi closing, karena
  operasi closing digunakan untuk menutup atau menghilangkan noise
  yang berada pada area yang kecil.




• Untuk itu akan dilakukan proses dilasi pada citra uji kemudian
  dilanjutkan dengan melakukan proses erosi.
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (7)
langkah 3
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (8)
langkah 3
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (9)
langkah 4




                         a)   �������� = ����2 + 2����3 + ����4
                                         − ����0 + 2����7 + ����6

                         b)   �������� = ����0 + 2����1 + ����2
                                         − ����6 + 2����5 + ����4

                                                     2      2
                         c)     ���� ���� ����, ����   =   �������� + ��������
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (10)
langkah 5
• Setelah tepi-tepi pada citra uji terdeteksi, maka akan dilakukan
  proses edge grouping. Proses edge grouping adalah proses untuk
  mengelompokkan tepi-tepi yang berada pada jarak yang ditentukan.

  • Algoritma edge grouping adalah sebagai berikut :
  • Lakukan pemeriksaan piksel per piksel pada citra.
  • Jika ditemukan citra warna putih pada piksel yang sedang diperiksa,
    maka piksel tersebut menjadi start piksel.
  • Lakukan pencarian ke sebelah kanan (lihat Gambar 3.5) sebesar
    interval maksimum yang disepakati.
  • Jika ditemukan piksel berwarna putih, maka piksel tersebut akan
    menjadi end piksel dan dilakukan proses filling yaitu proses
    pemberian warna putih. Jika tidak lakukan pencarian untuk piksel
    lainnya.
  • Lakukan sampai semua piksel pada citra diperiksa.
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (11)
langkah 5
    0   0   0   0   0   0   0   0   0   0   0   0   0   0   0      0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0   0   0   0   0   0      0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0   0   0   0   0   0      0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0   0   0   0   0   0      0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   1   0   0   0   1   0   0   0   1   0   0   0   0      0   0   1   1   1   1   1   1   1   1   1   0   0   0   0
    0   0   1   0   0   0   1   0   0   0   1   0   0   0   0      0   0   1   1   1   1   1   1   1   1   1   0   0   0   0
    0   0   1   0   0   0   1   0   0   0   1   0   0   0   0      0   0   1   1   1   1   1   1   1   1   1   0   0   0   0
    0   0   1   0   0   0   1   0   0   0   1   0   0   0   0      0   0   1   1   1   1   1   1   1   1   1   0   0   0   0
    0   1   1   1   0   1   1   1   0   1   1   1   0   0   0      0   1   1   1   1   1   1   1   1   1   1   1   0   0   0
    0   0   0   1   0   0   0   1   0   0   0   1   0   0   0      0   0   0   1   1   1   1   1   1   1   1   1   0   0   0

            Sebelum proses filling                                         Setelah proses filling




                                                    Dalam bentuk citra biner
CONTOH PERHITUNGAN PROSES EKSTRAKSI TEKS PADA
METODE BERBASIS TEPI (12)
langkah 6

              0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
              0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
              0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
              2   2   2   2   2   2   2   2   2   2   2   2   2   0   0
              2   0   1   1   1   1   1   1   1   1   1   0   2   0   0
              2   0   1   1   1   1   1   1   1   1   1   0   2   0   0
              2   0   1   1   1   1   1   1   1   1   1   0   2   0   0
              2   0   1   1   1   1   1   1   1   1   1   0   2   0   0
              2   1   1   1   1   1   1   1   1   1   1   1   2   0   0
              0   0   0   1   1   1   1   1   1   1   1   1   2   0   0


            Piksel bernilai 2 menjadi piksel yang menjadi
            garis batas pada komponen terhubung yang
            terdeteksi sebagai teks
Rancangan Program Komputer
BAB IV – IMPLEMENTASI DAN PEMBAHASAN
PROGRAM

• Pada bab ini akan dijelaskan mengenai implementasi proses
  ekstraksi teks ke dalam program, cara menggunakan program
  dan hasil pengujian program terhadap berabgai citra yang
  dikategorikan menjadi dua kategori yaitu citra yang
  mengandung teks dan citra yang tidak mengandung teks.
4.1 Tampilan Antar Muka (GUI)
• Pada tampilan GUI yang diperlihatkan pada gambar 4.1,
  terdapat satu text box, dua picture box, tiga button dan enam
  group box yang masing masing group box mempunyai dua
  button.
4.2   Langkah Langkah Proses Ekstraksi Teks

1. Rubah citra uji menjadi citra grayscale.
2. Lakukan Otsu-threshold untuk merubah citra uji menjadi
   citra biner.
3. Lakukan reduksi noise pada citra.
4. Lakukan proses deteksi tepi.
5. Lakukan proses edge grouping.
6. Lakukan proses analisis komponen terhubung.
7. Lakukan proses boundary teks.
Langkah 1 dan 2
Langkah 3
Langkah 4 dan 5
Langkah 6
Langkah 7
Hasil akhir
4.3        Pengujian Proses Ekstraksi Teks Pada Berbagai Citra


• Sampel citra uji yang digunakan untuk menguji penelitian ini
  terbagi menjadi dua kategori :
      1.   Citra yang mengandung teks (30)
      2.   Citra yang tidak mengandung teks (20)

• Pengambilan sampel citra yang mengandung teks sesuai
  dengan batasan masalah.

• Pengambilan sampel citra yang tidak mengandung teks
  berdasarkan beberapa kriteria yaitu tidak terdapat teks pada
  citra.
Beberapa contoh sampel citra yang mengandung teks
Beberapa contoh sampel citra yang tidak mengandung teks
Kategori pengujian sampel
• Hasil dari pengujian sampel untuk citra yang mengandung teks
  dibagi menjadi 2 kategori, yaitu
  1.   True positive (disingkat TP), teks terdeteksi pada citra yang
       mengandung teks.
  2.   True negative (disingkat TN), teks tidak terdeteksi pada citra
       yang mengandung teks.


• Hasil dari pengujian sampel untuk citra yang tidak terdapat
  teks dibagi menjadi 2 kategori, yaitu
  1.   False positive (disingkat FP), terdeteksi teks apda citra yang
       tidak mengandung teks.
  2.   False negative (disingkat FN), tidak terdeteksi pada citra yang
       tidak mengandung teks
Tabel hasil pengujian dari sampel yang telah diambil
    No      Citra Uji     Hasil Pengujian
                                            No        Citra Uji         Hasil Pengujian
            Citra Yang Mengandung Teks
    1    Citra Uji 1            TP                  Citra Yang Tidak Mengandung Teks
    2    Citra Uji 2            TP          31   Citra Uji 31                FN
    3    Citra Uji 3            TP          32   Citra Uji 32                FN
    4    Citra Uji 4            TP
    5    Citra Uji 5            TP          33   Citra Uji 33                FN
    6    Citra Uji 6            FP          34   Citra Uji 34                FN
    7    Citra Uji 7            TP          35   Citra Uji 35                FN
    8    Citra Uji 8            FP
    9    Citra Uji 9            FP          36   Citra Uji 36                FN
    10   Citra Uji 10           TP          37   Citra Uji 37                FN
    11   Citra Uji 11           TP          38   Citra Uji 38                FN
    12   Citra Uji 12           TP
    13   Citra Uji 13           TP
                                            39   Citra Uji 39                FN
    14   Citra Uji 14           TP          40   Citra Uji 40                FP
    15   Citra Uji 15           TP          41   Citra Uji 41                FN
    16   Citra Uji 16           TP
                                            42   Citra Uji 42                FN
    17   Citra Uji 17           TP
    18   Citra Uji 18           TP          43   Citra Uji 43                FN
    19   Citra Uji 19           TP          44   Citra Uji 44                FN
    20   Citra Uji 20           TP          45   Citra Uji 45                FN
    21   Citra Uji 21           TP
    22   Citra Uji 22           TP          46   Citra Uji 46                FN
    23   Citra Uji 23           TP          47   Citra Uji 47                FN
    24   Citra Uji 24           TP          48   Citra Uji 48                FN
    25   Citra Uji 25           TP
    26   Citra Uji 26           TP          49   Citra Uji 49                FN
    27   Citra Uji 27           TP          50   Citra Uji 50                FN
    28   Citra Uji 28           TP
    29   Citra Uji 29           FP
    30   Citra Uji 30           TP
Hasil pengujian sampel
• Dari hasil pengujian yang ditunjukkan pada tabel, untuk citra
  yang tidak mengandung teks didapat :
  • 1 citra dari 20 citra yang masuk ke dalam kategori FP atau sebesar
    5%,
  • 19 dari 20 citra masuk ke dalam kategori FN

• Dari hasil pengujian yang ditunjukkan pada tabel, untuk citra
  yang mengandung teks didapat :
  • 26 citra dari 30 citra yang masuk ke dalam kategori TP atau
    sebesar 86.7 %,
  • 4 dari 30 citra masuk ke dalam kategori TN atau sebesar 13.3%.
Bab V – Kesimpulan dan Saran
• Kesimpulan
  1.   Proses ekstraksi teks dengan metode berbasis tepi mampu
       diimplementasikan ke dalam program dan mampu mengekstraksi teks
       dengan memberikan informasi berupa lokasi tempat teks berada pada citra
       yang mengandung teks.
  2.   Proses ekstraksi teks dengan menggunakan metode berbasis tepi hanya
       dapat membaca teks yang posisinya berada pada posisi horizontal pada
       citra.


• Saran
  1.   Untuk pengembangan lebih lanjut disarankan untuk membuat program
       ekstraksi teks yang lebih cepat dalam prosesnya. Dengan melakukan
       pendeketan lain dalam menghilangkan komponen-komponen terhubung
       yang tidak sesuai dengan kritera selain dengan menghitung luas daerah
       komponen-komponen tersebut. Seperti mencari titik berat pada
       komponen-komponen terhubung.
  2.   Untuk pengembangan lebih lanjut disarankan agar setelah proses ekstraksi
       teks berhasil, maka dilakukan proses pengelana teks sehingga dapat
       dibaca.

				
DOCUMENT INFO
Shared By:
Stats:
views:190
posted:6/28/2012
language:English
pages:64
Description: Mencari teks pada citra dengan melakukan deteksi tepi pada citra yang ada. Teks yang telah terdeteksi akan secara otomatis diberi kotak sebagai penunjuk lokasi teks yang terdeteksi.