Datawarehousing dan Datamining Asosiasi Nilai Mahasiswa Masa Skripsi

Document Sample
Datawarehousing dan Datamining Asosiasi Nilai Mahasiswa Masa Skripsi Powered By Docstoc
					Datawarehousing dan Datamining Asosiasi Nilai Mahasiswa, Masa Skripsi dan Masa Studi
Program Studi Teknik Informatika FTI-UAJY
(Paulus Mudjihartono)




Datawarehousing dan Datamining
Asosiasi Nilai Mahasiswa, Masa Skripsi dan Masa Studi
Program Studi Teknik Informatika FTI-UAJY

Paulus Mudjihartono
Program Studi Teknik Informatika, Fakultas Teknologi Industri, Universitas Atma Jaya Yogyakarta
Jl. Babarsari No.43 Yogyakarta 55281
E-mail: paul235@mail.uajy.ac.id


Abstract
      This paper explains how to make datawarehouse of School of Informatics, Faculty of
      Industrial Technology, Atma Jaya Yogyakarta. This paper also deal with the result of
      datamining using association rule. Data to be datawarehoused is taken from data alumni
      graduated since October 1998 until July 2005. It includes three kinds of curriculum, which
      is called Curriculum 1996, Curriculum 2002, and Curriculum 2004. Datawarehousing
      encompasses subject conversion from old curriculum into the new one, the making of 13
      category of subject with 5 value each, the making of 3 category of study and skripsi
      duration with 3 value each, normalization of student mark, and the generation of master
      table into with data mining refers to. Second step is run the data which contained in master
      table to be analyzed. The test running on minimum support 20% and minimum confidence
      40%. The data mining results several knowledge that useful significantly for decision
      maker, some others do not.

      Keywords: Alumni data, datawarehouse, association, knowledge.


1. Pendahuluan
       Program Studi Teknik Informatika FTI UAJY telah berdiri sejak September 1993, selama
itu pula program studi ini melakukan transaksi-transaksi rutinnya, seperti pengisian KRS setiap
semester oleh mahasiswanya, pengisian nilai matakuliah oleh Tata Usaha (nilai diserahkan
dosen kepada Tata Usaha) setiap semester, dan peng-update-an status kelulusan mahasiswanya
setiap periode tertentu. Salah satu data penting pada transaksi tersebut adalah data nilai. Bagi
alumni, data nilai ini menjadi data transkrip, data yang tidak dipakai lagi dalam transaksi. Data
transkrip terakumulasi sejak salah seorang mahasiswa lulus dan menjadi alumni pertama. Selain
data transkrip, alumni juga mempunyai data lain yaitu masa studi dan masa skripsi. Data yang
disebut terakhir ini bukan data primitf, karena harus ditempuh komputasi tertentu terlebih
dahulu untuk memperolehnya. Ketiga data inilah yang akan digali untuk diperoleh pengetahuan
baru yang ada mengenai faktor pengaruh apa saja yang mempengaruhi masa studi dan masa
skripsi seorang mahasiswa. Pengetahuan baru ini diharapkan dapat memberikan pertimbangan
bagi pengambil keputusan program studi dalam mengelola program studi.

Batasan pada penelitian ini adalah:
    a. Data yang digunakan adalah data asli yang yang telah berkurang karena proses
        pembersihan, diperoleh 435 data alumni yang dianalisis.
    b. Proses penyetaraan kurikulum dianggap sebagai salah satu proses data integration yang
        diterima.




                                                                                                     1
Jurnal Teknologi Industri Vol. XI No.1 Januari 2007: 1-8


Dalam penelitian ini, dapat dijabarkan beberapa perumusan masalah yang ada:
   a. Bagaimana membuat datawarehouse bagi program studi Teknik Informatika berkaitan
       dengan nilai, masa skripsi dan masa studi?
   b. Bagaimana menemukan pengetahuan yang mungkin berguna dalam datawarehouse
       tersebut dengan aturan asosiasi?

2. Analisis Sistem
      Data yang diperoleh adalah enam buah data table (DBF) tentang akademik alumni dan
kurikulum. Ketiga data pertama dinamai berdasarkan tahun wisuda yang dipakainya, yaitu:
    a. Wisuda98sd02, yang berisi data akademik alumni yang diwisuda Juli 1998 hingga Juli
        2002, yang menggunakan kurikulum 1996.
    b. Wisuda02sd04, yang berisi data akademik alumni yang diwisuda Oktober 2002 hingga
        Juli 2004, yang menggunakan kurikulum 2002.
    c. Wisuda04sd05, yang berisi data akademik alumni yang diwisuda Oktober 2004 hingga
        Juli 2005, yang menggunakan kurikulum 2004.

Tiga data table berikutnya, berisi kurikulum yang berlaku dalam kurun 1996 sampai dengan
2005. Ketiga data tersebut berisi matakuliah, beserta SKS dan kodenya, diberi nama sesuai
nama kurikulumnya:
    a. Kurikulum96
    b. Kurikulum02
    c. Kurikulum04
Struktur keenam table tersebut masih belum normal dan dalam format yang berbeda-beda.
Banyak ketidakkonsistensian format sekalipun untuk tabel dengan maksud yang sama.

Tabel 1. Data Wisuda Periode Oktober 1998 sampai dengan Juli 2002
 Tabel Wisuda98sd02.DBF

 Field          Tipe        Contoh Instans             Keterangan
 NoMhs          Text        ‘1234’                     berisi nomor mahasiswa alumni
 Angkatan       Text        ‘1999’                     berisi angkatan mahasiswa, saat
                                                       alumni masuk pertama        sebagai
                                                       mahasiswa
 Skripsi        Text        ‘1.1999/2000’              berisi semester dan tahun akademik
                                                       saat pertama kali alumni mendaftar
                                                       skripsi
 Periode        Text        ‘OKT 1998’                 berisi periode wisuda dan tahun
                                                       akademik saat wisuda alumni
                                                       berlangsung
 Nil            Text        ‘AABACCCA…’                Berisi nilai dalam text panjang
                                                       dengan urutan tertentu yang sesuai
                                                       dengan table Kurikulum02.DBF

Tabel 2. Data Wisuda Periode Oktober 2002 sampai dengan Juli 2004
 Tabel Wisuda02sd04.DBF

 Field          Tipe        Contoh Instans             Keterangan
 NoMhs          Text        ‘1234’                     berisi nomor mahasiswa alumni

 Angkatan       Text        ‘1999’                     berisi angkatan mahasiswa, saat



2
Datawarehousing dan Datamining Asosiasi Nilai Mahasiswa, Masa Skripsi dan Masa Studi
Program Studi Teknik Informatika FTI-UAJY
(Paulus Mudjihartono)

                                                    alumni masuk pertama           sebagai
                                                    mahasiswa
 Skripsi       Text       ‘1.1999/2000’             berisi semester dan tahun akademik
                                                    saat pertama kali alumni mendaftar
                                                    skripsi
 Periode       Text       ‘OKT 1998’                berisi periode wisuda dan tahun
                                                    akademik saat wisuda alumni
                                                    berlangsung
 Nil           Text       ‘AABCC….’                 Berisi nilai dalam text panjang
                                                    dengan urutan tertentu yang sesuai
                                                    dengan tabel Kurikulum02.DBF
 Tanda         Text       ‘-- + ++ - -- …..’        Berisi tanda +, – dan ‘ ‘ (spasi) yang
                                                    menunjukkan tanda nilai dari field
                                                    nilai yang bersesuaian. Urutan nilai
                                                    tertentu sesuai dengan table
                                                    Kurikulum02.


Tabel 3. Data Wisuda Periode Oktober 2004 sampai dengan Juli 2005
 Tabel Wisuda04sd05.DBF

 Field         Tipe       Contoh Instans            Keterangan
 NoMhs         Text       ‘1234’                    berisi nomor mahasiswa alumni
 Angkatan      Text       ‘1999’                    berisi angkatan mahasiswa, saat
                                                    alumni masuk pertama           sebagai
                                                    mahasiswa
 Skripsi       Text       ‘1.1999/2000’             berisi semester dan tahun akademik
                                                    saat pertama kali alumni mendaftar
                                                    skripsi
 Periode       Text       ‘OKT. 1998’               berisi periode wisuda dan tahun
                                                    akademik saat wisuda alumni
                                                    berlangsung
 Nil           Text       ‘AABCC….’                 Berisi nilai dalam text panjang
                                                    dengan urutan tertentu yang sesuai
                                                    dengan table Kurikulum02.DBF
 Tanda         Text       ‘-- + ++ - -- …..’        Berisi tanda +, – dan ‘ ‘ (spasi) yang
                                                    menunjukkan tanda nilai dari field
                                                    nilai yang bersesuain. Urutan nilai
                                                    tertentu sesuai dengan table
                                                    Kurikulum02.

Setelah direduksi beberapa field yang tidak relevan, maka diperoleh tiga struktur tabel yang
sama.




                                                                                             3
Jurnal Teknologi Industri Vol. XI No.1 Januari 2007: 1-8


Tabel 4. Format tabel Kurikulum1996, Kurikulum2002, dan Kurikulum2004
 Tabel Kurikulum96.DBF, Kurikulum02 dan Kurikulum04

 Field          Tipe        Contoh Instans             Keterangan
 No             Int         1                          Berisi nomor urut matakuliah
 Kode           Text        ‘TF1211’                   berisi kode matakuliah
 Matakuliah     Text        ‘Fisika 1’                 berisi nama matakuliah
 Sks            Integer     3                          Berisi SKS matakuliah


Kategori Matakuliah
      Diperlukan kategori matakuliah untuk memperkecil domain matakuliah. Dari ketiga
kurikulum diperoleh hal-hal yang umum yang dapat ditarik sebagai satu kategori tersendiri,
seperti aspek integritas, kepribadian, aspek keteknikan dasar, komputasi, pemrograman,
manajemen, ketiga konsentrasi, etika, dan kemasyarakatan. Ketiga konsentarsi adalah Sistem
Komputer dan Jaringan (SKJ), Komputasi Industri (KI) dan Rekayasa Perangkat Lunak dan
Sistem Informasi (RELASI). Secara rinci kategori matakuliah dibagi dalam 13 kategori seperti
ditunjukkan dalam pada tabel 3.5.

Tabel 5. Kategori Matakuliah
 Id         KategoriMK
 1          Aspek Integritas Diri
 2          Dasar-dasar Teknik
 3          Dasar-dasar Komputasi
 4          Pemrograman
 5          Keahlian Komputasi
 6          Dukungan Manajerial
 7          Keahlian RPL dan SI
 8          Keahlian Jaringan Komputer
 9          Etika dan Kewirausahaan
 10         Aspek Sosial dan Kerjasama
 11         Pilihan SKJ
 12         Pilihan KI
 13         Pilihan RELASI

Penyebaran matakuliah ke masing-masing kategori dari ketiga kurikulum mempertimbangkan:
   a. Kesetaraan Kurikulum yang sudah ditentukan Program Studi
   b. Kesenjangan minimal matakuliah terhadap kategorinya.

3. Desain Sistem
a. Desain Database
1) Pembangkitan Tanggal Masuk Studi (Join)
      Tanggal alumni untuk pertama kalinya bergabung ke program studi ketika masih sebagai
mahasiswa baru bisa di-generate berdasarkan field angkatan dan asumsi bahwa, masuk kuliah
mulai tanggal 1 September. Kesalahan asumsi ini kecil sekali pengaruhnya terhadap
penghitungan masa studi (dalam bulan) apalagi penghitungan asosiasi relatif terhadap item
properti mahasiswa lainnya.
Query yang diusulkan:
        UPDATE WISUDA98-02
        SET TGLGABUNG='9/1/' +SUBSTRING(ANGKATAN,1,4)



4
Datawarehousing dan Datamining Asosiasi Nilai Mahasiswa, Masa Skripsi dan Masa Studi
Program Studi Teknik Informatika FTI-UAJY
(Paulus Mudjihartono)

2) Pembangkitan Tanggal Skripsi
        Karena field skripsi hanya berisi sebuah string yang mengandung semester (1 untuk
gasal dan 2 untuk genap) dan tahun akademik. Untuk mengubahnya menjadi tanggal, ditempuh
cara:
    a. Buat satu field baru TanggalSkripsi bertipe Date
    b. Tentukan tanggal skripsi untuk semester gasal dan genap. Semester Gasal secara praktis
        dimulai tanggal 1 September, sedang semester genap 1 Februari.
    c. Update field tersebut dengan query:
        UPDATE WISUDA98 SET
        TANGGALSKRIPSI=’2/1/’+SUBSTRING(SKRIPSI,3,4)
        WHERE SUBSTRING(SKRIPSI,1,1)=1
        UPDATE WISUDA98 SET
        TANGGALSKRIPSI=’9/1/’+SUBSTRING(SKRIPSI,3,4)
        WHERE SUBSTRING(SKRIPSI,1,1)=2
    d. Hapus field Skripsi

3) Pembangkitan Tanggal Yudisium
       Tanggal yudisium dibuat dengan berdasar periode wisuda (satu-satunya informasi dalam
data). Karena hanya periode wisuda yang diketahui maka hanya ada satu tanggal yudisium
untuk setiap periode. Ditentukan yudisium 1 bulan sebelum wisuda. Karena wisuda selalu akhir
bulan, maka yudisium ditentukan awal bulan periode tersebut.
    a. Buat satu field baru TanggalYudisium bertipe Date
    b. Tentukan tanggal yudisium berdasar bulan periode, yaitu tanggal satu setiap bulan
        periode.
    c. Update field tersebut dengan query:
        UPDATE WISUDA98 SET
        TANGGALYUDISIUM=’10/1/’+ SUBSTRING(PERIODE,6,4)
        WHERE SUBSTRING(PERIODE,1,3)=’OKT’

    Demikian pula untuk bulan periode yang lain.

4) Pembangkitan Masa Studi dan Masa Skripsi (Durasi)
      Setelah diperoleh tiga tanggal penting, maka durasi masa studi dan masa skripsi dapat
dihitung dengan mudah.
Masa Studi = Tanggal Yudisium – Tanggal Gabung
Masa Skripsi = Tanggal Yudisium – Tanggal Skripsi
Query yang diusulkan:
        UPDATE WISUDA98 SET
        MASA_STUDI=
        DATEDIFF(MONTH,TGLGABUNG,TGLYUDISIUM)
dan

        UPDATE WISUDA98 SET
        MASA_SKRIPSI=
        DATEDIFF(MONTH,TGLSKRIPSI,TGLYUDISIUM)

5) Normalisasi Nilai
     Normalisasi Nilai bisa dilakukan dengan cara pemecahan field nilai yang bertipe text ke
dalam sebuah nilai float ber-range 0.0 sampai dengan 4.0. Dengan fungsi SubString dan




                                                                                           5
Jurnal Teknologi Industri Vol. XI No.1 Januari 2007: 1-8


penciptaan banyak field sebanyak matakuliah kurikulum1996, maka dengan mudah diperoleh
data nilai normal setiap matakuliah untuk setiap field-nya. Pengubahan ke tipe float
dimaksudkan untuk keperluan kategorisasi predikat. Perhatikan gambar 3.1 di bawah ini:




                  A B B A C C A B                     ............




                 4.0 3.0 3.0 4.0 2.0 2.0 4.0 3.0 ............




                    Gambar 2. Normalisasi Field Nilai ke dalam Banyak Field

Untuk tabel Wisuda02sd04 dan Wisuda04sd05 mengalami sedikit perbedaan pada field Nilai.
Hal ini disebabkan munculnya tanda untuk setiap nilai sejak kurikulum 2002 diberlakukan
hingga sekarang. Tanda ‘+’ menandakan penambahan 0.3 point dan tanda ‘-‘ menandakan
pengurangan 0.3 point. Proses normalisasinya diperlihatkan dalam gambar 3.2. dibawah ini.




     A B B A C C ....                          +      -    +         +   - ....




                        3.7 3.3 3.0 4.0 2.3 1.7 .........



              Gambar 3. Normalisasi Field Nilai dan Tanda ke dalam Banyak Field

b. Contoh Hasil Datamining
Dengan menggunakan aturan asosiasi dihasilkan beberapa knowledge yang mungkin berguna,
dari minimum support 20% dan minimum confidence 40%.




6
Datawarehousing dan Datamining Asosiasi Nilai Mahasiswa, Masa Skripsi dan Masa Studi
Program Studi Teknik Informatika FTI-UAJY
(Paulus Mudjihartono)


Tabel 5. Sampel knowledge

      ID                            Knowledge                            Confidence
     1706     Aspek Integritas Diri Bagus Sekali, Studi Cepat             99.01%
              Aspek Sosial dan Kerjasama Bagus Sekali
     0715     Keahlian      Jaringan      Komputer       Bagus,            87.38%
              Pemrograman Bagus, Keahlian RPL dan SI
              Bagus, Aspek Sosial dan Kerjasama Bagus
              Sekali  Dasar-dasar Teknik Bagus
     1524     Keahlian Jaringan Komputer Bagus,Dasar-dasar                 84.35%
              Teknik Bagus, Skripsi Lambat  Keahlian RPL
              dan SI Bagus
     1340     Keahlian Jaringan Komputer Bagus Sekali,Aspek                83.48%
              Sosial dan Kerjasama Bagus Sekali  Etika dan
              Kewirausahaan Bagus Sekali
     1704     Aspek Integritas Diri Bagus Sekali,Aspek Sosial               76.92
              dan Kerjasama Bagus Sekali  Studi Cepat
              Keahlian Komputasi Bagus Sekali,Pilihan SKJ
      54                                                                   75.65%
              Bagus Sekali  Studi Cepat
              Keahlian Komputasi Bagus Sekali,Etika dan
    1119                                                                   74.40%
              Kewirausahaan Bagus Sekali -> Studi Cepat
              Pilihan SKJ Bagus Sekali,Studi Cepat  Keahlian
      55                                                                   73.73%
              Komputasi Bagus Sekali
              Skripsi Lambat,Studi Cukup  Keahlian RPL dan
    2247                                                                   73.29%
              SI Bagus
              Skripsi Lambat,Aspek Sosial dan Kerjasama
     216      Bagus Sekali,Studi Cukup  Keahlian RPL dan                  72.50%
              SI Bagus
              Keahlian Jaringan Komputer Bagus,Studi Cukup
    1505                                                                   71.85%
               Skripsi Lambat
    2645      Studi Cepat  Keahlian Komputasi Bagus Sekali                66.30%


4. Kesimpulan
      Kesimpulan yang dapat dari penelitian ini adalah:
   a. Pembangunan datawarehouse menjadi langkah penting bagi setiap organisasi terutama
      ketika organisasi hendak menggali pengetahuan mengenai dirinya berdasarkan data
      aktual selama ini. Setiap organisasi memiliki kekhasan masing-masing dalam langkah
      membangun datawarehouse, karena memang mereka memiliki data, format data,
      banyak data yang berbeda satu sama lain. Program Studi Teknik Informatika
      memerlukan datawarehouse khas-nya untuk menggali pengetahuan mengenainya
      seperti yang telah diusulkan.
   b. Berlimpahnya data perlu dimanfaatkan untuk keperluan pengambilan keputusan
      manajerial. Datawarehouse Program Studi Teknik Informatika yang dibangun dari data
      alumni yang diwisuda per Oktober 1998 sampai dengan Juli 2005 dan dari ketiga
      kurikulumnya, yaitu kurikulum1996, kurikulum2002 dan kurikulum2004 telah berhasil
      menyediakan data tersebut dalam bentuk siap mining.




                                                                                       7
Jurnal Teknologi Industri Vol. XI No.1 Januari 2007: 1-8


    c. Telah ditemukan beberapa pengetahuan yang bermanfaat, meski juga ditemukan yang
       kurang bermanfaat bahkan kurang relevan. Keputusan manajerial yang menyertanya
       masih memerlukan pengetahuan praktis tentang organisasi itu sendiri. Disimpulkan
       bahwa pengambil keputusan akan mendapatkan konteksnya untuk memutuskan sesutu
       berdasarkan pengetahuan yang ditemukan jika ia benar pengambil keputusan organisasi
       tersebut.


Daftar Pustaka
Deitel, 2002, C# How to Program, Prentice-Hall Inc.
Han, 2001, Jiawei, and Kamber, Micheline, Data Mining Concepts and Techniques, Morgan
      Kaufmann.
Nag, B., 2001, Deshpande, P., and DeWitt, D, Caching For Multi-Dimensional Data Mining
      Queries, In Proceedings of Int. Conf. on Systemics, Cybernetics and Informatics (SCI-
      01), Orlando, Florida.




8

				
DOCUMENT INFO
Shared By:
Categories:
Stats:
views:818
posted:12/23/2009
language:Indonesian
pages:8