Docstoc

dataware house lecture 4.1

Document Sample
dataware house lecture 4.1 Powered By Docstoc
					         บทที่ 4 การวางแผนและการจัดการโครงการ
                 (Planning and project management)

           ในการสร้างคัลงข้อมูลนั้นอาจจะประสบความสาเร็จหรืออาจจะประสบความล้มเหลวก็เป็นได้ ซึ่งจาก
สถิติที่ได้จากผู้เชี่ยวชาญ ทาให้เราทราบว่า การสร้างคลังข้อมูล 50% จะพบกับความล้มเหลว โดยที่ในหลายๆ
ครั้งคลังข้อมูลที่สร้างขึ้นถูกสร้างขึ้นแต่ยังสมบูรณ์ก็ล้มเลิกไป จะมีเพียงไม่กี่ครั้งของการล้มเหลวที่คลังข้อมูลนั้น
ถูกสร้างจนสาเร็จแต่ถูกปล่อยละเลยทิ้งไว้ไม่มีคนใช้เนื่องจากข้อมูลในคลังข้อมูลไม่สอดคล้องกับการดาเนิน
ธุรกิจ หรือ อาจเกิดจากปัจจัยอื่นๆ ดังนั้นเมื่อเราศึกษาถึงความเป็นไปได้ในการสร้างคลังข้อมูลของธุรกิจหนึ่งๆ
แล้ว เราจะต้องมีการวางแผนและการจัดการที่ดีเพื่อให้คลังข้อมูลที่สร้างขึ้นประสบความสาเร็จตามที่ตั้งเป้าไว้

Planning your data warehouse
          ในการสร้ า งคลั งข้ อมู ล ถ้ า เรามีก ารวางแผนที่ ไม่ เ หมาะสมและการจั ด การโปรเจคที่ ไ ม่ดี พ ออาจ
ก่อให้เกิดความล้มเหลวในการสร้างคลังข้อมูลได้ สิ่งแรกที่เราต้องทาการพิจารณาคือบริษัทของเราต้องการ
คลังข้อมูลจริงๆหรือไม่ ? เพื่อที่จะตอบคาถามนี้เราจะต้องประเมินว่าสิ่งที่เราคาดหวังจากคลังข้อมูลคืออะไร
จากนั้ นเราต้องทาการพิจ ารณาว่า เราควรจะสร้างคลั งข้อมูลในลั กษณะใดหรือแบบใด? เราควรจะต้อง
ตรวจสอบให้แน่ใจว่าข้อมูลที่เราต้องการมากจากที่ใด และ เรามีข้อมูลที่เราต้องการหรือไม่ เราต้องเสาะหาว่า
ผู้ใช้คลังข้อมูลคือใคร ผู้ใช้จะใช้คลังข้อมูลอย่างไร และ เมื่อใด ซึ่งจากคาถามข้างต้น เราต้องทาการตอบคาถาม
เหล่านี้ให้ได้ก่อนที่จะทาการสร้างคลังข้อมูลเพื่อให้การลงทุนในการสร้างข้อมูลนั้นคุ้มค่ากับจานวนเงินและเวลา
ที่เสียไปโดยเริ่มทาการพิจารณาปัจจัยที่สาคัญดังต่อไปนี้
Value and expectationsในหลายๆบริษัทเริ่มทาการสร้างคลังข้อมูลและโครงการเกี่ยวกับ business
intelligence โดยไม่มีการประเมินคุณค่าที่จะได้รับจากการสร้างคลังข้อมูล แต่ในการที่จะสร้างคลังข้อมูลให้
ประสบความสาเร็จ ในขั้นตอนแรกเริ่มเราจะต้องประเมินให้ได้ว่ามีเพียงการสร้างคลังข้อมูลเท่านั้นหรือไม่
สามารถตอบสนองต่อความต้องการในการดาเนินธุรกิจ เมื่อเราได้คาตอบว่าใช่แล้ว ขั้นตอนต่อไปเราจะต้องทา
การแจกแจงถึงผลประโยชน์และคุณค่าที่จะได้รับจากการสร้างข้อมูล จากนั้นเราจะต้องตอบคาถามเหล่านี้ให้
ได้ เช่น การสร้างคลังข้อมูลสามารถช่วยให้ผู้บริหารสามารถตัดสินใจได้ดีขึ้นหรือไม่ คลังข้อมูลสามารถช่วงใน
การทาดาเนินธุรกิจหรือไม่ คลังข้อมูลสามารถช่วยเพิ่มส่วนแบ่งทางการตลาดได้หรือไม่ ถ้าได้เป็นจานวนเท่าไร
ความคาดหวังที่คาดว่าจะได้รับจากคลังข้อมูลมีอะไรบ้างเป็นต้น เมื่อเราสามารถตอบคาถามเรานี้ได้เราจะ
สามารถทราบถึงคุณประโยชน์ของการสร้างคลังข้อมูล


                                                                                                     1|Page
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
Risk assessmentการวางแผนที่ไม่ดีอาจส่งผลให้เกิดความล้มเหลวเกิดขึ้น ถ้าการสร้างคลังข้อมูลล้มเหลว จะ
มีคาถามตามมาว่า เราสูญเสียเงินไปเป็นจานวนเท่าไร? แต่โดยแท้จริงแล้วการประเมินความเสี่ยงนั้นไม่ได้มีแค่
การคานวณถึงค่าใช้จ่ายที่สูญเสียไป แต่จะมีส่วนอื่นๆด้วย เช่น (1) อะไรคือความเสี่ยงที่จะได้รับเมื่อบริษัท
ไม่ได้รับประโยชน์จากคลังข้อมูล ?—(เนื่องจากสร้างไม่เสร็จ) (2)จะมีความสูญเสียอะไรเกิดขึ้นบ้าง? (3) บริษัท
สูญเสียโอกาสอะไรบ้าง? และอื่นๆ จากที่กล่าวข้างต้น เราจะต้องประเมินความเสี่ยงในแง่มุมต่างๆ เพื่อให้
ทราบถึงประโยชน์ที่ซ่อนเร้นของการสร้างข้อมูล ซึ่งก็คือความสูญเสียที่อาจจะเกิดขึ้นจากการไม่มีคลังข้อมูล
นั่นเอง
Top-down and bottom-upในบทที่ 2 ได้มีการอธิบายถึงการสร้างคลังข้อมูลทั้งในแบบ top-down และ
bottom-up รวมถึงวิเคราะห์ข้อดี -ข้อเสียของแต่ละวิธี ดังนั้นเมื่อเราทราบรายละเอียดของวิธีการสร้าง
คลังข้อมูลแล้ว เราจะต้องทาการวิเคราะห์ถึงวิธีการสร้างที่เหมาะสมกับความต้องการและความจาเป็นของ
บริษัท เช่น ถ้าบริษัทมีความต้องการที่จะรีบใช้คลังข้อมูล เราควรจะสร้างคลังข้อมูลโดยใช้วิธี bottom-up ซึ่ง
จะทาการดาต้ามาร์ทแต่ละส่วนก่อนเพื่อให้ผู้บริหารหรือผู้จัดการแต่ละแผนกสามารถวิเคราะห์ข้อมูลในส่วน
นั้นๆได้ แต่ถ้าบริษัทของเราต้องการความสอดคล้องของการดาเนินธุรกิจในแต่ละส่วนงาน หรือ ต้องการข้อมูล
ที่เป็นกลุ่มก้อนเดียวกัน เราควรจะใช้วิธีการสร้างแบบ top-down ซึ่งจะทาให้ผู้สร้างเห็นภาพรวมของความ
ต้องการทั่วทั้งองค์ร สามารถวางโครงสร้างข้อมูลที่เชื่อมต่อกันได้ แต่ก็ต้องแลกกับเวลาที่เพิ่มขึ้นในการสร้าง
ข้อมูล ดังนั้ นเมื่อถึงเวลาที่เราจะต้องเลื อกวิธีในการสร้างคลั งข้อมูล เราควรจะเลื อกกลวิธีที่เหมาะสมกับ
สิ่งแวดล้อม ความต้องการ และข้อจากัดที่เรามี
Build or buyหลังจากที่มีการเริ่มการใช้คลังข้อมูลอย่างจริงมาตั้งแต่ปี 1990 จึงเป็นเหตุให้เทคโนโลยี
ทางด้านคลังข้อมูลเริ่ ม สุกงอม ในปัจ จุบัน ได้มีบริษัทมากมายได้ผลิตซอร์ฟแวร์ส าหรับสร้างข้อมูล ออกวาง
จ าหน่ าย ด้ว ยซอร์ ฟแวร์ จ านวนมากที่ว างขายอยู่ในท้องตลาด จึงทาให้ บริษัท ที่จะทาการสร้างเริ่มมีการ
ประยุกต์ใช้ ซอร์ฟแวร์ต่างๆในแต่ละขั้นตอนการทางานแทนที่จะทาการสร้างคลังข้อมูลขึ้นเองทั้งหมด เมื่อเรามี
ทางเลือกในการสร้างคลังข้อมูล อันดับแรกเราจะต้องทาการตัดสินใจว่าเราจะทาการสร้างคลังข้อมูลขึ้นเอง
หรือจะใช้ซอร์ฟแวร์สาเร็จในบางขั้นตอนการทางานหรือทั้งหมด ซึ่งเราจะต้องพิจารณาสิ่งเหล่านี้ เช่น ดาต้า
มาร์ทที่เราควรจะสร้างมีจานวนเท่าใด ดาต้ามาร์ทที่เราควรจะสร้างเองมีจานวนเท่าใด (อาจจะเกิดจากไม่
ต้องการให้ความลับลั่วไหล หรือ เหตุผลอื่นๆ) และ อื่นๆ
        ในการทางานของคลังข้อมูลจะมี ฟังก์ชันการทางานอยู่ที่ การสกัดข้อมูล การเปลี่ยนแปลง/เปลี่ยนรูป
ข้อมูล และ การถ่ายโอนข้อมูล ซึ่งจากฟังก์ชันการทางานทั้ง 3 เราจะต้องพิจารณาว่าเราจาทาการสร้างฟังก์ชัน
การท างานทั้ ง หมดขึ้ น เองหรื อ ไม่ เราจะต้ อ งการใช้ ซ อร์ ฟ แวร์ ส าเร็ จ ส าหรั บ การส่ ง ผ่ า นข้ อ มู ล ให้ กั บ ผู้ ใ ช้
(information delivery) ถ้าเราประยุกต์ใช้ซอร์ฟแวร์สาหรับฟังก์ชันการทางานต่างๆจะช่วยให้เราสามารถ
ดาเนินการได้อย่างรวดเร็วถ้าเราวางแผนและมีการจัดการที่ค่อนข้างดี ดังนั้นจากทางเลือกที่เรามีเราอาจจะทา
การสร้างฟังก์ชันการทางานขึ้นเองบางส่วนและประยุกต์ใช้ซอร์ฟแวร์บางส่วนด้วยเช่นกัน

                                                                                                                 2|Page
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
Single vendor or best-of-breedถ้าบริษัทของเราตัดสินใจที่จะใช้ซอร์ฟแวร์สาเร็จในการสร้างคลังข้อมูล
เราจะต้องทาการพิจารณาถึงข้อดีข้อเสียของแต่ละซอร์ฟแวร์ที่มีอยู่ที่ท้องตลาด เมื่อเราทราบถึงข้อดีข้อเสียของ
แต่ละซอร์ฟแวร์ที่สนับสนุนแต่ละฟังก์ ชันการทางานแล้ว เราจะต้องพิจารณาว่าเราควรจะใช้ซอร์แวร์เพียง
ซอร์ ฟแวร์ เ ดีย วจากบริ ษัทเพีย งบริ ษัทเดีย วหรื อจะใช้ห ลายซอร์ฟแวร์ จากหลายๆบริษัท โดยท าการเลื อ ก
ซอร์ฟแวร์ที่ดีที่สุดสาหรับแต่ละฟังก์ชันการทางาน ลองพิจารณาข้อดีของแต่ละทางเลือกที่เรามีดังนี้
        ประโยชน์ของการใช้ซอร์ฟแวร์เพียงซอร์ฟแวร์เดียว

             การผสมผสานระหว่างฟังก์ชันการทางานต่างๆค่อนข้างลงตัวราวกับการเชื่อมต่อของแต่ละ
              ส่วนงานนั้นไร้รอยต่อ
             การแลกเปลี่ยนข้อมูลสามารถจัดการจากส่วนกลาง
             สามารถต่อรองราคากับผู้ขายได้
         การใช้ซอร์ฟแวร์จากบริษัทเดียวจะทาให้เราผสานฟังก์ชันการทางานต่างๆได้ค่อนข้างดี แต่มีข้อเสีย
ตรงที่มีตัวเลือกของซอร์ฟแวร์ค่อนข้างน้อย อาทิเช่น IBM และ NCR ที่มีการพัฒนาซอร์ฟแวร์ที่ครบถ้วน
สมบูรณ์ จากข้อทากัดที่มีของการใช้ซอร์ฟแวร์จากบริษัทเดียว ลองพิจารณาถึงการใช้ซอร์ฟแวร์จากหลายๆ
บริษัทโดยพิจารณาถึงข้อดี-ข้อเสียของการใช้ดังนี้
        ประโยชน์ของการใช้หลายซอร์ฟแวร์

             สามารถสร้างสภาพแวดล้อมให้เหมาะสมกับองค์กรของคุณ
             เราสามารถเลือกผลิตภัณฑ์ที่เหมาะกับงานเฉพาะทางได้
          จากข้อดีของการใช้หลายซอร์ฟแวร์จะทาให้เราได้คลังข้อมูลที่สนับสนุนการทางานได้อย่างเต็มที่ แต่
ปัญหาของทางเลือกนี้จะอยู่ที่การทาให้หลายๆซอร์ฟแวร์นั้นทางานเข้ากันได้ดี ซึ่งแต่ซอร์ฟแวร์ถูกสร้างขึ้นเพื่อ
สนับสนุนแต่ละงานและยังไม่มีมาตราฐานส่วนกลาง ดังนั้นในการเชื่อต่อระหว่างซอร์ฟแวร์ให้ทางานร่วมกันอา
จะทาได้ยากหรือไม่อาจะทาได้ ดังนั้นเมื่อเราทาการเลือกซอร์ฟแวร์ต่างๆที่จะใช้แล้วเราต้องตรวจสอบให้แน่ใจ
ว่าซอร์ฟแวร์เหล่านั้นสามารถทางานร่วมกันได้ ข้อเสียอีกข้อหนึ่งของการใช้หลายซอร์ฟแวร์คืออานาจการ
ต่อรองของบริษัทกับบริษัทผู้ผลิตซอร์ฟแวร์จะลดลง ซึ่งจะทาให้เราอาจจะต้องเสียงบประมาณที่สูงขึ้น วิธีการนี้
อาจะไม่เหมาะกับบริษัทที่ไม่ต้องการเทคนิคที่มากมายนัก ดังนั้นเราควรที่จะวางแผนและประเมินถึงความ
ต้องการของบริษัทของเราเป็นอันดับแรกจากนั้นค่อยทาการตัดสินใจที่จะเลือกใช้ซอร์ฟแวร์จากความต้องการ
ที่มีอยู่

Business requirements, not technology
        ในการวางแผนสาหรับการสร้างคลั งข้อมูลเราจะต้องคาถึงความต้องการจากผู้ใช้มากกว่าเทคโนโลยี
ซึ่งในหลายๆครั้งการสร้างคลังข้อมูล ผู้สร้างมีกจะหลงลืมไปว่าคลังข้อมูลนั้นถูกสร้างขึ้นเพื่อตอบสนองความ

                                                                                             3|Page
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
ต้องการข้อมูลเชิงกลยุทธ์ของผู้ใช้ ซึ่งผู้สร้างหลายๆคนจะสนใจที่วิธีการทามากกว่าตัวข้อมูลที่ต้องการ ดังนั้นใน
การสร้าคลังข้อมูลเราไม่ควรจะทาการสร้างคลังข้อมูลทั้งที่เรายังไม่มีความเข้าใจถึงความต้องการที่แท้จริง เรา
ควรจะเริ่มจากการพิจารณาว่าในการสร้างคลังข้อมูลนั้นต้องการข้อมูลอะไรบ้าง ไม่ใช้ว่าเราจะจัดหาข้อมูลเรา
นั้นได้อย่างไร จากนั้นเราถึงพิจารณาถึงโครงสร้างของข้อมูลและสถาปัตยกรรมของคลังข้อมูลที่สนับสนุนความ
ต้องการของผู้ใช้
          ในการที่จะทราบถึงความต้องการ เราควรจะทาแบบสารวจเบื้องต้นเพื่อทราบถึงความต้องการจาก
ผู้ใช้ทุกกลุ่ม ซึ่งจะทาให้เราเข้าใจถึงการดาเนินธุรกิจมากขึ้นและทาให้เราสามารถวางแผนที่จะสร้างคลังข้อ มูล
ได้รัดกุมมากขึ้น นอกจากนี้เรายังสามารถจัดลาดับความสาคัญและกาหนดลาดับของการสร้างดาต้ามาร์ทได้อีก
ด้วย ตัวอย่างเช่น หลังจากทาแบบสารวจเบื้องต้นแล้วเราจะต้องทาการสร้างดาต้ามาร์ทสาหรับการขายสินค้า
เป็นลาดับแรก จากนั้นค่อยสร้างดาต้ามาร์ทสาหรับการเงิน และอื่นๆตามลาดับ จากตัวอย่างข้างต้น ยังมีข้อมูล
อื่นๆที่เราอาจจะได้รับจากสารวจเบื้องต้นจากผู้ใช้แต่ละกลุ่มดังนี้

       ภารกิจและหน้าที่ของผู้ใช้แต่ละกลุ่ม
       ระบบคอมพิวเตอร์ที่ใช้โดยผู้ใช้แต่ละกลุ่ม
       ตัวชี้วัดประสิทธิภาพที่สาคัญของแต่ละฟังก์ชันการทางาน
       ปัจจัยที่มีผลต่อความสาเร็จของกลุ่มผู้ใช้นั้นๆ
       ผลิตภัณฑ์ที่ผลิตหรือขาย
       หมวดหมู่ของสินค้าและบริการ
       สถานที่ธุรกิจจะดาเนินการ
       ระดับของการวัดผลประกอบการ/กาไร-ต่อลูกค้า ต่อรายการสินค้า ต่ออาณาเขต/บริเวณ
       ระดับของรายละเอียดค่าใช้จ่ายและรายได้
       คิวรีและรายสาหรับข้อมูลเชิงกลยุทธ์ที่ใช้ในปัจจุบัน
       อื่นๆ
    นอกจากเราจะทาการสารวจความต้องการจากผู้ใช้กลุ่มต่างๆแล้ว เราจะต้องทาการสารวจผุ้ดูแลระบบการ
ดาเนินการด้วย ซึ่งจะทาให้เราทราบถึงข้อมูลนั้นเก็บอยู่ที่ใด ระบบการดาเนินการมีสถาปัตยกรรมเป็นอย่างไร
ทราบถึงความสัมพันธ์ระหว่างโครงสร้างของข้อมูลและคุณภาพของข้อมูล ทราบถึงเอกสาร/คู่มือสาหรับระบบ
การดาเนินการ และอื่นๆ สิ่งเหล่านี้จะเป็นข้อมูลทั้งหมดที่เกี่ยวกับระบบการดาเนินการ ซึ่งมีส่วนช่วยในการ
วางแผนและประเมินการสร้างคลังข้อมูลด้วยเช่นกัน

Justifying your data warehouse
          ก่อนที่จะทาการสร้างคลังข้อมูลเราสามารถประมาณค่าใช้จ่ายอย่างคร่าวๆได้ ซึ่โดยส่วนใหญ่แล้ว
ค่าใช้จ่ายจะประกอบไปด้วย ฮาร์ดแวร์ 31% ซอร์ฟแวร์และฐานข้อมูล 24% การรวมฟังก์ชันการทางานต่างๆ
                                                                                               4|Page
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
เข้าด้วยกัน 35% และบริหารจัดการ 10% ซึ่งจากค่าใช้จ่ายที่ประเมินไว้ เราจะสามารถคานวณ ROI และ
ROA ได้อย่างไร การที่จะคานวณความคุ้มค่าหรือผลประโยชน์จากการใช้คลังข้อมูลนั้น ค่อนข้างทาได้ยาก
เนื่องจากเราอาจจะไม่ทราบถึงประโยชน์ที่แท้จริงจนกระทั่งทาการสร้างและนาคลังข้อมูลไปใช้อย่างเต็มที่ แต่
อย่างไรก็ตามเราจะต้องทาการวิเคราะห์เกี่ยวกับค่าใช้จ่ายและประโยชน์ที่จะได้รับก่อนทาการตัดสินใจสร้าง
คลังข้อมูลเพื่อประเมินความผลประโยชน์ที่บริษัทจะได้รับ ซึ่งเราสามารถวิเคราะห์หลายวิธี ลองพิจารณา
ตัวอย่างดังต่อไปนี้
    1. คานวณค่าใช้จ่ายเกี่ยวกับเทคโนโลยีที่มีอยู่ในปัจจุบันสาหรับสร้างแอพลิเคชันและรายงานต่างๆที่
       สนั บ สนุ น การตัดสิน ใจเชิงกลยุ ทธ์ จากนั้นทาการเปรียบเทียบค่าใช้จ่ายที่คานวณไว้กับค่าใช้จ่าย
       โดยประมาณของการสร้างคลังข้อมูลโดยทาการหาอัตราส่วนระหว่างค่าใช้จ่ายทั้งสอง
    2. คานวนมูลค่าทางธุรกิจที่จะได้รับหลังจากทาการสร้างคลังข้อมูล โดยทาการประมาณเป็นค่าเงินดอล
       ล่าร์สาหรับ ผลกาไร เงินปันผล การเติบโตของรายได้ และ ส่วนแบ่งการตลาดที่เติบโตขึ้น จากนั้นทา
       การพิจารณาถึงมูลค่าทางธุรกิจเทียบกับค่าใช้จ่ายในการสร้างคลังข้อมูล
    3. ระบุเกี่ยวกับทุกๆส่วนประกอบที่จะมีผลกระทบกับคลังข้อมูล เริ่มจากต้นทุนในส่วนต่างๆ เช่น การซื้อ
       หรือเช่าฮาร์ดแวร์ ซอร์ฟแวร์จากบริษัท ซอร์ฟแวร์ที่สร้างขึ้นเอง การดูแลรักษาคลังข้อมูล จากนั้น
       คานวณเกี่ยวกับมูลค่าทางธุรกิจที่จะได้รับซึ่งประกอบไปด้วย ค่าใช้จ่ายที่ลดลง รายได้ที่เพิ่ มขึ้น และ
       ประสิทธิภาพในการดาเนินธุรกิจ จากนั้นทาการวิเคราะห์เงินหมุนเวียนและคานวนเกี่ยวกับ ROI

The overall plan
         จากที่กล่าวมาก่อนหน้ าจะเป็ นการวางแผนหรือพิจารณาในแต่ล ะแง่มุมก่อนที่จะเริ่มทาการสร้าง
คลังข้อมูล ซึ่งการวางแผนที่ดีนั้นจะช่วยให้เห็นข้อดี -ข้อเสียของการสร้างคลังข้อมูล สร้างแรงกระตุ้นหรือแรง
บันดาลใจให้กับการทางานต่างๆ ในการวางแผนเราอาจจะมองหาทางเลือกและเหตุผลในการเลือกขั้นตอนหรือ
กระบวนการทางาน ชนิดของคลังข้อมูล และ ทาการแจงแจงความคาดหวังจากผู้ใช้ การวางแผนการสร้าง
คลังข้อมูลนั้นประกอบด้วยขั้นตอนต่างๆมากมายซึ่งเราสามารถจัดลาดับของขั้นตอนต่างๆได้ดังรูปที่ 4-1




                       รูปที่ 4-1 Overall plan for data warehousing initiative
                                                                                             5|Page
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
The data warehouse project
       การสร้างคลังข้อมูลจะมีขั้นตอนการทางานที่ค่อนข้างแตกต่างจากการสร้างระบบการดาเนินงาน ถ้า
เรามีประสบการณ์ในการสร้างระบบการดาเนินการ แต่ยังไม่มีประสบการณ์เกี่ยวกับคลังข้อมูล เราควรจะ
พิจารณาถึงความแตกต่างเหล่านั้นเพื่อให้สามารถสร้างคลังได้อย่างมีประสิทธิภาพ

How is it different?
          คลั ง ข้ อ มู ล จะมี ลั ก ษณะเฉพาะที่ แ ตกต่ า งจากระบบการด าเนิ น เการ ถ้ า เราจ าการเปรี ย บเที ย บ
คลังข้อมูล กับ ระบบการดาเนินการได้ จะช่วยให้ เราเข้าใจถึงความแตกต่างของทั้ง 2 ระบบและ เข้าใจ
คุณ ลั ก ษณะเฉพาะของคลั ง ข้อ มูล ได้ จากบทที่ 2 ท าให้ เ ราทราบถึง ส่ ว นประกอบของคลั งข้ อมู ล ที่ จ ะ
ประกอบด้วยฟังก์ชันการทางาน 3 ฟังก์ชันหลักด้วยกันคือ 1) การเก็บรวบรวมข้อมูล/การได้มาซึ่งข้อมูล (data
acquisition), 2) การจัดเก็บข้อมูล (data storage) และ 3) การส่งผ่านข้อมูลสารสนเทศให้กับผู้ใช้งาน
(information delivery) ดังนั้นเมื่อเราจะทาการเปรียบเทียบหาความแตกต่างของทั้ง 2 ระบบเราควรจะ
พิจารณาผ่านฟังก์ชันการทางานหลักทั้ง 3 ฟังก์ชันนี้ดังแสดงในรูปที่ 4-2




    รูปที่ 4-2 Differences between a data warehouse project and one on OLTP application
      หลั งจากเราทราบถึ งความแตกต่า งแล้ ว เราควรพิ จารณาถึ งผลที่ ตามมาจากความแตกต่ างเหล่ า นั้ น
เพื่อที่จะกาหนดทิศทางการทางานให้กับฟังก์ชันต่างๆ แต่ก่อ นอื่น ลองพิจารณาความแตกต่างของทั้ง 2 ระบบ
ที่มีสาคัญๆ ดังต่อไปนี้

                                                                                                  6|Page
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
    คลังข้อมูลมีขอบเขตที่กว้าง มีความซับซ้อน และ เกิดจากการรวมกันของหลายเทคโนโลยี
    คลังข้อมูลจะอนุญาติให้มีการเพิ่มชนิดของกิจกรรมใหม่ๆ
    เมตาดาต้าที่เก็บอยู่ในคลังข้อมูลนั้นมีความสาคัญมาก เราจาเป็นต้ องให้ความใส่ใจกับเมตาดาต้าเป็น
     พิเศษ
    การสร้างคลังข้อมูลมักจะนาซอร์ฟแวร์หรือเครื่องมีอที่วางจาหน่ายอยู่ตามท้องตลาดมาช่วยในการ
     สร้ า งฟั ง ก์ ชั น การท างานต่ า งๆ ดั ง นั้ น เราต้ อ งเผื่ อ เวลาไว้ ส าหรั บ การประเมิ น คุ ณ ภาพและเลื อ ก
     ซอร์ฟแวร์หรือเครื่องมือที่จะนามาประยุกต์ใช้กับคลังข้อมูล
    การสร้ า งคลั ง ข้ อ มู ล จะให้ ค วามส าคั ญ ในการสร้ า งและด าเนิ น การเกี่ ย วกั บ โครงสร้ า งพื้ น ฐาน
     (infrastructure) สถาปัตยกรรม (architecture) และการให้ความรู้แก่ ผู้ใช้ในการสร้างคิว รีและ
     รายงาน (training) ซึ่งขั้นตอนเหล่านี้อาจจะใช้เวลาค่อนข้างนาน
    คลังข้อมูลจะประยุกต์ใช้การคานวณแบบขนาน (parallel computing) กับฟังก์ชันการทางานที่
     ค่อนข้างซับซ้อน และมีภาระงานค่อนข้างมาก

Assessment of readiness
         ก่อนที่จะทาการสร้างคลังข้อมูล เราควรจะมีการประเมินความพร้อมของทีมงานที่จะทาการสร้าง
คลังข้อมูลและกลุ่มผู้ใช้งานคลังข้อมูล ซึ่งจะเป็นการประเมินความพร้อมและกาหนดเป้าหมายสาคัญที่จะช่วย
ให้หัวหน้าโปรเจค (project manager) ทราบถึงช่องว่างหรือข้อบกพร่องต่างๆของทีมงานและแผนการสร้าง
คลังข้อมูล นอกจากนี้การประเมินความพร้อมยังช่วย

      ลดความเสี่ยงของการเกิดปัญหาระหว่างการดาเนินการ
      สามารถควบคุมการแก้ปัญหาด้วยกระบวนการที่วางแผนไว้
      มีการประเมินข้อตกลงและความรับผิดชอบอีกครั้งหนึ่ง
      มีการตรวจสอบและระบุขอบเขต/ขนาดของคลังข้อมูบอืกครั้งหนึ่ง
      มีการระบุถึงปัจจัยสาคัญที่จะนาไปสู่ความสาเร็จ
      มีการตรวจสอบความคาดหวังของผู้ใช้
      มีการตรวจสอบความต้องการในการได้รับความรู้ (training)
      อื่นๆ

The life-cycle approach
        ในการสร้างระบบการดาเนินการเราจะคุ้นเคยกับกระบวนการสร้างระบบ หรือที่เรียกว่า system
development life cycle (SDLC) ซึ่งกระบวนการสร้างระบบจะเกี่ยวกับขั้นตอนการทางานต่างๆมากมาย
เช่น การวางแผน การวิเคราะห์ความต้องการ การออกแบบ การดาเนินการ และ การทดสอบระบบที่สร้างขึ้น
กระบวนการสร้างระบบจะเป็นส่วนช่วยให้การสร้างระบบนั้นเป็นไปอย่างมีลาดับเป็นขั้น เป็นตอน ลดความ

                                                                                                       7|Page
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
ซ้าซ้อนของโปรเจคและลดความกากวมของหน้าที่ของแต่ละส่วนของทีมผู้สร้างคลังข้อมูล แต่อย่างไรก็ตามในห
การสร้ างคลั งข้อมูบ ที่มีความซับ ซ้อนทั้งฟังก์ชันการทางานและการรวมกันของเทคโนโลยี เราไม่ส ามารถ
ประยุกต์ใช้กลยุทธ์หรือกระบวนการสร้างระบบปฏิบัติการอันใดอั นหนึ่งได้โดยตรง เช่นการใช้ waterfall ใน
การสร้างคลังข้อมูลเป็นต้น เราอาจจะต้องใช้วิธีที่แตกต่างไปจากเดิมที่จะสามารถเข้า กันได้ดีกับฟังก์ชันการ
ทางานต่างๆของคลังข้อมูล
          โดยส่วนใหญ่ของการสร้างคลังข้อมูลมักจะประยุกต์ใช้กระบวนการทาซ้า (iterative method) ที่จะ
ช่วยให้เราสามารถปรับแต่งฟังก์ชันการทางานต่างๆได้ ตัวอย่างเช่น ถ้าเราต้องการระบุถึงแหล่งที่มาของข้อมูล
เราอาจเริ่มจากการตรวจสอบแหล่งข้อมูลทั้งหมดและทาการแจกแจงหรือพิจารณาถึงโครงสร้างข้อมูบของ
แหล่ ง ข้อ มู ล เหล่ า นั้ น ในรอบการท างานถัด ไปจะท าการตรวจสอบองค์ป ระกอบของข้ อ มูล ที่อ ยู่ ในแต่ ล ะ
แหล่งข้อมูลกับผู้ใช้และผู้ดูแลระบบ จากนั้นททาการตรวจสอบองค์ประกอบของข้อมูลอีกครั้งหนึ่งเป็นต้น
กระบวนการทาซ้านั้นเป็นสิ่งจาเป็นสาหรับการสร้างคลังข้อมูลเนื่องจากความซับซ้อนของการทางานและ
ขอบเขตที่กว้าง ซึ่งเราอาจจาเป็นต้องมีกระบวนการในการพิจารณาหลายครั้งสาหรับฟังก์ชันการทางานต่างๆ
         เมื่อเราเลือกทีจะประยุกต์ใช้กระบวนการทาซ้าในการสร้างคลังข้อมูลแล้ว เราต้องไม่ลืมว่าฟังก์ชันการ
ทางานหลักของคลังข้อมูลประกอบด้วย การได้มาซึ่งข้อมูล การจัดเก็บข้อมูล และ การส่งผ่านข้อมูล ดังนั้นเรา
จะต้องพิจารณาว่ากระบวนการทาซ้านั้นครอบคลุมการทางานของทั้ง 3 ฟังก์ชันหรือไม่ ลองพิจารณารูปที่ 4-3
ที่แสดงถึงความสัมพันธ์ของทั้ง 3 ฟังก์ชันกับกระบวนการในการสร้างระบบ




                   รูปที่ 4-3 Date warehouse functional components and SDLC

                                                                                             8|Page
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
The development phases
        ในการกาหนดกระบวนการสร้างคลังข้ อมูล เราจะต้องแน่ใจว่าแต่ละขั้นตอนควรจะสนับสนุนฟังก์ชัน
การเก็บรวบรวมข้อมูล การจัดเก็บข้อมูล และ การส่งผ่านข้อมูล รวมถึงไม่ทางานขัดกับโครงสร้างพื้นฐานและ
สถาปัตยกรรมที่ได้ออกแบบไว้ ลองพิจารณารูปที่ 4-4 ซึ่งแสดงกระบวนการสร้างคลังข้อมูลที่ประกอบไปด้วย
การวางแผน การกาหนดความต้องการ การออกแบบฟังก์ชันการทางาน (การเก็บรวบรวมข้อมูล การจัดเก็บ
ข้อมูล และ การส่งผ่านข้อมูล) การสร้างฟังก์ชันการทางานต่างๆข้างต้น การติดตั้งระบบที่สร้างขึ้นเพื่อใช้งาน
และ การดูแลบารุงรักษาคลังข้อมูลที่สร้างขึ้น จากกระบวนการต่างๆในรูป 4-4 นั้นไม่ได้เน้นส่วนใดส่วนหนึ่ง
เป็นพิเศษและเป็นกระบวนการทางานอย่างคร่าวๆ ดังนั้นถ้าเราจะประยุกต์ใช้กระบวนการขั้นตอนวิธีดังกล่าว
เราจะต้องพิจารณาถึงสถานการณ์ที่เราพบเจออยู่ เช่น ถ้าองค์กรของเรามีปัญหาเกี่ยวกับคุณภาพของข้อมูล
เราควรจะเน้นย้าที่กระบวนการออกแบบและสร้างฟังก์ชันการเก็บรวบรวมข้อมูลเป็นพิเศษ เป็นต้น




                          รูปที่ 4-4 Data warehouse development phases

Project management considerations
         เมื่อกระบวนการพัฒนา ทดสอบ ติดตั้งและเริ่มต้นการใช้งานเสร็จสิ้น เราจะได้คลังข้อมูลที่สมบูรณ์ซึ่ง
ถือว่าเป็นความสาเร็จก้าวแรกของการสร้างคลังข้อมูล แต่ไม่ใช่ว่าทุกครั้งของการสร้างคลังข้อมูลจะประสบ
ผลสาเร็จต่อไป หลายๆครั้งโปรเจคการสร้างคลังข้อมูลจะพบกับความล้มเหลวด้วยปัญหาที่แตกต่างกันออกไป
ซึ่งความล้มเหลวอาจเกิดจากความไม่มี คุณภาพของข้อมูลหรือการเข้าถึงข้อมูลที่ไม่เหมาะสมเป็นต้น ถ้าเรามี
การจัดการโปรเจคที่ดีจะมีส่วนช่วยให้การสร้างคลังข้อมูลประสบความสาเร็จได้ ดังนั้นเราจะเป็นต้องพิจารณา


                                                                                            9|Page
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
ประเด็น เกี่ย วกับหลั กการในการจัดการโครงสร้างที่ใช้กับการสร้างคลังข้อมูลที่จะช่วยให้โครงการของ เรา
ประสบความสาเร็จได้

Guiding principles
        เมื่อเราพิจารณาถึงหลังการในการจัดการโปรเจคการสร้างคลังข้อมูล เราควรจะต้องพิจารณาหลักการ
ดังต่อไปนี้

    Sponsorship—ไม่มีโครงการใดๆในการสร้างคลังข้อมูลที่จะประสบความสาเร็จได้ โดยปราศจากการ
     สนับสนุนที่แข็งแกร่งจากผู้บริหาร
    Project manager—การสร้างคลังข้อมูลอาจประสบความล้มเหลวได้ ถ้าในการสร้างนั้นๆมีผู้จัดการ
     โปรเจคที่สนใจเทคนิคการสร้างคลังข้อมูลมากกว่าความต้องการของผู้ใช้และมากกว่ามุมมองทางธุรกิจ
    Data quality—ในการสร้างคลังข้อมูลจะมี 3 สิ่งที่สาคัญคือ คุณภาพ คุณภาพ และคุณภาพ
    User requirement—ความต้องการจากผู้ใช้จะเป็นตัวบังคับการทางานและกาหนดการของโปรเจค
    Building for growth—เมื่อมีการติดตั้งและเริ่มใช้งานคลังข้อมูลจะทาให้มีจานวนคิวรีที่ต้องเข้าถึง
     ข้อมูลในคลังข้อมูลและจานวนผู้ใช้เพิ่มขึ้นอย่างรวดเร็ว ถ้าการสร้างคลังข้อมูลไม่ไ ด้คานึงถึงจานวนคิว
     รีและจานวนผู้ใช้ที่เพิ่มขึ้นแล้วจะทาให้เกิดปัญหากับคลังข้อมูลได้
    Realistic expectation—ในการสร้างคลังข้อมูลเราจะต้องสร้างความต้องสร้างความเข้าใจให้กับผู้ใช้
     ให้คาดหวังในสิ่งที่เป็นไปได้
    Dimensional data modeling—การออกแบบแบบจาลองเชิงมิติของข้อมูล (dimension data
     model) ที่ดีเป้นสิ่งจาเป็นสาหรับการสร้างคลังข้อมูล
    External data—การใช้เพียงข้อมูลภายในองค์กรสาหรับการสร้างคลังข้อมูลนั้นไม่เพียงพอ เราจา
     เป้นต้องใช้ข้อมูลจากแหล่งข้อมูลภายนอกด้วย
    Project politic—การสร้างคลังข้อมูลอาจก่อให้ เกิดอุปสรรคต่างๆมากมาย เมื่อต้องทาการยุ่ง
     เกี่ยวกับผู้ใช้หลายกลุ่มและหลายระดับที่อาจมีความขัดแย้งกัน ดังนั้นเราควรจะต้องระมัดระวังให้มาก
     เมื่อต้องติดต่อกับบุคคลที่มีความขัดแย้งกัน
    Training—ในหลายๆครั้งผู้ใช้คลังข้อมูลจะไม่ทราบถึงวิธีการใช้คลังข้อมูล จากการไม่รู้หรือใช้ งานไม่
     เป็นอาจทาให้ผู้ใช้ไม่ยอมใช้คลังข้อมูล ดังนั้นเราควรจะมีวิธีการให้ความรู้ที่ทาให้ผู้ใช้สามารถใช้งาน
     คลังข้อมูลได้โดยง่าย

Warning signs
        เมื่อเราทาการสร้างหรือเริ่มใช้คลังข้อมูล เราควรจะต้องเฝ้าติดตามถึงสัญญาณเตือนต่างๆที่อาจจะทา
ให้เกิดความล้มเหลวขึ้นคลังข้อมูล ซึ่งเมื่อเราพบเจอสัญญาณเตือนหรือลางบอกเหตุแล้ว เราควรจะทาการ


                                                                                          10 | P a g e
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
วิเคราะห์ถึงปัญหาที่อาจจะเกิดขึ้น และทาการแก้ไขโดยเร่งด่วน ซึ่งโดยส่วนใหญ่ของการสร้างคลังข้อมูลอาจ
พบเจอลางบอกเหตุดังแสดงในรูปที่ 4-5




                       รูปที่ 4-5 Warning signs for a data warehouse project

Success factors
           เมื่อคลังข้อมูลถูกสร้างเสร็จอย่างสมบูรณ์เรายังคงไม่สามารถบอกได้ว่าการสร้างคลังข้อมูลนั้นประสบ
ความสาเร็จ แต่เราจะรู้ได้อย่างไรว่าคลังข้อมูลที่สร้างขึ้นนั้นประสบความสาเร็จหรือไม่ ? เราจะต้องตรวจสอบ
ว่าคลังข้อมูลนั้นประสบความสาเร็จจริง โดยพิ จารณาถึงสิ่งต่างๆที่สามารถบ่งบอกได้ เพื่อให้ได้คาตอบที่บ่ง
บอกว่าคลังข้อมูลที่สร้างขึ้นประสบความสาเร็จ แนวความคิดเริ่มต้ของการตรวจสอบคือการเฝ้าดู ROI ของ
คลังข้อมูลที่สร้างขึ้น ถ้าเราใช้วิธีนี้เราอาจจะต้องใช้เวลา 3 ปีหรือ 5 ปีเลยทีเดียว ดังนั้นเราอาจจะต้องหาตัว
บ่งชี้อื่นๆ ที่สามารถบ่งบอกได้ว่าการสร้างคลังข้อมูลนั้นประสบความสาเร็จโดยใช้เวลาไม่มากนัก เพื่อลดการใช้
เวลาในการวัดการประสบความสาเร็ จ เราสามารถเฝ้ าดูสิ่งต่อไปนี้เพื่อทราบถึงความส าเร็จของการสร้าง
คลังข้อมูลเบื้องต้นได้

     Queries and report—จานวนที่เพิ่มขึ้นของคิวรีและรายงานที่ถูกเรียกดูข้อมูลจากคลังข้อมูล
     Queries types—คิวรีมีความซับซ้อนมากขึ้น
     Active users—จานวนผู้ใช้ที่เพิ่มขึ้น

                                                                                             11 | P a g e
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน
     Usage—เวลาที่ผู้ใช้ทาการใช้คลังข้อมูลเพิ่มขึ้น

Anatomy of a successful project
        การตรวจสอบปัจจัยความสาเร็จของคลังข้อมึลอาจช่วยให้เราทราบถึงความสาเร็จเบื้องต้นที่ได้รับ แต่
ถ้าเราทาการวิเคราะห์ถึงรายละเอียดของสิ่งที่ทาให้การสร้างคลังข้อมูลนั้นประสบความสาเร็จอย่างแท้จริงจะ
ทาให้เราเข้าใจถึงความสาเร็ จได้ง่ายขึ้น ลองพิจารณากรณีตัว อย่างธุรกิจที่มีการสร้างคลั งข้อมูลที่ ประสบ
ความสาเร็จเป็นอย่างดี ดังแสดงในรูปที่ 4-6 ซึ่งจากรุปเราจะทราบถึงปัจจัยของความสาเร็จและประโยชน์ที่
ได้รับจากการสร้างคลังข้อมูลเพื่อสนับสนุนการดาเนินธุรกิจ




                        รูปที่ 4-6 Analysis of a successful data warehouse




                                                                                         12 | P a g e
Data Warehouse Design (การออกแบบคลังข้อมูล) โดย อ.ดร.โกเมศ อัมพวัน

				
DOCUMENT INFO
Shared By:
Categories:
Stats:
views:29
posted:10/3/2012
language:
pages:12