วันพุธที่ 19 มกราคม พ.ศ. 2554

DATA WAREHOUSE PROCESS&BUSINESS INTELLIGENCE




 
Data Warehouse (คลังข้อมูล) คือ ฐานข้อมูลขององค์กร หรือหน่วยงานหนึ่งๆ ซึ่งทำหน้าที่เก็บรวบรวมข้อมูลจากฐานข้อมูลที่เป็นระบบงานประจำวันขององค์กร (Operation Database) และฐานข้อมูลอื่นภายนอกองค์กร (External Database) ข้อมูลที่ถูกจัดเก็บในคลังข้อมูลนั้นจะเป็นข้อมูลที่ผ่านการวิเคราะห์ ซึ่งมีวัตถุประสงค์เพื่อนำมาใช้งาน โดยสามารถเรียกใช้ข้อมูลย้อนหลังได้ โดยจะไม่มีการเปลี่ยนแปลงข้อมูลใดๆ แต่อาจปรับเพื่อความเหมาะสมก่อนที่จะนำไปเก็บในคลัง และมักจัดเก็บเฉพาะข้อมูลที่จำเป็นต่อการใช้งานเพื่อการตัดสินใจหรือใช้ในการวิเคราะห์ข้อมูลที่ถูกต้องและมีประสิทธิภาพ โดยการวิเคราะห์ต้องทำได้แบบหลายมิติ (Multidimensional Analysis) ข้อมูลในคลังข้อมูลนี้จะถูกนำมาใช้เพื่อสนับสนุนการตัดสินใจบริหารงานของผู้บริหาร

เป้าหมายของการสร้างData Warehouse
คือ การแยกกลุ่มสารสนเทศที่ใช้ในการวิเคราะห์ทางธุรกิจออกจากฐานข้อมูลที่ใช้งานประจำวัน ให้เกิดประสิทธิภาพสูงสุด และทำให้การเรียกใช้ข้อมูลทำได้อย่างยืดหยุ่น และรวดเร็วมากยิ่งขึ้น ผู้บริหารสามารถเรียกข้อมูลรายละเอียดที่จำเป็นมาช่วยในการตัดสินใจทางธุรกิจได้อย่างแม่นยำขึ้น

 ประโยชน์ของการสร้างData Warehouse
1.สามารถนำข้อมูลมาใช้ได้อย่างรวดเร็วและถูกต้อง
2.ทำการรวบรวมข้อมูลที่มีความซับซ้อนให้ง่ายต่อการจัดเก็บ
    3.ช่วยเสริมสร้างความรู้ของบุคลากร และสนับสนุนการตัดสินใจให้เกิดประสิทธิภาพ
        4.สร้างความได้เปรียบในการแข่งขันและปรับปรุงกระบวนการทางธุรกิจให้มีความรวดเร็วขึ้น

คุณสมบัติของData Warehouse

  •       Organization : คลังข้อมูลจะถูกสร้างจากหัวข้อหลักทางธุรกิจที่เน้นเนื้อหาที่สนใจ เช่น ลูกค้า ผลิตภัณฑ์ ยอดขาย ซึ่งข้อมูลเหล่านี้เป็นข้อมูลที่ต้องการจัดเก็บเพื่อใช้ในการสนับสนุนการตัดสินใจ
  •        Consistency : ข้อมูลจากแหล่งต่างๆที่รวมรวมมาไว้ในคลังข้อมูลจะต้องทีคุณสมบัติที่เหมือนกัน รูปแบบเดียวกัน และสอดคล้องกัน
  •        Time Variant : ข้อมูลที่จัดเก็บในคลังข้อมูลจะต้องเป็นข้อมูลที่จัดเก็บโดยกำหนดช่วงเวลาเอาไว้ (Timing) โดยจะสัมพันธ์กับการดำเนินธุรกิจของหน่วยธุรกิจนั้น เพราะการตัดสินใจด้านการบริหารจำเป็นต้องมีข้อมูลเปรียบเทียบในแต่ละช่วงเวลา
  •    Non-volatile : ข้อมูลในคลังข้อมูลจะไม่เปลี่ยนแปลง ไม่ว่าจะเป็นการเพิ่มเติมข้อมูลใหม่ หรือการปรับปรุงแก้ไข ผู้ใช้จะสามารถทำได้เพียงเรียกใช้งานเท่านั้น
  •        Relational : การรวบรวมข้อมูลจากหลายฐานข้อมูลปฏิบัติการเข้าด้วยกัน และทำให้ข้อมูลมีมาตราฐานเดียวกัน เช่นกำหนดให้มีค่าตัวแปรของข้อมูลในเนื้อหาเดียวกัน และให้เป็นแบบเดียวกันทั้งหมด
  •         Client/Server : การรวบรวมข้อมูลที่เกิดขึ้นในระดับปฏิบัติการมาไว้ที่ศูนย์กลางเดียวกัน เพื่อให้ผู้ใช้สะดวกในการเข้าถึง

Data Warehouse Architecture (DWA)

      Operational Database หรือExternal Database ทำหน้าที่ในการจัดการข้อมูลในระบบงานปฏิบัติการ หรือแหล่งข้อมูล
        ภายนอกองค์กร
      Data Staging (ETL) คือ การสกัดข้อมูล โดยในขั้นตอนนี้จะเป็นการตรวจสอบและแก้ไขจุดบกพร่อง เพื่อให้ข้อมูลมีความถูก
        ต้อง โดยในขั้นตอนนี้ประกอบด้วย
-Extract : การคัดเลือกข้อมูล
-Clean : การตรวจสอบและแก้ไขข้อมูล
-Transform : การแปรรูปข้อมูล
-Load : การรวมข้อมูลหลาย ๆฐานเข้าด้วยกัน
Data Warehouse ทำหน้าที่เป็นแหล่งเก็บข้อมูล ซึ่งทำให้ข้อมูลอยู่ในรูปแบบที่ง่ายแก่การเข้าถึงและยืดหยุ่นได้
Meta Data ทำหน้าที่ อธิบายข้อมูลที่อยู่ในคลังข้อมูล เพื่อให้เข้าใจข้อมูลได้ง่ายขึ้น
Data Mart คือ คลังข้อมูลที่มีขนาดเล็กถูกออกแบบมาเพื่อใช้ในหน่วย ธุรกิจเชิงกลยุทธ์ (strategic business unit, SBU) หรือในแผนกหนึ่ง ๆ เป็นส่วนย่อยของ Data Warehouse เปรียบเสมือนคลังข้อมูลขนาดเล็กที่มีลักษณะเฉพาะ มีขนาดของข้อมูลและค่าใช้จ่ายต่ำ ซึ่งประกอบด้วย
-  Replicated (dependent) data marts คือกลุ่มย่อยขนาดเล็ก(small subset)หลาย ๆ กลุ่มของคลังข้อมูล ซึ่งก็คือการคัดลอกกลุ่มย่อยบางกลุ่มในคลังข้อมูล มาไว้ใน ตลาดข้อมูลเล็กๆ หลายๆ อัน แต่ละอันจะใช้เฉพาะ functional area ที่แน่นอน หนึ่ง ๆ เท่านั้น
-  Stand-alone data marts บริษัทสามารถมีตลาดข้อมูลเพียงหนึ่งหรือมากกว่าก็ได้ และเป็นอิสระจากกันโดยไม่จำเป็นต้องมีคลังข้อมูล การใช้ data mart ส่วนมาก ได้แก่ ฝ่ายการตลาด ฝ่ายบัญชี ฝ่ายที่ประยุกต์ใช้ในงานวิศวกรรม
Data Cube คือ ฐานข้อมูลหลายมิติ (Multidimensional Database) หรือเรียกอีกอย่างว่า OLAP  คือ เทคโนโลยีที่ใช้ข้อมูลจากคลังข้อมูล เพื่อนำไปใช้ในการวิเคราะห์และตัดสินใจทางธุรกิจอย่างมีประสิทธิภาพสามารถค้นหาคำตอบที่ต้องการ และสามารถแก้ปัญหาที่มีความซับซ้อนโดยใช้ระยะเวลาสั้น ๆ การวิเคราะห์การประมวลผลแบบออนไลน์ (On-Line Analytical Processing) หรือ OLAP เป็นกระบวนการประมวลผลข้อมูลที่ทำให้ผู้ใช้สามารถเลือกดูข้อมูลจากจุดการมองที่แตกต่างกันได้ง่าย เริ่มต้นจากการสรุปรวมข้อมูล ก่อนที่จะกระทำการสร้างรายงานและการสร้างแผนภูมิจากข้อมูลที่เลือก กระบวนการนี้ข้อมูลจะถูกเก็บในรูปแบบอะเรย์หลายมิติหรือที่เรียกง่าย ๆ ว่า Data Cube เพื่อให้การค้นหาข้อมูลมีประสิทธิภาพมากขึ้น นอกจากนี้ยังมีความสามารถในการบริหาร จัดการ วิเคราะห์ข้อมูลได้อย่างรวดเร็ว มีความถูกต้อง ตอบสนองการเข้าถึงข้อมูลได้หลาย ๆ มุมมองและเข้ามามีส่วนช่วยในการวิเคราะห์ข้อมูล เพื่อใช้ในการปรับปรุงกระบวนการทางธุรกิจ ด้วยความสามารถในการวิเคราะห์ที่ซับซ้อน อันได้แก่ การเจาะลึก (Drill-down) ไปถึงรายละเอียดในระดับทรานแซกชัน (Transaction) ผู้ใช้งานสามารถใช้งานข้อมูลตาม Cube ที่ถูกกำหนดไว้ (Cube คือ โมเดลข้อมูลของการวิเคราะห์การประมวลแบบออนไลน์ ซึ่งเป็นโครงสร้างหลายมิติ หรือ Multidimensional Structureเปรียบเสมือนกับรูปลูกบาศก์ที่มีมุมมองหลากหลาย แต่ละมุมมองทำให้เกิดการคิวรีข้อมูลจากคลังข้อมูลได้หลากหลายแบบ)

 *****************************************************************************

Business Intelligence
        คือ ซอฟต์แวร์ที่นำเข้าข้อมูลที่มีอยู่เพื่อจัดทำรายงานในรูปแบบต่างๆ ที่เหมาะสมกับมุมมองในการวิเคราะห์ แสดงความสัมพันธ์ และทำนายผลลัพธ์ของแนวโน้มที่อาจเกิดขึ้นได้ ตรงตามความต้องการขององค์กร เพื่อประโยชน์ในการวางแผนกลยุทธ์ด้านต่างๆ  เช่น การวิเคราะห์การดำเนินงานของบริษัทเพื่อการตัดสินใจของผู้บริหาร วิเคราะห์และวางแผนการขาย เป็นต้น
Business Intelligence จะประกอบไปด้วยระบบข้อมูล และโปรแกรมแอพพลิเคชั่น ด้านการวิเคราะห์ มากมายหลายระบบ เช่น Data Warehouse, Data Mart, Data Mining เป็นต้น

จุดเด่น Business Intelligence 
- ใช้งานง่ายเพียงแค่คลิกเมาส์ก็สามารถเปลี่ยนแปลงรายงานได้โดยไม่ต้องมีการคีย์ข้อมูลใหม่ ซึ่งผู้ใช้สามารถถาม ตอบคำถามทางธุรกิจได้หลายมุมมองเพียงในเวลาไม่กี่นาที ซึ่งช่วยการตัดสินใจแม่นยำ และรวดเร็วกว่าคู่แข่ง ทั้งในเชิงกว้าง และเชิงลึก
- สามารถดึงข้อมูลจากฐานข้อมูลที่หลากหลายภายในองค์กรมาทำการวิเคราะห์ เช่น Excel, FoxPro, Dbase, Access, ORACLE, SQL Server, Informix, Progress, DB2 เป็นต้น โดยไม่มีการเขียนโปรแกรมเพิ่มเติมใดๆ

ปัญหาที่พบบ่อยในการใช้ Business Intelligence 
- ไม่สามารถเชื่อมข้อมูลจากทุกส่วนได้ภายในระบบเดียวกัน เช่น ต้อง export ข้อมูลออกจากฐานข้อมูลก่อน จึงจะมาสร้าง Dashboard, Forecasting (พยากรณ์ข้อมูล) ได้
- องค์กรส่วนใหญ่ไม่สามารถใช้งานในส่วน Analytics (การวิเคราะห์ข้อมูล) ได้อย่างคุ้มค่า เช่น บางระบบไม่สามารถ forecast ผลลัพธ์ได้ หรือ บางระบบ forecast ผลลัพธ์เชิงปริมาณแบบเส้นตรงเท่านั้น หรือ บางระบบไม่สามารถวิเคราะห์หาความสัมพันธ์ระหว่างตัวแปรต่างๆ หรือทำแบบจำลองเพื่อตัดสินใจได้ (Simulation for Decision)
- องค์กรขนาดใหญ่บางแห่ง อาจใช้เวลาในการติดตั้งระบบ (Implementation) นานหลายปี และต้องใช้เวลาอีกระดับหนึ่งกว่า user ของแผนกต่างๆ จะใช้งานได้คล่องแคล่ว
- การอัพเกรดระบบจากระบบเดิมอาจทำได้ยาก เช่น Data Warehouse เดิม ไม่รองรับ Business Intelligence ใหม่
- พนักงาน IT ขององค์กรขาดความรู้ความเข้าใจในเชิง Business, Management
- ค่าใช้จ่ายสูงมาก ทำให้องค์กรธุรกิจเล็กๆ หรือหน่วยงานที่มีงบไม่สูงนัก ขาดโอกาสในการจัดซื้อ






















ไม่มีความคิดเห็น:

แสดงความคิดเห็น