How to.... เรียกดูรายงานขนาดใหญ่ให้เร็วขึ้น
ด้วยฟังก์ชัน ‘Extracts’

How to.... เรียกดูรายงานขนาดใหญ่ให้เร็วขึ้น ด้วยฟังก์ชัน ‘Extracts’

การใช้งาน Extract บน Tableau Server นั้น ช่วยให้การเรียกดูรายงานที่มีปริมาณข้อมูลเยอะ ๆ และหลายมุมมองนั้นใช้เวลาในการเรียกรายงานได้ไวยิ่งขึ้น

มีเหตุผลหลายอย่างที่เรายังจะใช้ Extract data ในการเชื่อมต่อข้อมูลจากหลายแหล่ง และเพื่อให้การใช้งาน Extract ข้อมูลได้เต็มศักยภาพยิ่งขึ้น วันนี้เราจะขอกล่าวถึงการ Optimization extract เพิ่มเติมจากการ Extract เดิมที่เราทำอยู่

ทำอย่างไรให้ ‘Extracts’ ช่วยเพิ่มประสิทธิภาพของรายงานของเรา

เริ่มแรก..เมื่อเราทำการเชื่อมต่อกับฐานข้อมูลเรียบร้อยแล้ว และเริ่ม Extract Data Tableau จะเริ่มใช้เทคนิคเบื้องหลังต่าง ๆ เพื่อเพิ่มประสิทธิภาพมากยิ่งขึ้น โดย Tableau จะเริ่มจากการกำหนดโครงสร้างสำหรับ Extract ไฟล์ โดยแยกคอลัมน์ที่จะใช้ให้เป็นแบบฐานข้อมูลโดยเรียงลำดับข้อมูลและบีบอัดข้อมูลที่ซ้ำ ๆ กันเข้าด้วยกันเพื่อประหยัดเนื้อที่ และซ่อน Field ที่ไม่ได้ใช้งาน

การ Aggregation ข้อมูล

2022-09-12_10-50-23.png

ขั้นถัดไป เมื่อเราสร้าง Extract บน Tableau Server จะมีตัวเลือกในการ aggregate data ให้ใช้งาน ซึ่งการใช้งานในเมนู Aggregation จะทำการยุบรวมข้อมูลเป็นการไม่ใช้ข้อมูลทุกคอลัมน์ เพื่อให้เกิดประสิทธิภาพสูงสุดในการเรียกดูข้อมูล เมื่อคลิกเลือก dimensions ต่าง ๆ เพื่อ Filter Action จะมีการตอบกลับของข้อมูล โดยผลรวมทั้งหมดจะถูกคำนวณไว้แล้ว ดังนั้น Tableau จะใช้แรงเพียงเล็กน้อย เพื่อแสดงผลลัพธ์ของข้อมูลจากสิ่งที่เลือกข้างต้น

การเลือกใช้ Filter พร้อมกับ Extract

ddd.png

ขั้นสุดท้าย การใช้ Filter พร้อมกับ Extract นั้นจะมีประโยชน์มาก ๆ ในการลดขนาดข้อมูลที่จะทำการ extract เพราะว่าการ Filter นี้จะเป็นการกำหนดว่าจะเอาข้อมูลไหนบ้างเพิ่มเข้าไปอยู่ในไฟล์ Extract ซึ่งจะมีผลต่อขนาดไฟล์และความเร็วในการใช้งาน Extract ความแตกต่างของการ Filter ข้อมูลก่อน-หลัง Extract คือ
  • ถ้า Filter ข้อมูลก่อนที่จะ Extract เนื้อข้อมูลจะไม่ถูกดึงมาด้วย จะทำให้ประหยัดพื้นที่และลดเวลาในการเรียกใช้รายงาน

  • ถ้า Filter ข้อมูลหลังจากที่ทำการ Extract แล้ว เนื้อข้อมูลจะถูกนำมาด้วย จะใช้พื้นที่ในการ Extract ทั้งชุดข้อมูลเลย แต่จะแสดงผลเฉพาะสิ่งที่ Filter ไว้เท่านั้น

การวัดประสิทธิภาพความแตกต่างกัน

หากผู้อ่านต้องการศึกษาประสิทธิภาพในการใช้งาน Tableau สามารถเรียนรู้เพิ่มเติมได้ที่ Tableau Workbook Performance Checklist

Reference: https://interworks.com/blog/dwyers/2015/05/15/tableau-performance-checklist-data-use-extracts/

ผู้เขียน

ชัยนันท์ บุตรน้ำเพชร, Data Analyst, SiData+

บรรณาธิการ

ศศินิภา อุทัยสอาด SiData+