Competency ทักษะที่จำเป็นในการทำงานด้านข้อมูล
ตลอดสายข้อมูลตั้งแต่ต้นน้ำ Data Sources สู่ปลายน้ำ End Points
จากบทความ เครื่องมือที่ศิริราชใช้ในการจัดการข้อมูล ศูนย์ SiData+ จึงต้องมีทักษะต่าง ๆ ที่จำเป็นในการพัฒนาการทำงานตลอดสายข้อมูลตั้งแต่ต้นน้ำ Data Sources สู่ปลายน้ำ End Points
รายการ Competency
ในภาพแสดงตัวอย่างทักษะด้านข้อมูลบางส่วน (non-exhaustive) โดยแบ่งคร่าว ๆ ตาม phase การทำงานกับข้อมูล
Sources
- Data Domain Expertise ความเข้าใจข้อมูลแต่ละแหล่ง แต่ละด้าน เช่น Clinical, Lab, ยา, การเงินการคลัง, พัสดุ, HR เป็นต้น
- Stakeholder Collaboration ทักษะการทำงานร่วมกับผู้เกี่ยวข้อง เช่น Data Owner, Business Users, IT เป็นต้น
- Databases ทั้ง SQL, NoSQL ความเข้าใจและทักษะการใช้ฐานข้อมูลรูปแบบต่าง ๆ
Ingestion & Transport
- Data Pipeline (Extract, Load, Orchestration) ทักษะการขนข้อมูลในระยะต่าง ๆ
- Batch Processing ทักษะการขนข้อมูลแบบรายครั้ง
- Stream Processing ทักษะการขนข้อมูลแบบต่อเนื่อง
- Version Control (Git) ทักษะการควบคุมเวอร์ชันโปรแกรมที่พัฒนาขึ้น เพื่อการพัฒนาร่วมกันอย่างเป็นระบบ
Storage
- Data Lake
- Data Warehouse (Data Modelling) ทักษะการจัดโครงสร้างข้อมูลใน Data Warehouse
- DB Performance & Security ทักษะการปรับ Tune Performance และ Security
Transformation
- SQL
- Stakeholder Understanding ทักษะการทำความเข้าใจผู้เกี่ยวข้องและสามารถต่อยอดได้
- Data Lineage
Analytics Workflows
- Maths & Statistics
- Value Creation
Descriptive Analytics
- BI (Tableau)
- Data Communication ทักษะการสื่อสารข้อมูลให้ผู้รับสารเข้าใจ
Predictive Analytics
- Data Science (Machine Learning & Artificial Intelligence)
- Python
- R
End Points
- Software Development ทักษะการพัฒนาโปรแกรม
- Production & Maintenance ทักษะการนำโปรแกรมไปใช้งาน Production และดูแล
- ML Engineering ทักษะการนำ ML ไปใช้งานกับ end users
Data Governance
- Metadata Management ทักษะการจัดการคำอธิบายชุดข้อมูล
- Data Quality and Integrity ทักษะการจัดการคุณภาพและความสมบูรณ์ของข้อมูล
- Data Security and Privacy ทักษะการจัดการความปลอดภัยและความเป็นส่วนตัวของข้อมูล
- Data Laws and Related Laws ความรู้ด้านกฎหมายข้อมูลและกฎหมายอื่นที่เกี่ยวข้อง
Competency แยกตามตำแหน่ง
หากลองแบ่ง Competency ข้างต้น ตามตำแหน่งต่าง ๆ ให้สอดคล้องกับหน้าที่ที่รับผิดชอบ จะได้ดังภาพต่อไปนี้
ระดับความเข้มสี แสดงความจำเป็น ต่อตำแหน่งนั้น ๆ
Data Governance Officer
Data Engineer
Analytics Engineer
Data Analyst
Data Scientist
ML Engineer
แนะนำแหล่งศึกษาเพิ่มเติม