การทำความสะอาดข้อมูลด้วย Data Cleansing Tool ในโปรแกรม Alteryx
ในการจัดการข้อมูล การทำ Data Cleansing (การทำความสะอาดข้อมูล) นั้น ถือเป็นขั้นตอนที่ใช้ระยะเวลานานที่สุด
19 April, 2021 by
การทำความสะอาดข้อมูลด้วย Data Cleansing Tool ในโปรแกรม Alteryx
Chinnawoot Toechamroen (Nic)
| No comments yet

 

 การทำ Data Cleansing โดยใช้เครื่องมือจากโปรแกรม Alteryx
สามารถทำได้ง่าย และช่วยประหยัดเวลาในการทำความสะอาดข้อมูลเครื่องมือที่จะนำมาแนะนำให้บทความนี้คือ Data Cleansing Tool

Data Cleansing Tool
Data Cleansing Tool เป็นเครื่องมือที่ใช้จัดการข้อมูลที่มีค่า null ด้วยการลบทิ้งทั้งแถวหรือแทนค่าด้วย 0 หรือช่องว่าง และยังใช้จัดการช่องว่าง ตัวหนังสือ ตัวเลข เครื่องหมายวรรคตอนต่างๆ รวมถึงรูปแบบตัวอักษรแบบตัวพิมพ์ใหญ่หรือตัวพิมพ์เล็กอีกด้วย

              การนำ Input Data มาเชื่อมต่อกับ Data Cleansing Tool ตัวเลือกต่างๆ ในเครื่องมือ มีดังนี้

              1. ลบแถวที่มีค่าเป็น null ทั้งหมด หรือ ลบคอลัมน์ที่มีค่าเป็น null ทั้งหมดออก
              2. เลือกคอลัมน์ที่จะทำการคลีนข้อมูล ซึ่งจะเลือกทำตัวเลือกในข้อ 3 และ ข้อ 4
              3. เลือกจัดการข้อมูลที่เลือกในข้อ 2 ได้ดังนี้
                        3.1 ลบช่องว่างข้างหน้า และข้างหลังออก
                        3.2 ลบแท็ป บรรทัดคั่นหน้า และช่องเว้นว่างที่เว้นมากกว่าหนึ่งช่องให้เหลือเพียงช่อง                    เดียว
                        3.3 ลบช่องว่างทั้งหมดออก
                        3.4 ลบตัวหนังสือทั้งหมดออก
                        3.5 ลบตัวเลขทั้งหมดออก
                        3.6 ลบเครื่องหมายวรรคตอนออก
              4. ปรับรูปแบบตัวอักษรให้เป็นตัวพิมพ์ใหญทั้งหมด ตัวพิมพ์เล็กทั้งหมด หรือตัวพิมพ์ใหญ่แค่ตัวแรก

              ตัวอย่างการใช้ Data Cleansing Tool



              จากรูปด้านบนเป็นตัวอย่างข้อมูลที่จะใช้เป็นตัวอย่าง ข้อมูลจะมีบางช่องที่มีค่า null หรือช่องว่าง ทั้งข้างหน้าหรือข้างหลังของคำ

              ตัวอย่างที่ 1
              ปลี่ยนค่า null ในคอลัมน์ Score ให้เป็นค่า 0

              ตัวอย่างที่ 2

              เปลี่ยนค่า null ในคอลัมน์ที่เลือกเป็นช่องว่าง และลบช่องว่างข้างหน้ากับข้างหลังออก จะเห็นว่าในคอลัมน์ Score จะไม่เปลี่ยนค่า null เป็นช่องว่าง เพราะตัวเลือกนั้นจะทำเฉพาะข้อมูลที่เป็น String

              ตัวอย่างที่ 3

              ในคอลัมน์ Term เปลี่ยนค่า null ในข้อมูล String เป็น ช่องว่าง และในข้อมูลตัวเลขเปลี่ยนเป็น 0, ลบช่องว่างด้านหน้าและด้านหลังออก และลบตัวหนังสือทั้งหมดออก


              ตัวอย่างที่ 4 

                       ในคอลัมน์ Region จะจัดการลบช่องว่างข้างหน้ากับข้างหลังออก และเปลี่ยนรูปแบบเป็นอักษรตัวพิมพ์ใหญ่ทั้งหมด


              การทำความสะอาดข้อมูลด้วย Data Cleansing Tool ในโปรแกรม Alteryx
              Chinnawoot Toechamroen (Nic) 19 April, 2021
              Share this post
              Archive
              Sign in to leave a comment