[Part 1] การใช้งาน Google colab เบื้องต้น , ติดตั้ง Environment , เตรียมข้อมูล และ วิเคราะห์ข้อมูลเบื้องต้น
[Part 2] วิเคราะห์ข้อมูล, ตั้งสมมติฐาน และเลือกโมเดล
[Part 3] แก้ไขข้อมูล และสร้างข้อมูลใหม่
[Part 4] Data visualization
[Part 5] การคัดเลือกข้อมูล จะดรอปอะไรออกไปดีนะ?
[Part 6] การทำ Labelencoder
[Part 7] เตรียมข้อมูลเพื่อ Fit model
[Part 8] Training Model
[Part 9] Training Model แบบหลายๆ Model

ผ่านมา 5 part แล้วครับ เดี๋ยว part นี้เราจะได้ใช้งาน Scikit learn กันแล้วครับ แต่ยังไม่ใช่ใช้เทรนนะครับ ฮ่าๆๆ เราจะมาทำ Labelencoder กันครับ

Labelencoder คืออะไร ?

Labelencoder คือการแปลงข้อความจาก Text ให้การเป็นตัวเลขครับ เนื่องจากการจะทำ ML นั้นต้องทำการแปลงก่อนครับ แหะๆ ตอบกำปั้นทุบดินสุดๆ

เรามาลองทำกันเลย

1. ลิสต์คอลัมน์ออกมาครับ

# Categorical boolean mask
categorical_feature_mask = df.dtypes==object
# filter categorical columns using mask and turn it into a list
categorical_cols = df.columns[categorical_feature_mask].tolist()
categorical_cols

2. ใช้ฟังก์ชัน LabelEncoder

# import labelencoder
from sklearn.preprocessing import LabelEncoder# instantiate labelencoder object
le = LabelEncoder()

3. แก้ไขข้อมูลลงตาราง

# apply le on categorical feature columns
df[categorical_cols] = df[categorical_cols].apply(lambda col: le.fit_transform(col))
df[categorical_cols].head()

ก็เป็นอันว่าเสร็จสิ้นครับ สำหรับการทำ Labelencoder จะเห็นว่าข้อมูลได้เปลี่ยนเป็นตัวเลขแล้วครับ ต่อไปเดี๋ยวเรามาทำการแบ่งข้อมูลสำหรับเทรน และเทส แล้วก็ทำ Fit Model กันครับ

[Data Sci workshop] มาลองใช้ google colab + Scikit learn วิเคราะห์โปรเจคที่จะ Success ในเว็บระดมทุน Kickstarter กันเถอะ [Part7]

สามารถเข้าไปดูไฟล์ Workshop ได้ที่นี่เลยยครับ >>>
https://colab.research.google.com/drive/1P09Xd-UKIrP_jQiDD43vdX91tGtd9JVX