利用自然数给一种特征进行数值化,比如:
有一个地区特征:[重庆,湖北,湖南]
自然数编码将其数值化则为:[0,1,2],代码example如下:
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder
地区 | 喜好 |
---|---|
重庆 | 辣 |
黑龙江 | 不辣 |
湖南 | 特辣 |
贵州 | 辣 |
fruit_data = pd.DataFrame({
'地区': ['重庆','黑龙江','湖南','贵州'],
'喜好': ['辣','不辣','特辣','辣'],
})
fruit_data[['fruit','color']]=fruit_data[['fruit','color']].apply(LabelEncoder().fit_transform)
地区 | 喜好 |
---|---|
0 | 2 |
1 | 1 |
2 | 0 |
3 | 2 |