Algoritma Pembelajaran Mesin mengharuskan semua masukan berupa angka, jadi kita harus mengubah semua variabel kategoris kita menjadi variabel numerik dengan mengodekan kategori. Sebelum itu, pastikan Anda telah memasukkan semua nilai yang hilang di semua variabel kategoris. Kita akan menggunakan LabelEncoder yang ada di pustaka Scikit Learn untuk mengodekan dan mengubah variabel kategoris.
Pertimbangkan a Prediksi Beban dataset. Kami akan mengodekan dan mengubah semua variabel kategoris menjadi variabel numerik.
Langkah 1: Impor pustaka yang diperlukan
impor panda sebagai pd
impor numpy sebagai np
dari sklearn.preprocessing impor LabelEncoder
Langkah 2: Muat kumpulan data
kumpulan data = pd.baca_csv(“C:/prediksi_pinjaman_kereta.csv”)
Langkah 3: Enkode variabel kategoris menggunakan LabelEncoder
Variabel kategoris adalah Jenis Kelamin, Menikah, Tanggungan, Pendidikan, Wiraswasta, Luas_Properti, Status_Pinjaman. Mari kita enkode dan ubah semua variabel kategoris ini menjadi variabel numerik sekaligus menggunakan kode Python berikut.
categorical_vars = ['Jenis Kelamin','Menikah','Tanggungan','Pendidikan','Wiraswasta','Area_Properti','Status_Pinjaman']
label_encoder = LabelEncoder()
untuk i di categorical_vars:
dataset[i] = label_encoder.fit_transform(kumpulan data[i])
Sekarang, lihat tipe data variabel:
kumpulan data.tipe-d
Anda akan melihat bahwa tipe data dari semua variabel kategori telah diubah dari objek ke tipe data lain seperti int32, float64, dst. Jadi, sekarang kumpulan data kita siap untuk algoritma Machine Leaning.
terkait: Perbedaan antara Label Encoder dan One Hot Encoder
Pertimbangkan a Prediksi Beban dataset. Kami akan mengodekan dan mengubah semua variabel kategoris menjadi variabel numerik.
Langkah 1: Impor pustaka yang diperlukan
impor panda sebagai pd
impor numpy sebagai np
dari sklearn.preprocessing impor LabelEncoder
Langkah 2: Muat kumpulan data
kumpulan data = pd.baca_csv(“C:/prediksi_pinjaman_kereta.csv”)
Langkah 3: Enkode variabel kategoris menggunakan LabelEncoder
Variabel kategoris adalah Jenis Kelamin, Menikah, Tanggungan, Pendidikan, Wiraswasta, Luas_Properti, Status_Pinjaman. Mari kita enkode dan ubah semua variabel kategoris ini menjadi variabel numerik sekaligus menggunakan kode Python berikut.
categorical_vars = ['Jenis Kelamin','Menikah','Tanggungan','Pendidikan','Wiraswasta','Area_Properti','Status_Pinjaman']
label_encoder = LabelEncoder()
untuk i di categorical_vars:
dataset[i] = label_encoder.fit_transform(kumpulan data[i])
Sekarang, lihat tipe data variabel:
kumpulan data.tipe-d
Anda akan melihat bahwa tipe data dari semua variabel kategori telah diubah dari objek ke tipe data lain seperti int32, float64, dst. Jadi, sekarang kumpulan data kita siap untuk algoritma Machine Leaning.
terkait: Perbedaan antara Label Encoder dan One Hot Encoder