Tabel Frekuensi menampilkan frekuensi kemunculan setiap kategori dalam suatu fitur. Ini memberikan informasi yang sangat berguna saat menganalisis variabel kategori. Pustaka Pandas menyediakan nilai_jumlah berfungsi untuk ini.
Pertimbangkan a Prediksi Beban dataset. Kami akan mencoba mencari tahu frekuensi kemunculan setiap kategori di semua variabel.
Langkah 1: Impor pustaka yang diperlukan
impor panda sebagai pd
impor numpy sebagai np
Langkah 2: Muat kumpulan data
kumpulan data = pd.baca_csv(“C:/prediksi_pinjaman_kereta.csv”)
Langkah 3: Temukan tipe data semua variabel
kumpulan data.info()
kumpulan data.dtypes
Kami menemukan bahwa kolom Loan_ID, Gender, Married, Dependents, Education, Self_Employed bertipe objek (variabel kategorikal).
Langkah 4: Gambar Tabel Frekuensi
#Temukan semua variabel kategori
categorical_columns = [x untuk x dalam dataset.dtypes.index jika dataset.dtypes[x]=='object']
#Kecualikan kolom Load_ID
categorical_columns = [x untuk x di categorical_columns jika x tidak di ['Loan_ID']]
#Frekuensi cetak kategori
untuk kolom di categorical_columns:
print('nFrekuensi Kategori untuk variabel %s'%col)
cetak(dataset[kolom].nilai_jumlah())
Pertimbangkan a Prediksi Beban dataset. Kami akan mencoba mencari tahu frekuensi kemunculan setiap kategori di semua variabel.
Langkah 1: Impor pustaka yang diperlukan
impor panda sebagai pd
impor numpy sebagai np
Langkah 2: Muat kumpulan data
kumpulan data = pd.baca_csv(“C:/prediksi_pinjaman_kereta.csv”)
Langkah 3: Temukan tipe data semua variabel
kumpulan data.info()
kumpulan data.dtypes
Kami menemukan bahwa kolom Loan_ID, Gender, Married, Dependents, Education, Self_Employed bertipe objek (variabel kategorikal).
Langkah 4: Gambar Tabel Frekuensi
#Temukan semua variabel kategori
categorical_columns = [x untuk x dalam dataset.dtypes.index jika dataset.dtypes[x]=='object']
#Kecualikan kolom Load_ID
categorical_columns = [x untuk x di categorical_columns jika x tidak di ['Loan_ID']]
#Frekuensi cetak kategori
untuk kolom di categorical_columns:
print('nFrekuensi Kategori untuk variabel %s'%col)
cetak(dataset[kolom].nilai_jumlah())
Jalankan kode di atas dan amati hasilnya. Kode ini menampilkan frekuensi semua variabel kategori (berapa kali kategori tertentu muncul dalam suatu fitur).
Mirip: Bagaimana cara menggunakan fungsi pandas value_counts() untuk menghitung nilai yang hilang?