nilai_jumlah() Fungsi ini ada di pustaka pandas dan sangat berguna dalam langkah Data Wrangling. Fungsi ini digunakan untuk menganalisis distribusi frekuensi nilai dalam variabel dengan membuat tabel frekuensi.
nilai_jumlah() fungsi mengembalikan objek yang berisi jumlah nilai unikObjek yang dihasilkan akan berada di urutan menurun sehingga elemen pertama merupakan elemen yang paling sering muncul. Tidak termasuk nilai NA secara default.
Jadi, fungsi pandas value_counts() sangat berguna dalam memasukkan nilai yang hilang.
Pertimbangkan a Prediksi Beban dataset. Kami akan mencoba untuk mengimputasikan nilai yang hilang di Pekerja Mandiri variabel.
Langkah 1: Impor pustaka yang diperlukan
impor panda sebagai pd
impor numpy sebagai np
Langkah 2: Muat kumpulan data
kumpulan data = pd.baca_csv(“C:/prediksi_pinjaman_kereta.csv”)
kumpulan data.bentuk
Keluaran: (614, 13)
Jadi, dataset ini memiliki 614 pengamatan. Kolom Self_Employed berisi “Ya” atau “Tidak”. Mari kita lihat berapa banyak nilai yang hilang di kolom ini:
dataset[“Wiraswasta”].isnull().sum()
Keluaran: 32
Jadi, kolom ini berisi 32 observasi yang hilang (dari total 614 observasi). Sekarang mari kita gunakan pandas nilai_jumlah() fungsi untuk menghitung jumlah “Ya” dan jumlah “Tidak”.
dataset['Pekerja Mandiri'].nilai_jumlah()
Keluaran:
Tidak 500
Ya 82
Kita dapat mengamati dengan jelas bahwa dari 582 pengamatan, terdapat 500 nilai “Tidak” yang berarti sekitar 86%. Jadi jika kita dengan mudah memasukkan “Tidak” dalam 32 nilai yang hilang.
dataset['Wiraswasta'].mengisi('Tidak', inplace=Benar)
Jadi, dengan cara ini, kita dapat menggunakan value_counts untuk menghitung nilai yang hilang.
nilai_jumlah() fungsi mengembalikan objek yang berisi jumlah nilai unikObjek yang dihasilkan akan berada di urutan menurun sehingga elemen pertama merupakan elemen yang paling sering muncul. Tidak termasuk nilai NA secara default.
Jadi, fungsi pandas value_counts() sangat berguna dalam memasukkan nilai yang hilang.
Pertimbangkan a Prediksi Beban dataset. Kami akan mencoba untuk mengimputasikan nilai yang hilang di Pekerja Mandiri variabel.
Langkah 1: Impor pustaka yang diperlukan
impor panda sebagai pd
impor numpy sebagai np
Langkah 2: Muat kumpulan data
kumpulan data = pd.baca_csv(“C:/prediksi_pinjaman_kereta.csv”)
kumpulan data.bentuk
Keluaran: (614, 13)
Jadi, dataset ini memiliki 614 pengamatan. Kolom Self_Employed berisi “Ya” atau “Tidak”. Mari kita lihat berapa banyak nilai yang hilang di kolom ini:
dataset[“Wiraswasta”].isnull().sum()
Keluaran: 32
Jadi, kolom ini berisi 32 observasi yang hilang (dari total 614 observasi). Sekarang mari kita gunakan pandas nilai_jumlah() fungsi untuk menghitung jumlah “Ya” dan jumlah “Tidak”.
dataset['Pekerja Mandiri'].nilai_jumlah()
Keluaran:
Tidak 500
Ya 82
Kita dapat mengamati dengan jelas bahwa dari 582 pengamatan, terdapat 500 nilai “Tidak” yang berarti sekitar 86%. Jadi jika kita dengan mudah memasukkan “Tidak” dalam 32 nilai yang hilang.
dataset['Wiraswasta'].mengisi('Tidak', inplace=Benar)
Jadi, dengan cara ini, kita dapat menggunakan value_counts untuk menghitung nilai yang hilang.