Fungsi Lambda Pandas sangat berguna dalam tahap Data Wrangling. Kita akan melihat bagaimana cara menerapkan fungsi lambda pada kerangka data pandas? Terkadang, kita perlu membuat fungsi yang sangat pendek yang tidak ingin kita gunakan berkali-kali, pemberian nama pada fungsi tersebut mungkin tidak diperlukan. Jadi, daripada membuat fungsi yang lengkap, kita dapat membuat fungsi lambda saja.
Pertimbangkan a Prediksi Beban kumpulan data. Kami akan menghitung jumlah nilai yang hilang dan unik di setiap variabel dalam kumpulan data ini menggunakan fungsi lambda pandas.
Langkah 1: Impor pustaka yang diperlukan
impor panda sebagai pd
impor numpy sebagai np
Langkah 2: Muat kumpulan data
kumpulan data = pd.baca_csv(“C:/prediksi_pinjaman_kereta.csv”)
Langkah 3: Cari tahu nilai yang hilang
Untuk mengetahui semua nilai yang hilang di setiap variabel, kami menggunakan kode berikut:
kumpulan data.isnull().jumlah()
Kita juga dapat menggunakan fungsi lambda untuk mencapai hal ini. Kode di atas juga dapat ditulis seperti ini:
dataset.terapkan(lambda x: jumlah(x.isnull()))
Mari kita coba memahami fungsi lambda di atas:
lambda — ini adalah fungsi lambda
x: — nama parameter dalam fungsi
sum(x.isnull()) — apa yang harus dilakukan dengan parameter
Ini mungkin tampak aneh pada awalnya, tetapi Anda akan senang menulis fungsi lambda setelah Anda merasa nyaman dengannya. Mari kita berlatih lebih lanjut dengan satu contoh lagi. Mari kita coba cari tahu berapa banyak nilai unik yang ada di setiap variabel.
dataset.terapkan(lambda x: len(x.unique()))
Kode di atas akan menelusuri setiap variabel satu per satu dan menampilkan jumlah nilai unik di setiap kolom. Misalnya, untuk kolom “Pendidikan”, akan ditampilkan “2” karena ada dua kategori unik (Lulusan dan Bukan Lulusan).
Pertimbangkan a Prediksi Beban kumpulan data. Kami akan menghitung jumlah nilai yang hilang dan unik di setiap variabel dalam kumpulan data ini menggunakan fungsi lambda pandas.
Langkah 1: Impor pustaka yang diperlukan
impor panda sebagai pd
impor numpy sebagai np
Langkah 2: Muat kumpulan data
kumpulan data = pd.baca_csv(“C:/prediksi_pinjaman_kereta.csv”)
Langkah 3: Cari tahu nilai yang hilang
Untuk mengetahui semua nilai yang hilang di setiap variabel, kami menggunakan kode berikut:
kumpulan data.isnull().jumlah()
Kita juga dapat menggunakan fungsi lambda untuk mencapai hal ini. Kode di atas juga dapat ditulis seperti ini:
dataset.terapkan(lambda x: jumlah(x.isnull()))
Mari kita coba memahami fungsi lambda di atas:
lambda — ini adalah fungsi lambda
x: — nama parameter dalam fungsi
sum(x.isnull()) — apa yang harus dilakukan dengan parameter
Ini mungkin tampak aneh pada awalnya, tetapi Anda akan senang menulis fungsi lambda setelah Anda merasa nyaman dengannya. Mari kita berlatih lebih lanjut dengan satu contoh lagi. Mari kita coba cari tahu berapa banyak nilai unik yang ada di setiap variabel.
dataset.terapkan(lambda x: len(x.unique()))
Kode di atas akan menelusuri setiap variabel satu per satu dan menampilkan jumlah nilai unik di setiap kolom. Misalnya, untuk kolom “Pendidikan”, akan ditampilkan “2” karena ada dua kategori unik (Lulusan dan Bukan Lulusan).