পান্ডাস থেকে শুরু করে 0.20 ix হ্রাস করা হয় । সঠিক উপায় df.loc ব্যবহার করা হয়
এখানে একটি কাজের উদাহরণ
>>> import pandas as pd
>>> import numpy as np
>>> df = pd.DataFrame({"A":[0,1,0], "B":[2,0,5]}, columns=list('AB'))
>>> df.loc[df.A == 0, 'B'] = np.nan
>>> df
A B
0 0 NaN
1 1 0
2 0 NaN
>>>
ব্যাখ্যা:
এখানে ডকটিতে বর্ণিত হিসাবে , .loc প্রাথমিকভাবে লেবেল ভিত্তিক, তবে এটি বুলিয়ান অ্যারের সাথেও ব্যবহৃত হতে পারে ।
সুতরাং, আমরা উপরে যা করছি তা প্রয়োগ করছে df.loc[row_index, column_index]:
locএমন একটি মুখোশ হিসাবে বুলিয়ান অ্যারে নিতে পারে তা আবিষ্কার করে যা পান্ডগুলিকে জানিয়েছে যে সারিগুলির মধ্যে উপসেট আমরা পরিবর্তন করতে চাইrow_index
- আসলে শোষণ
locএছাড়াও কলাম ট্যাগ ব্যবহার নির্বাচন করতে ভিত্তিক লেবেল 'B'মধ্যেcolumn_index
আমরা যৌক্তিক, শর্ত বা যে কোনও ক্রিয়াকলাপ ব্যবহার করতে পারি যা বুলিয়ানগুলির অ্যারে তৈরি করতে সিরিজ বুলিয়েন্সকে দেয়। উপরের উদাহরণে, আমরা rowsএমন কোনওটি চাই 0যা এর সাথে আমরা ব্যবহার df.A == 0করতে পারি, আপনি নীচের উদাহরণে দেখতে পারেন, এটি বুলিয়ানগুলির একটি সিরিজ দেয়।
>>> df = pd.DataFrame({"A":[0,1,0], "B":[2,0,5]}, columns=list('AB'))
>>> df
A B
0 0 2
1 1 0
2 0 5
>>> df.A == 0
0 True
1 False
2 True
Name: A, dtype: bool
>>>
তারপরে, আমরা প্রয়োজনীয় সারিগুলি নির্বাচন এবং সংশোধন করার জন্য উপরের বুলিয়ানগুলির অ্যারে ব্যবহার করি:
>>> df.loc[df.A == 0, 'B'] = np.nan
>>> df
A B
0 0 NaN
1 1 0
2 0 NaN
আরও তথ্যের জন্য এখানে উন্নত সূচক ডকুমেন্টেশন চেক করুন ।
whereদেখা গেছে নম্পপি ব্যবহার করুন