পান্ডাস থেকে শুরু করে 0.20 ix হ্রাস করা হয় । সঠিক উপায় df.loc ব্যবহার করা হয়
এখানে একটি কাজের উদাহরণ
>>> import pandas as pd
>>> import numpy as np
>>> df = pd.DataFrame({"A":[0,1,0], "B":[2,0,5]}, columns=list('AB'))
>>> df.loc[df.A == 0, 'B'] = np.nan
>>> df
A B
0 0 NaN
1 1 0
2 0 NaN
>>>
ব্যাখ্যা:
এখানে ডকটিতে বর্ণিত হিসাবে , .loc
প্রাথমিকভাবে লেবেল ভিত্তিক, তবে এটি বুলিয়ান অ্যারের সাথেও ব্যবহৃত হতে পারে ।
সুতরাং, আমরা উপরে যা করছি তা প্রয়োগ করছে df.loc[row_index, column_index]
:
loc
এমন একটি মুখোশ হিসাবে বুলিয়ান অ্যারে নিতে পারে তা আবিষ্কার করে যা পান্ডগুলিকে জানিয়েছে যে সারিগুলির মধ্যে উপসেট আমরা পরিবর্তন করতে চাইrow_index
- আসলে শোষণ
loc
এছাড়াও কলাম ট্যাগ ব্যবহার নির্বাচন করতে ভিত্তিক লেবেল 'B'
মধ্যেcolumn_index
আমরা যৌক্তিক, শর্ত বা যে কোনও ক্রিয়াকলাপ ব্যবহার করতে পারি যা বুলিয়ানগুলির অ্যারে তৈরি করতে সিরিজ বুলিয়েন্সকে দেয়। উপরের উদাহরণে, আমরা rows
এমন কোনওটি চাই 0
যা এর সাথে আমরা ব্যবহার df.A == 0
করতে পারি, আপনি নীচের উদাহরণে দেখতে পারেন, এটি বুলিয়ানগুলির একটি সিরিজ দেয়।
>>> df = pd.DataFrame({"A":[0,1,0], "B":[2,0,5]}, columns=list('AB'))
>>> df
A B
0 0 2
1 1 0
2 0 5
>>> df.A == 0
0 True
1 False
2 True
Name: A, dtype: bool
>>>
তারপরে, আমরা প্রয়োজনীয় সারিগুলি নির্বাচন এবং সংশোধন করার জন্য উপরের বুলিয়ানগুলির অ্যারে ব্যবহার করি:
>>> df.loc[df.A == 0, 'B'] = np.nan
>>> df
A B
0 0 NaN
1 1 0
2 0 NaN
আরও তথ্যের জন্য এখানে উন্নত সূচক ডকুমেন্টেশন চেক করুন ।
where
দেখা গেছে নম্পপি ব্যবহার করুন