আমার ডেটাসেটে আমার দুটি শ্রেণীবদ্ধ কলাম রয়েছে যা আমি অঙ্ক করতে চাই। দুটি কলামে উভয় দেশ রয়েছে, কিছু ওভারল্যাপ রয়েছে (উভয় কলামে প্রদর্শিত হবে)। আমি একই দেশের জন্য কলাম 1 এবং কলাম 2 তে একই সংখ্যাটি দিতে চাই।
আমার ডেটা কিছুটা মনে হচ্ছে:
import pandas as pd
d = {'col1': ['NL', 'BE', 'FR', 'BE'], 'col2': ['BE', 'NL', 'ES', 'ES']}
df = pd.DataFrame(data=d)
df
বর্তমান আমি ডেটাগুলিকে রূপান্তর করছি:
from sklearn.preprocessing import LabelEncoder
df.apply(LabelEncoder().fit_transform)
তবে এটি এফআর এবং ইএস এর মধ্যে কোনও পার্থক্য করে না। নিম্নলিখিত আউটপুটে আসতে আরও কি সহজ উপায় আছে?
o = {'col1': [2,0,1,0], 'col2': [0,2,4,4]}
output = pd.DataFrame(data=o)
output