আমি একটি ডিএফের একটি কলাম অন্য ডিএফ এর সাথে তুলনা করতে চাই। কলামগুলি নাম এবং শেষ নাম। আমি যাচাই করতে চাই যে একটি ডেটা ফ্রেমের কোনও ব্যক্তি অন্য একটিতে আছে কিনা।
আমি একটি ডিএফের একটি কলাম অন্য ডিএফ এর সাথে তুলনা করতে চাই। কলামগুলি নাম এবং শেষ নাম। আমি যাচাই করতে চাই যে একটি ডেটা ফ্রেমের কোনও ব্যক্তি অন্য একটিতে আছে কিনা।
উত্তর:
আপনি যদি একটি নির্দিষ্ট কলামে সমান মানগুলি পরীক্ষা করতে চান তবে নামটি বলুন আপনি দুটি ডেফ্রেমকে একটি নতুনতে মার্জ করতে পারেন:
mergedStuff = pd.merge(df1, df2, on=['Name'], how='inner')
mergedStuff.head()
আমি মনে করি এটি যদি আরও where
বড় ডেটা সেট করে থাকে তবে এটি আরও কার্যকর এবং দ্রুত
দুটি পৃথক কলামে মানগুলির তুলনা করা
সেট ব্যবহার করে প্রতিটি কলামে অনন্য মান পাবেন। এই দুটি সেটের ছেদটি উভয় কলামে অনন্য মান প্রদান করবে।
উদাহরণ:
df1 = pd.DataFrame({'c1': [1, 4, 7], 'c2': [2, 5, 1], 'c3': [3, 1, 1]})
df2 = pd.DataFrame({'c4': [1, 4, 7], 'c2': [3, 5, 2], 'c3': [3, 7, 5]})
set(df1['c2']).intersection(set(df2['c2']))
আউটপুট:
{2, 5}
দুটি ডেটাফ্রেমের কলামের নাম তুলনা করা
আপনি যদি দুটি ডেটাফ্রেমের কলামের নাম তুলনা করার চেষ্টা করছেন তবে:
যদি df1
এবং df2
দুটি ডেটা ফ্রেম হয়:
set(df1.columns).intersection(set(df2.columns))
এটি উভয় ডেটাফ্রেমে থাকা অনন্য কলামের নাম সরবরাহ করবে।
উদাহরণ:
df1 = pd.DataFrame({'c1': [1, 4, 7], 'c2': [2, 5, 1], 'c3': [3, 1, 1]})
df2 = pd.DataFrame({'c4': [1, 4, 7], 'c2': [3, 5, 2], 'c3': [3, 7, 5]})
set(df1.columns).intersection(set(df2.columns))
আউটপুট:
{'c2', 'c3'}