আমি একটি ডিএফের একটি কলাম অন্য ডিএফ এর সাথে তুলনা করতে চাই। কলামগুলি নাম এবং শেষ নাম। আমি যাচাই করতে চাই যে একটি ডেটা ফ্রেমের কোনও ব্যক্তি অন্য একটিতে আছে কিনা।
আমি একটি ডিএফের একটি কলাম অন্য ডিএফ এর সাথে তুলনা করতে চাই। কলামগুলি নাম এবং শেষ নাম। আমি যাচাই করতে চাই যে একটি ডেটা ফ্রেমের কোনও ব্যক্তি অন্য একটিতে আছে কিনা।
উত্তর:
আপনি যদি একটি নির্দিষ্ট কলামে সমান মানগুলি পরীক্ষা করতে চান তবে নামটি বলুন আপনি দুটি ডেফ্রেমকে একটি নতুনতে মার্জ করতে পারেন:
mergedStuff = pd.merge(df1, df2, on=['Name'], how='inner')
mergedStuff.head()
আমি মনে করি এটি যদি আরও whereবড় ডেটা সেট করে থাকে তবে এটি আরও কার্যকর এবং দ্রুত
দুটি পৃথক কলামে মানগুলির তুলনা করা
সেট ব্যবহার করে প্রতিটি কলামে অনন্য মান পাবেন। এই দুটি সেটের ছেদটি উভয় কলামে অনন্য মান প্রদান করবে।
উদাহরণ:
df1 = pd.DataFrame({'c1': [1, 4, 7], 'c2': [2, 5, 1], 'c3': [3, 1, 1]})
df2 = pd.DataFrame({'c4': [1, 4, 7], 'c2': [3, 5, 2], 'c3': [3, 7, 5]})
set(df1['c2']).intersection(set(df2['c2']))
আউটপুট:
{2, 5}
দুটি ডেটাফ্রেমের কলামের নাম তুলনা করা
আপনি যদি দুটি ডেটাফ্রেমের কলামের নাম তুলনা করার চেষ্টা করছেন তবে:
যদি df1এবং df2দুটি ডেটা ফ্রেম হয়:
set(df1.columns).intersection(set(df2.columns))
এটি উভয় ডেটাফ্রেমে থাকা অনন্য কলামের নাম সরবরাহ করবে।
উদাহরণ:
df1 = pd.DataFrame({'c1': [1, 4, 7], 'c2': [2, 5, 1], 'c3': [3, 1, 1]})
df2 = pd.DataFrame({'c4': [1, 4, 7], 'c2': [3, 5, 2], 'c3': [3, 7, 5]})
set(df1.columns).intersection(set(df2.columns))
আউটপুট:
{'c2', 'c3'}