আমার কাছে নীচের পান্ডাস ডেটাফ্রেম রয়েছে Top15
:
আমি এমন একটি কলাম তৈরি করেছি যা প্রতি ব্যক্তি কেবলি ডকুমেন্টের সংখ্যা অনুমান করে:
Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita']
Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst']
আমি মাথাপিছু যোগ্য কাগজপত্রের সংখ্যা এবং মাথাপিছু শক্তি সরবরাহের মধ্যে পারস্পরিক সম্পর্ক জানতে চাই। সুতরাং আমি .corr()
পদ্ধতিটি (পিয়ারসনের পারস্পরিক সম্পর্ক) ব্যবহার করি :
data = Top15[['Citable docs per Capita','Energy Supply per Capita']]
correlation = data.corr(method='pearson')
আমি একটি একক নম্বর ফিরিয়ে দিতে চাই, তবে ফলাফলটি হ'ল:
.corr
সরাসরি আপনার ডেটাফ্রেমে আবেদন করেন তবে এটি সমস্ত জুটিযুক্ত সম্পর্কগুলি ফিরিয়ে দেবে; এজন্য আপনি তারপরে ম্যাট্রিক্সের তির্যকটিতে 1 টি পর্যবেক্ষণ করেন (প্রতিটি কলামই নিজেকে পুরোপুরিভাবে সংযুক্ত করে)। আমার সম্পাদনা নীচে দেখুন।