ডেটাফ্রেম থেকে সদৃশ কলামগুলি সরানোর সহজতম উপায় কী?
আমি একটি পাঠ্য ফাইলটি পড়ছি যার মাধ্যমে নকল কলাম রয়েছে:
import pandas as pd
df=pd.read_table(fname)
কলামের নামগুলি হ'ল:
Time, Time Relative, N2, Time, Time Relative, H2, etc...
সমস্ত সময় এবং সময় সম্পর্কিত কলামগুলিতে একই ডেটা থাকে। আমি চাই:
Time, Time Relative, N2, H2
ড্রপ, মুছে ফেলা ইত্যাদিতে আমার সমস্ত প্রচেষ্টা যেমন:
df=df.T.drop_duplicates().T
অনন্য মূল্যবান সূচক ত্রুটির ফলাফল:
Reindexing only valid with uniquely valued index objects
পান্ডস নুব হওয়ার জন্য দুঃখিত কোন পরামর্শ প্রশংসা হবে.
অতিরিক্ত তথ্য
পান্ডাস সংস্করণ: 0.9.0
পাইথন সংস্করণ: 2.7.3
উইন্ডোজ 7
(পাইথোনक्सी ২.xy.৩.০ এর মাধ্যমে ইনস্টল করা)
ডেটা ফাইল (দ্রষ্টব্য: আসল ফাইলে, কলামগুলি ট্যাব দ্বারা পৃথক করা হয়, এখানে সেগুলি 4 টি স্পেস দ্বারা পৃথক করা হয়েছে):
Time Time Relative [s] N2[%] Time Time Relative [s] H2[ppm]
2/12/2013 9:20:55 AM 6.177 9.99268e+001 2/12/2013 9:20:55 AM 6.177 3.216293e-005
2/12/2013 9:21:06 AM 17.689 9.99296e+001 2/12/2013 9:21:06 AM 17.689 3.841667e-005
2/12/2013 9:21:18 AM 29.186 9.992954e+001 2/12/2013 9:21:18 AM 29.186 3.880365e-005
... etc ...
2/12/2013 2:12:44 PM 17515.269 9.991756+001 2/12/2013 2:12:44 PM 17515.269 2.800279e-005
2/12/2013 2:12:55 PM 17526.769 9.991754e+001 2/12/2013 2:12:55 PM 17526.769 2.880386e-005
2/12/2013 2:13:07 PM 17538.273 9.991797e+001 2/12/2013 2:13:07 PM 17538.273 3.131447e-005
read_tableযেমন আমি তৈরি করেছি for
import pandas as pd; pd.__version__)