'Utf-8' এ এনকোডিংয়ের সমস্যা থাকলে এবং সেল দিয়ে সেল যেতে চাইলে আপনি নিম্নলিখিত কিছু চেষ্টা করতে পারেন।
পাইথন 2
(যেখানে "df" আপনার ডেটাফ্রেম অবজেক্ট object
for column in df.columns:
for idx in df[column].index:
x = df.get_value(idx,column)
try:
x = unicode(x.encode('utf-8','ignore'),errors ='ignore') if type(x) == unicode else unicode(str(x),errors='ignore')
df.set_value(idx,column,x)
except Exception:
print 'encoding error: {0} {1}'.format(idx,column)
df.set_value(idx,column,'')
continue
তারপরে চেষ্টা করুন:
df.to_csv(file_name)
আপনি কলামগুলির এনকোডিং এটি দ্বারা পরীক্ষা করতে পারেন:
for column in df.columns:
print '{0} {1}'.format(str(type(df[column][0])),str(column))
সতর্কতা: ত্রুটিগুলি = 'উপেক্ষা' কেবল অক্ষরটিকে বাদ দেবে যেমন
IN: unicode('Regenexx\xae',errors='ignore')
OUT: u'Regenexx'
পাইথন ঘ
for column in df.columns:
for idx in df[column].index:
x = df.get_value(idx,column)
try:
x = x if type(x) == str else str(x).encode('utf-8','ignore').decode('utf-8','ignore')
df.set_value(idx,column,x)
except Exception:
print('encoding error: {0} {1}'.format(idx,column))
df.set_value(idx,column,'')
continue
index=False
সূচক ড্রপ যোগ করতে হবে ।