আমার কাছে একটি স্ট্রিং রয়েছে যা দেখতে এমন দেখাচ্ছে:
6Â 918Â 417Â 712
এই স্ট্রিংটি ছাঁটাই করার পরিষ্কার কাট উপায়টি (যেমন আমি পাইথন বুঝি) স্ট্রিংটি একটি ভেরিয়েবলের মধ্যে কেবল বলা হয় s
, আমরা পাই:
s.replace('Â ', '')
কৌতুক করা উচিত। তবে অবশ্যই এটি অভিযোগ করে যে '\xc2'
ফাইল ব্লাবলা.পি -তে নন-এএসসিআইআই চরিত্রটি এনকোড করা হয়নি।
আমি কখনই বুঝতে পারি না কীভাবে বিভিন্ন এনকোডিংয়ের মধ্যে স্যুইচ করতে হয়।
এখানে কোডটি দেওয়া আছে, এটি সত্যিই উপরের মতো একই, তবে এখন এটি প্রসঙ্গে। নোটপ্যাডে ফাইলটি ইউটিএফ -8 হিসাবে সংরক্ষিত হয়েছে এবং নিম্নলিখিত শিরোনামটি রয়েছে:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
কোড:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
এটি আর s.replace
...
u