প্রোগ্রামিং beautifulsoup

28

ইউনিকোডএকোডএরর: 'এসকিআই' কোডেক আপনি অক্ষরের এনকোড করতে পারবেন না '\ xa0' পজিশনে: সীমাবদ্ধ নয় (128)

বিভিন্ন ওয়েব পৃষ্ঠা (বিভিন্ন সাইটে) থেকে প্রাপ্ত পাঠ্য থেকে ইউনিকোড অক্ষরগুলি নিয়ে আমার সমস্যা হচ্ছে। আমি বিউটিফুলসপ ব্যবহার করছি। সমস্যাটি হ'ল ত্রুটিটি সর্বদা পুনরুত্পাদনযোগ্য হয় না; এটি কখনও কখনও কিছু পৃষ্ঠাগুলির সাথে কাজ করে এবং কখনও কখনও এটি নিক্ষেপ করে বাধা দেয় UnicodeEncodeError। আমি যা ভাবতে পারি সে সম্পর্কে কেবল …

1295 python unicode beautifulsoup python-2.x python-unicode

16

শ্রেণি দ্বারা উপাদানগুলি কীভাবে সন্ধান করা যায়

বিউটিউলসাপ ব্যবহার করে "ক্লাস" অ্যাট্রিবিউট দিয়ে এইচটিএমএল উপাদানগুলি পার্স করতে আমার সমস্যা হচ্ছে। কোডটি এরকম দেখাচ্ছে soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"] == "stylelistrow"): print div স্ক্রিপ্ট শেষ হওয়ার পরে "একই" লাইনে আমি একটি ত্রুটি পেয়েছি। File "./beautifulcoding.py", line 130, in getlanguage if (div["class"] …

386 python html web-scraping beautifulsoup

12

bs4.FEatureNotFound: আপনার অনুরোধ করা বৈশিষ্ট্য সহ একটি বৃক্ষ নির্মাতা খুঁজে পেলেন না: lxML। আপনার কি পার্সার লাইব্রেরি ইনস্টল করার দরকার আছে?

... soup = BeautifulSoup(html, "lxml") File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__ % ",".join(features)) bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? আমার টার্মিনালের উপরের ফলাফলগুলি। আমি ম্যাক ওএস 10.7.x এ আছি আমি পাইথন ২.7.১ পেয়েছি এবং বিউটিফুল স্যুপ …

222 python python-2.7 beautifulsoup lxml

6

ইউনিকোড এনকোড এরির: 'চারম্যাপ' কোডেক অক্ষরগুলি এনকোড করতে পারে না

আমি একটি ওয়েবসাইট স্ক্র্যাপ করার চেষ্টা করছি, তবে এটি আমাকে একটি ত্রুটি দেয়। আমি নিম্নলিখিত কোড ব্যবহার করছি: import urllib.request from bs4 import BeautifulSoup get = urllib.request.urlopen("https://www.website.com/") html = get.read() soup = BeautifulSoup(html) print(soup) এবং আমি নিম্নলিখিত ত্রুটি পাচ্ছি: File "C:\Python34\lib\encodings\cp1252.py", line 19, in encode return codecs.charmap_encode(input,self.errors,encoding_table)[0] UnicodeEncodeError: 'charmap' codec …

204 python beautifulsoup urllib

5

TypeError: অজগর এবং সিএসভিতে বাইট-এর মতো অবজেক্ট প্রয়োজন, 'স্ট্র' নয়

TypeError: বাইট-এর মতো অবজেক্ট প্রয়োজন, 'স্ট্র' নয় সিএসভি ফাইলে এইচটিএমএল টেবিলের ডেটা সংরক্ষণ করার জন্য পাইথন কোডের নিচে কার্যকর করার সময় ত্রুটি পেয়েছে। রাইডআপ কীভাবে পাবেন তা জানেন না p import csv import requests from bs4 import BeautifulSoup url='http://www.mapsofindia.com/districts-india/' response=requests.get(url) html=response.content soup=BeautifulSoup(html,'html.parser') table=soup.find('table', attrs={'class':'tableizer-table'}) list_of_rows=[] for row in table.findAll('tr')[1:]: list_of_cells=[] …

173 csv python-3.x beautifulsoup html-table

11

সুন্দর স্যুপ এবং আইডি দ্বারা একটি ডিভ এবং এর সামগ্রীগুলি বের করা

soup.find("tagName", { "id" : "articlebody" }) কেন এটি এর মধ্যে <div id="articlebody"> ... </div>ট্যাগ এবং স্টাফ ফেরত দেয় না ? এটি কিছুই দেয় না। এবং আমি জানি এটি একটি বাস্তবতার জন্যই আছে কারণ আমি এখান থেকে একে একে ঘুরে দেখছি soup.prettify() soup.find("div", { "id" : "articlebody" }) এছাড়াও কাজ করে …

147 python beautifulsoup

16

পাইথন এবং বিউটিফুলসুপ ব্যবহার করে ওয়েব পৃষ্ঠা থেকে লিঙ্কগুলি পুনরুদ্ধার করুন

আমি কীভাবে কোনও ওয়েবপৃষ্ঠার লিঙ্কগুলি পুনরুদ্ধার করতে এবং পাইথন ব্যবহার করে লিঙ্কগুলির url ঠিকানাটি অনুলিপি করতে পারি?

141 python web-scraping hyperlink beautifulsoup

15

আমদানি ত্রুটি: কোনও মডিউল নাম নেই বিএস 4 (বিউটিফুলসপ)

আমি পাইথনে কাজ করছি এবং ফ্লাস্ক ব্যবহার করছি। যখন আমি আমার প্রধান পাইথন ফাইলটি আমার কম্পিউটারে চালিত করি, এটি পুরোপুরি কার্যকর হয় তবে আমি যখন ভেনভকে সক্রিয় করি এবং টার্মিনালে ফ্লাস্ক পাইথন ফাইলটি চালাই, তখন এটি বলে যে আমার মূল পাইথন ফাইলটিতে "ন মডিউল নামকরণ করা বিএস 4 নেই।" কোন …

138 python beautifulsoup flask importerror

8

বিউটিফুলসৌপ এবং স্কেরিপি ক্রলারের মধ্যে পার্থক্য?

আমি এমন একটি ওয়েবসাইট তৈরি করতে চাই যা আমাজন এবং ই-বে পণ্যর দামের মধ্যে তুলনা দেখায়। এর মধ্যে কোনটি আরও ভাল কাজ করবে এবং কেন? আমি বিউটিফুলসুপের সাথে কিছুটা পরিচিত তবে স্কেরাপি ক্রলারের সাথে তেমন কিছু নেই ।

134 python beautifulsoup scrapy web-crawler

10

বিউটিউসলসপ গ্র্যাব দৃশ্যমান ওয়েবপেজ পাঠ্য

মূলত, আমি কোনও ওয়েবপৃষ্ঠায় দৃশ্যমান পাঠ্য কঠোরভাবে দখল করতে বিউটিফুলসপ ব্যবহার করতে চাই । উদাহরণস্বরূপ, এই ওয়েবপেজটি আমার পরীক্ষার কেস। এবং আমি মূলত কেবলমাত্র এখানে এবং সেখানে বডি টেক্সট (নিবন্ধ) এবং সম্ভবত কয়েকটি ট্যাব নাম পেতে চাই। আমি এই এসও প্রশ্নে পরামর্শটি চেষ্টা করেছি যা প্রচুর <script>ট্যাগ এবং এইচটিএমএল মন্তব্য …

124 python text beautifulsoup html-content-extraction

6

বিউটিফুলসপ ব্যবহার করে কীভাবে নোডের বাচ্চাদের সন্ধান করবেন

আমি সমস্ত <a>ট্যাগগুলি পেতে চাই যা এর সন্তানের <li>: <div> <li class="test"> <a>link1</a> <ul> <li> <a>link2</a> </li> </ul> </li> </div> আমি জানি যে কীভাবে নির্দিষ্ট শ্রেণীর সাথে এই উপাদানটি পাওয়া যায়: soup.find("li", { "class" : "test" }) তবে আমি জানি না যে কীভাবে সমস্ত কিছুই অন্যের নয় <a>, তার সন্তানের …

115 python html beautifulsoup

17

স্ক্র্যাপিং: এসএসএল: http://en.wikedia.org এর জন্য CERTIFICATE_VERIFY_FAILED ত্রুটি

আমি 'পাইথনের সাথে ওয়েব স্ক্র্যাপিং' থেকে কোডটি অনুশীলন করছি এবং আমার এই শংসাপত্রের সমস্যাটি রয়েছে: from urllib.request import urlopen from bs4 import BeautifulSoup import re pages = set() def getLinks(pageUrl): global pages html = urlopen("http://en.wikipedia.org"+pageUrl) bsObj = BeautifulSoup(html) for link in bsObj.findAll("a", href=re.compile("^(/wiki/)")): if 'href' in link.attrs: if link.attrs['href'] not …

113 python web-scraping beautifulsoup scrapy ssl-certificate

6

সুন্দরী স্যুপের সাথে একটি অ্যাট্রিবিউট মান বের করা

আমি ওয়েবপৃষ্ঠায় একটি নির্দিষ্ট "ইনপুট" ট্যাগের মধ্যে একটি একক "মান" বৈশিষ্ট্যের সামগ্রীটি বের করার চেষ্টা করছি। আমি নিম্নলিখিত কোড ব্যবহার করি: import urllib f = urllib.urlopen("http://58.68.130.147") s = f.read() f.close() from BeautifulSoup import BeautifulStoneSoup soup = BeautifulStoneSoup(s) inputTag = soup.findAll(attrs={"name" : "stainfo"}) output = inputTag['value'] print str(output) আমি একটি টাইপরর …

111 python parsing attributes beautifulsoup

9

আমরা কি বিউটিফুলসপ দিয়ে এক্সপথ ব্যবহার করতে পারি?

আমি ইউআরএল স্ক্র্যাপ করতে বিউটিফুলসুপ ব্যবহার করছি এবং আমার নিম্নলিখিত কোডটি ছিল import urllib import urllib2 from BeautifulSoup import BeautifulSoup url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html" req = urllib2.Request(url) response = urllib2.urlopen(req) the_page = response.read() soup = BeautifulSoup(the_page) soup.findAll('td',attrs={'class':'empformbody'}) এখন উপরের কোডে আমরা findAllতাদের সম্পর্কিত ট্যাগ এবং তথ্য পেতে ব্যবহার করতে পারি, তবে …

105 python xpath beautifulsoup urllib

7

পাইথন: বিউটিফুলসুপ - নামের অ্যাট্রিবিউটের ভিত্তিতে একটি অ্যাট্রিবিউট মানটি পান

আমি এর নামের উপর ভিত্তি করে একটি গুণাবলী মুদ্রণ করতে চাই, উদাহরণস্বরূপ নিন <META NAME="City" content="Austin"> আমি এরকম কিছু করতে চাই soup = BeautifulSoup(f) //f is some HTML containing the above meta tag for meta_tag in soup('meta'): if meta_tag['name'] == 'City': print meta_tag['content'] উপরের কোডটি একটি দেয় KeyError: 'name', আমি …

98 python beautifulsoup

প্রশ্ন ট্যাগ «beautifulsoup»