প্রশ্ন ট্যাগ «beautifulsoup»

বিউটিফুল স্যুপ এইচটিএমএল / এক্সএমএল পার্স করার জন্য একটি পাইথন প্যাকেজ। এই প্যাকেজের সর্বশেষ সংস্করণটি 4 সংস্করণ, বিএস 4 হিসাবে আমদানি করা হয়েছে।

28
ইউনিকোডএকোডএরর: 'এসকিআই' কোডেক আপনি অক্ষরের এনকোড করতে পারবেন না '\ xa0' পজিশনে: সীমাবদ্ধ নয় (128)
বিভিন্ন ওয়েব পৃষ্ঠা (বিভিন্ন সাইটে) থেকে প্রাপ্ত পাঠ্য থেকে ইউনিকোড অক্ষরগুলি নিয়ে আমার সমস্যা হচ্ছে। আমি বিউটিফুলসপ ব্যবহার করছি। সমস্যাটি হ'ল ত্রুটিটি সর্বদা পুনরুত্পাদনযোগ্য হয় না; এটি কখনও কখনও কিছু পৃষ্ঠাগুলির সাথে কাজ করে এবং কখনও কখনও এটি নিক্ষেপ করে বাধা দেয় UnicodeEncodeError। আমি যা ভাবতে পারি সে সম্পর্কে কেবল …

16
শ্রেণি দ্বারা উপাদানগুলি কীভাবে সন্ধান করা যায়
বিউটিউলসাপ ব্যবহার করে "ক্লাস" অ্যাট্রিবিউট দিয়ে এইচটিএমএল উপাদানগুলি পার্স করতে আমার সমস্যা হচ্ছে। কোডটি এরকম দেখাচ্ছে soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"] == "stylelistrow"): print div স্ক্রিপ্ট শেষ হওয়ার পরে "একই" লাইনে আমি একটি ত্রুটি পেয়েছি। File "./beautifulcoding.py", line 130, in getlanguage if (div["class"] …

12
bs4.FEatureNotFound: আপনার অনুরোধ করা বৈশিষ্ট্য সহ একটি বৃক্ষ নির্মাতা খুঁজে পেলেন না: lxML। আপনার কি পার্সার লাইব্রেরি ইনস্টল করার দরকার আছে?
... soup = BeautifulSoup(html, "lxml") File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__ % ",".join(features)) bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? আমার টার্মিনালের উপরের ফলাফলগুলি। আমি ম্যাক ওএস 10.7.x এ আছি আমি পাইথন ২.7.১ পেয়েছি এবং বিউটিফুল স্যুপ …

6
ইউনিকোড এনকোড এরির: 'চারম্যাপ' কোডেক অক্ষরগুলি এনকোড করতে পারে না
আমি একটি ওয়েবসাইট স্ক্র্যাপ করার চেষ্টা করছি, তবে এটি আমাকে একটি ত্রুটি দেয়। আমি নিম্নলিখিত কোড ব্যবহার করছি: import urllib.request from bs4 import BeautifulSoup get = urllib.request.urlopen("https://www.website.com/") html = get.read() soup = BeautifulSoup(html) print(soup) এবং আমি নিম্নলিখিত ত্রুটি পাচ্ছি: File "C:\Python34\lib\encodings\cp1252.py", line 19, in encode return codecs.charmap_encode(input,self.errors,encoding_table)[0] UnicodeEncodeError: 'charmap' codec …

5
TypeError: অজগর এবং সিএসভিতে বাইট-এর মতো অবজেক্ট প্রয়োজন, 'স্ট্র' নয়
TypeError: বাইট-এর মতো অবজেক্ট প্রয়োজন, 'স্ট্র' নয় সিএসভি ফাইলে এইচটিএমএল টেবিলের ডেটা সংরক্ষণ করার জন্য পাইথন কোডের নিচে কার্যকর করার সময় ত্রুটি পেয়েছে। রাইডআপ কীভাবে পাবেন তা জানেন না p import csv import requests from bs4 import BeautifulSoup url='http://www.mapsofindia.com/districts-india/' response=requests.get(url) html=response.content soup=BeautifulSoup(html,'html.parser') table=soup.find('table', attrs={'class':'tableizer-table'}) list_of_rows=[] for row in table.findAll('tr')[1:]: list_of_cells=[] …

11
সুন্দর স্যুপ এবং আইডি দ্বারা একটি ডিভ এবং এর সামগ্রীগুলি বের করা
soup.find("tagName", { "id" : "articlebody" }) কেন এটি এর মধ্যে <div id="articlebody"> ... </div>ট্যাগ এবং স্টাফ ফেরত দেয় না ? এটি কিছুই দেয় না। এবং আমি জানি এটি একটি বাস্তবতার জন্যই আছে কারণ আমি এখান থেকে একে একে ঘুরে দেখছি soup.prettify() soup.find("div", { "id" : "articlebody" }) এছাড়াও কাজ করে …

16
পাইথন এবং বিউটিফুলসুপ ব্যবহার করে ওয়েব পৃষ্ঠা থেকে লিঙ্কগুলি পুনরুদ্ধার করুন
আমি কীভাবে কোনও ওয়েবপৃষ্ঠার লিঙ্কগুলি পুনরুদ্ধার করতে এবং পাইথন ব্যবহার করে লিঙ্কগুলির url ঠিকানাটি অনুলিপি করতে পারি?

15
আমদানি ত্রুটি: কোনও মডিউল নাম নেই বিএস 4 (বিউটিফুলসপ)
আমি পাইথনে কাজ করছি এবং ফ্লাস্ক ব্যবহার করছি। যখন আমি আমার প্রধান পাইথন ফাইলটি আমার কম্পিউটারে চালিত করি, এটি পুরোপুরি কার্যকর হয় তবে আমি যখন ভেনভকে সক্রিয় করি এবং টার্মিনালে ফ্লাস্ক পাইথন ফাইলটি চালাই, তখন এটি বলে যে আমার মূল পাইথন ফাইলটিতে "ন মডিউল নামকরণ করা বিএস 4 নেই।" কোন …

8
বিউটিফুলসৌপ এবং স্কেরিপি ক্রলারের মধ্যে পার্থক্য?
আমি এমন একটি ওয়েবসাইট তৈরি করতে চাই যা আমাজন এবং ই-বে পণ্যর দামের মধ্যে তুলনা দেখায়। এর মধ্যে কোনটি আরও ভাল কাজ করবে এবং কেন? আমি বিউটিফুলসুপের সাথে কিছুটা পরিচিত তবে স্কেরাপি ক্রলারের সাথে তেমন কিছু নেই ।

10
বিউটিউসলসপ গ্র্যাব দৃশ্যমান ওয়েবপেজ পাঠ্য
মূলত, আমি কোনও ওয়েবপৃষ্ঠায় দৃশ্যমান পাঠ্য কঠোরভাবে দখল করতে বিউটিফুলসপ ব্যবহার করতে চাই । উদাহরণস্বরূপ, এই ওয়েবপেজটি আমার পরীক্ষার কেস। এবং আমি মূলত কেবলমাত্র এখানে এবং সেখানে বডি টেক্সট (নিবন্ধ) এবং সম্ভবত কয়েকটি ট্যাব নাম পেতে চাই। আমি এই এসও প্রশ্নে পরামর্শটি চেষ্টা করেছি যা প্রচুর <script>ট্যাগ এবং এইচটিএমএল মন্তব্য …

6
বিউটিফুলসপ ব্যবহার করে কীভাবে নোডের বাচ্চাদের সন্ধান করবেন
আমি সমস্ত <a>ট্যাগগুলি পেতে চাই যা এর সন্তানের <li>: <div> <li class="test"> <a>link1</a> <ul> <li> <a>link2</a> </li> </ul> </li> </div> আমি জানি যে কীভাবে নির্দিষ্ট শ্রেণীর সাথে এই উপাদানটি পাওয়া যায়: soup.find("li", { "class" : "test" }) তবে আমি জানি না যে কীভাবে সমস্ত কিছুই অন্যের নয় <a>, তার সন্তানের …

17
স্ক্র্যাপিং: এসএসএল: http://en.wikedia.org এর জন্য CERTIFICATE_VERIFY_FAILED ত্রুটি
আমি 'পাইথনের সাথে ওয়েব স্ক্র্যাপিং' থেকে কোডটি অনুশীলন করছি এবং আমার এই শংসাপত্রের সমস্যাটি রয়েছে: from urllib.request import urlopen from bs4 import BeautifulSoup import re pages = set() def getLinks(pageUrl): global pages html = urlopen("http://en.wikipedia.org"+pageUrl) bsObj = BeautifulSoup(html) for link in bsObj.findAll("a", href=re.compile("^(/wiki/)")): if 'href' in link.attrs: if link.attrs['href'] not …

6
সুন্দরী স্যুপের সাথে একটি অ্যাট্রিবিউট মান বের করা
আমি ওয়েবপৃষ্ঠায় একটি নির্দিষ্ট "ইনপুট" ট্যাগের মধ্যে একটি একক "মান" বৈশিষ্ট্যের সামগ্রীটি বের করার চেষ্টা করছি। আমি নিম্নলিখিত কোড ব্যবহার করি: import urllib f = urllib.urlopen("http://58.68.130.147") s = f.read() f.close() from BeautifulSoup import BeautifulStoneSoup soup = BeautifulStoneSoup(s) inputTag = soup.findAll(attrs={"name" : "stainfo"}) output = inputTag['value'] print str(output) আমি একটি টাইপরর …

9
আমরা কি বিউটিফুলসপ দিয়ে এক্সপথ ব্যবহার করতে পারি?
আমি ইউআরএল স্ক্র্যাপ করতে বিউটিফুলসুপ ব্যবহার করছি এবং আমার নিম্নলিখিত কোডটি ছিল import urllib import urllib2 from BeautifulSoup import BeautifulSoup url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html" req = urllib2.Request(url) response = urllib2.urlopen(req) the_page = response.read() soup = BeautifulSoup(the_page) soup.findAll('td',attrs={'class':'empformbody'}) এখন উপরের কোডে আমরা findAllতাদের সম্পর্কিত ট্যাগ এবং তথ্য পেতে ব্যবহার করতে পারি, তবে …

7
পাইথন: বিউটিফুলসুপ - নামের অ্যাট্রিবিউটের ভিত্তিতে একটি অ্যাট্রিবিউট মানটি পান
আমি এর নামের উপর ভিত্তি করে একটি গুণাবলী মুদ্রণ করতে চাই, উদাহরণস্বরূপ নিন <META NAME="City" content="Austin"> আমি এরকম কিছু করতে চাই soup = BeautifulSoup(f) //f is some HTML containing the above meta tag for meta_tag in soup('meta'): if meta_tag['name'] == 'City': print meta_tag['content'] উপরের কোডটি একটি দেয় KeyError: 'name', আমি …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.