আমি পাইথনের জন্য এইচটিএমএল পার্সার মডিউলটি সন্ধান করছি যা পাইথন তালিকাগুলি / অভিধান / অবজেক্টের আকারে ট্যাগ পেতে আমাকে সহায়তা করতে পারে।
আমার কাছে যদি ফর্মটির একটি নথি থাকে:
<html>
<head>Heading</head>
<body attr1='val1'>
<div class='container'>
<div id='class'>Something here</div>
<div>Something else</div>
</div>
</body>
</html>
তারপর এটা আমার নাম বা HTML ট্যাগের আইডি মাধ্যমে নেস্টেড ট্যাগ অ্যাক্সেস করতে যাতে আমি মূলত এটা জিজ্ঞাসা আমাকে সামগ্রী / টেক্সট পেতে পারেন একটি উপায় দিতে হবে div
সঙ্গে ট্যাগ class='container'
মধ্যে অন্তর্ভুক্ত body
ট্যাগ, বা অনুরূপ কিছু।
আপনি যদি ফায়ারফক্সের "পরিদর্শন উপাদান" বৈশিষ্ট্যটি (HTML দেখুন) ব্যবহার করেছেন তবে আপনি জানতে পারবেন এটি আপনাকে গাছের মতো সুন্দর নেস্টেড পদ্ধতিতে সমস্ত ট্যাগ দেয়।
আমি একটি অন্তর্নির্মিত মডিউল পছন্দ করি তবে এটি হয়ত খুব বেশি জিজ্ঞাসা করবে।
আমি স্ট্যাক ওভারফ্লো এবং ইন্টারনেটে কয়েকটি ব্লগ নিয়ে প্রচুর প্রশ্ন দিয়েছি এবং তাদের মধ্যে বেশিরভাগই বিউটিফুলসপ বা এলএক্সএমএল বা এইচটিএমএল পার্সারের পরামর্শ দিচ্ছেন তবে এর কয়েকটি কার্যকারিতা এবং এটিকে বিতর্ক হিসাবে শেষ করা হয়েছে কোনটি দ্রুত / আরও কার্যকর ent