আমার একটি এইচটিএমএল ফাইল রয়েছে (নেওয়েগ থেকে) এবং তাদের এইচটিএমএল নীচের মত সংগঠিত। তাদের নির্দিষ্টকরণের টেবিলে সব ডেটা 'হল নিম্নক্রমে ' যখন প্রতিটি বিভাগে শিরোনাম 'থেকে হয় নাম। নীচে নেয়েগ পৃষ্ঠাগুলি থেকে প্রাপ্ত তথ্যের দুটি উদাহরণ রয়েছে।
<tr>
<td class="name">Brand</td>
<td class="desc">Intel</td>
</tr>
<tr>
<td class="name">Series</td>
<td class="desc">Core i5</td>
</tr>
<tr>
<td class="name">Cores</td>
<td class="desc">4</td>
</tr>
<tr>
<td class="name">Socket</td>
<td class="desc">LGA 1156</td>
<tr>
<td class="name">Brand</td>
<td class="desc">AMD</td>
</tr>
<tr>
<td class="name">Series</td>
<td class="desc">Phenom II X4</td>
</tr>
<tr>
<td class="name">Cores</td>
<td class="desc">4</td>
</tr>
<tr>
<td class="name">Socket</td>
<td class="desc">Socket AM3</td>
</tr>
শেষ পর্যন্ত আমি একটি সিপিইউ (যা ইতিমধ্যে সেট আপ করা হয়েছে) এর জন্য একটি ক্লাস রাখতে চাই যা প্রতিটি ব্র্যান্ড, সিরিজ, কোর এবং সকেট টাইপের সমন্বয়ে প্রতিটি তথ্য সংরক্ষণ করে। এটি করার বিষয়ে আমি ভাবতে পারি এই একমাত্র উপায়:
if(parsedDocument.xpath(tr/td[@class="name"])=='Brand'):
CPU.brand = parsedDocument.xpath(tr/td[@class="name"]/nextsibling?).text
এবং বাকি মানগুলির জন্য এটি করছেন। আমি কীভাবে নেক্সটিসিলিংটি সম্পন্ন করব এবং এটি করার সহজ উপায় আছে?
td[@class='name']
ভেঙে যায়। বিস্তারিত জানতে এই প্রশ্নটি দেখুন ।