প্রথমে আপনার প্রকল্পে এইচটিএমএলজিটিপ্যাক নুগেট প্যাকেজটি ইনস্টল করুন ।
তারপরে, উদাহরণ হিসাবে:
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
// There are various options, set as needed
htmlDoc.OptionFixNestedTags=true;
// filePath is a path to a file containing the html
htmlDoc.Load(filePath);
// Use: htmlDoc.LoadHtml(xmlString); to load from a string (was htmlDoc.LoadXML(xmlString)
// ParseErrors is an ArrayList containing any errors from the Load statement
if (htmlDoc.ParseErrors != null && htmlDoc.ParseErrors.Count() > 0)
{
// Handle any parse errors as required
}
else
{
if (htmlDoc.DocumentNode != null)
{
HtmlAgilityPack.HtmlNode bodyNode = htmlDoc.DocumentNode.SelectSingleNode("//body");
if (bodyNode != null)
{
// Do something with bodyNode
}
}
}
(এনবি: এই কোডটি কেবল এবং কেবলমাত্র সেরা / একমাত্র পদ্ধতিরই উদাহরণ নয় it এটি নিজের প্রয়োগে অন্ধভাবে ব্যবহার করবেন না))
HtmlDocument.Load()পদ্ধতি একটি প্রবাহ যা .NET Framework অন্যান্য প্রবাহ ওরিয়েন্টেড শ্রেণীর সাথে সংহত করতে খুবই দরকারী গ্রহণ করে। যদিও HtmlEntity.DeEntitize()HTML সত্ত্বা সঠিকভাবে প্রক্রিয়াকরণের জন্য আরেকটি দরকারী পদ্ধতি। (ধন্যবাদ ম্যাথিউ)
HtmlDocumentএবং HtmlNode আপনি সর্বাধিক ব্যবহার করবেন এমন ক্লাসগুলি। এক্সএমএল পার্সারের অনুরূপ এটি সিলেক্টসনলড এবং সিলেক্ট নোড পদ্ধতিগুলি সরবরাহ করে যা এক্সপথ এক্সপ্রেশন গ্রহণ করে।
HtmlDocument.Option?????? বুলিয়ান বৈশিষ্ট্যগুলিতে মনোযোগ দিন । এইগুলি কীভাবে Loadএবং LoadXMLপদ্ধতিগুলি আপনার এইচটিএমএল / এক্সএইচটিএমএল প্রক্রিয়া করবে তা নিয়ন্ত্রণ করে।
এইচটিএমএলসিটিপিলিপ্যাক.চএম নামে একটি সংকলিত সহায়তা ফাইলও রয়েছে যা প্রতিটি বিষয়ের জন্য একটি সম্পূর্ণ রেফারেন্স রাখে। এটি সাধারণত সমাধানের বেস ফোল্ডারে থাকে।