প্রথমে আপনার প্রকল্পে এইচটিএমএলজিটিপ্যাক নুগেট প্যাকেজটি ইনস্টল করুন ।
তারপরে, উদাহরণ হিসাবে:
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
// There are various options, set as needed
htmlDoc.OptionFixNestedTags=true;
// filePath is a path to a file containing the html
htmlDoc.Load(filePath);
// Use: htmlDoc.LoadHtml(xmlString); to load from a string (was htmlDoc.LoadXML(xmlString)
// ParseErrors is an ArrayList containing any errors from the Load statement
if (htmlDoc.ParseErrors != null && htmlDoc.ParseErrors.Count() > 0)
{
// Handle any parse errors as required
}
else
{
if (htmlDoc.DocumentNode != null)
{
HtmlAgilityPack.HtmlNode bodyNode = htmlDoc.DocumentNode.SelectSingleNode("//body");
if (bodyNode != null)
{
// Do something with bodyNode
}
}
}
(এনবি: এই কোডটি কেবল এবং কেবলমাত্র সেরা / একমাত্র পদ্ধতিরই উদাহরণ নয় it এটি নিজের প্রয়োগে অন্ধভাবে ব্যবহার করবেন না))
HtmlDocument.Load()
পদ্ধতি একটি প্রবাহ যা .NET Framework অন্যান্য প্রবাহ ওরিয়েন্টেড শ্রেণীর সাথে সংহত করতে খুবই দরকারী গ্রহণ করে। যদিও HtmlEntity.DeEntitize()
HTML সত্ত্বা সঠিকভাবে প্রক্রিয়াকরণের জন্য আরেকটি দরকারী পদ্ধতি। (ধন্যবাদ ম্যাথিউ)
HtmlDocument
এবং HtmlNode
আপনি সর্বাধিক ব্যবহার করবেন এমন ক্লাসগুলি। এক্সএমএল পার্সারের অনুরূপ এটি সিলেক্টসনলড এবং সিলেক্ট নোড পদ্ধতিগুলি সরবরাহ করে যা এক্সপথ এক্সপ্রেশন গ্রহণ করে।
HtmlDocument.Option??????
বুলিয়ান বৈশিষ্ট্যগুলিতে মনোযোগ দিন । এইগুলি কীভাবে Load
এবং LoadXML
পদ্ধতিগুলি আপনার এইচটিএমএল / এক্সএইচটিএমএল প্রক্রিয়া করবে তা নিয়ন্ত্রণ করে।
এইচটিএমএলসিটিপিলিপ্যাক.চএম নামে একটি সংকলিত সহায়তা ফাইলও রয়েছে যা প্রতিটি বিষয়ের জন্য একটি সম্পূর্ণ রেফারেন্স রাখে। এটি সাধারণত সমাধানের বেস ফোল্ডারে থাকে।