একটি লিনাক্স ফিল্টার আছে যা HTML এ সহজ এবং সুন্দর বিন্যাসিত পাঠ্য রূপান্তর করে?


2

আমি কার্ল আউটপুট থেকে আসছে HTML প্রতিক্রিয়া ফিল্টার করতে চাই। আমি কোন ফিল্টার প্রয়োগ করা উচিত? মধ্যরাত কমান্ডারের সাথে HTML সামগ্রীটি দেখানো কোনও সমস্যা নয়, এটি তাদেরকে সুন্দর ফর্ম্যাটেড প্লেইন পাঠ্য হিসাবে দেখায়, তাই আমি মনে করি এমন ফিল্টার রয়েছে।

উত্তর:


3

আমরা এই ফিল্টারগুলিকে "ওয়েব ব্রাউজার" বলি - একটি প্রোগ্রাম যা এইচটিএমএল কোডকে বহন করে এবং সুন্দর নথি আউটপুট করে।

লিংক কনসোল ওয়েব ব্রাউজারগুলির একটি যা লিনাক্সে চালায়।

Elinks অন্য এক।

এছাড়াও আছে W3M

আপনি সর্বদা আপনার এইচটিএমএল কোডটি টেক্সট ফাইলে অনুলিপি করতে পারেন এবং এটি ফায়ারফক্স, ক্রোম, অপেরা, ইত্যাদি মত জিআইআই ব্রাউজারে খুলতে পারেন।

অনুগ্রহ করে করনা HTML বিশ্লেষণ regex ব্যবহার করুন

সম্পাদনা । আমি বুঝতে পেরেছি আপনি আপনার এইচটিএমএলকে সুন্দর করে তুলতে এবং ট্যাগগুলির সাথে এটি দেখতে চাইতে পারেন। এই ক্ষেত্রে আপনি ব্যবহার করতে পারেন এইচটিএমএল পরিচ্ছন্ন লাইব্রেরি প্রকল্প অথবা

আপনার এইচটিএমএল টেক্সট ফাইল অনুলিপি এবং এটি দ্বারা ঘিরে <pre> </pre> ট্যাগ. তারপর আপনার ব্রাউজার দিয়ে এটি খুলুন।


+1 এর জন্য আমরা 'এই ফিল্টারগুলিকে কল করি' ওয়েব ব্রাউজার '' হা!
lornix

0

মধ্যরাত কমান্ডার "লিঙ্ক" বা "লিন্স" ব্যবহার করে। আমি যদি দেখি আপনার এমভিভিউতে এইচটিএমএল পার্স করা হয়েছে তবে আপনি তাদের মধ্যে একটি ইনস্টল করেছেন।


0

আপনি যদি আকর্ষণীয়ভাবে কার্লের এইচটিএমএল আউটপুটটি দেখতে চান তবে উপরের প্রস্তাব অনুসারে W3m, লিঙ্ক বা লিন্স যথেষ্ট।

যদি আপনি আউটপুট দিয়ে পার্স বা কিছু করতে চান তবে আমি এইচটিএমএল-এক্সএমএল-ইউটিলিটি লিনাক্স প্যাকেজ বা সুপারিশ করি সুন্দর সূপ ওয়েব স্ক্র্যাপিং যে কোন প্রকল্পের জন্য একটি খুব সহজ পাইথন প্যাকেজ যা।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.