আমি নীচে সিআরএল ব্যবহার করে কোনও ওয়েবসাইট থেকে ইউআরএলগুলি বের করছি।
curl www.somesite.com | grep "<a href=.*title=" > new.txt
আমার new.txt ফাইলটি নীচের মতো।
<a href="http://website1.com" title="something">
<a href="http://website1.com" information="something" title="something">
<a href="http://website2.com" title="some_other_thing">
<a href="http://website2.com" information="something" title="something">
<a href="http://websitenotneeded.com" title="something NOTNEEDED">
তবে, আমাকে কেবল নীচের তথ্যগুলি বের করতে হবে।
<a href="http://website1.com" title="something">
<a href="http://website2.com" information="something" title="something">
আমি উপেক্ষা করতে চেষ্টা করছি <a href
যা আছে তথ্য তাদের মধ্যে যার সঙ্গে উপাধি শেষ NOTNEEDED ।
আমি কীভাবে আমার গ্রেপ স্টেটমেন্টটি সংশোধন করতে পারি?
আপনি যে আউটপুটটি এখানে প্রদর্শন করছেন তা কি সঠিক? এটি বর্ণনা করা পাঠ্যটি এই উদাহরণের সাথে অর্থবোধ করে না।
—
slm
আপনি খুঁজছেন না
—
টেরডন
curl www.somesite.com | grep "<a href=.*title=" | grep -v NOTNEEDED > new.txt
?
@ স্টারডন, ঠিক আমি যা খুঁজছিলাম তাই ছিল আপনি যদি এটি পোস্ট করেন তবে আমি উত্তর হিসাবে এটি গ্রহণ করতে পারি।
—
রমেশ
রমেশ, এটি মূলত @ স্ল্যামের উত্তর। আমি এটি সম্পাদনা করেছি যাতে আপনি এটি গ্রহণ করতে পারেন।
—
টেরডন
হ্যাঁ, আমি বুঝতে পারি না পাইপটি এই শক্তিশালী ছিল। আমি উত্তর হিসাবে এটি গ্রহণ করেছি। ধন্যবাদ!
—
রমেশ