আমি ফোনি / ফিশিং সাইটগুলি আমাদের কোম্পানির নামের একটি বৈচিত্র ব্যবহার করার চেষ্টা করে যে কোন হাইপারলিঙ্ক সনাক্ত করতে ইনকামিং ইমেলগুলির মাধ্যমে পার্স করার জন্য একটি regex কমান্ড চালানোর চেষ্টা করছি। আমাদের কোম্পানি abcdomain হয়। মানদণ্ড হল:
- আমাদের হাইপারলিঙ্কগুলি খুঁজুন (হোস্টনাম অংশ) যা আমাদের কোম্পানির নাম 'abcdomain' ধারণ করে
- আমরা যে সমস্ত ডোমেনগুলি নিজেদের নিবন্ধন করেছি তা বাদ দিন, যেমন, myabcdomain.com, site.abcdomain.com, abcdomain.net, ইত্যাদি)
আমার regex ভাল গঠিত হয় না এবং কিছু বৈচিত্র্যের অধীনে কাজ করবেন না। সমস্যাটি সম্ভবত আমি বাদ দিয়ে যাচ্ছি। প্রথমে, আমি সত্যিই 'abcdomain.com' বাদ দেওয়ার চেষ্টা করছিলাম কিন্তু Regex যেভাবে কাজ করে বলে মনে হচ্ছে না।
- প্রশ্ন:
(http[s]?|ftp)\S*?(abcdomain|myabcdomain)(?!\.com)
- স্ট্রিং:
http://www.abcdomain.com/logo/email/abcdomain-email-logo.png
ফলাফল: এই হতে হবে ছাঁটা কিন্তু প্রশ্নটি দ্বিতীয় আবদুর রহমানের হিট
প্রশ্ন:
(http[s]?|ftp):\/\/([\dA-Za-z\.]*)(abcdomain|myabcdomain)(?!.com|..net)
- স্ট্রিং:
http://www.fakeabcdomain.com
- ফলাফল: এই হতে হবে অন্তর্ভুক্ত কিন্তু আমার বর্জন শুধুমাত্র আঘাত ফলাফল দেখায়)
শুধু আঘাত করা উচিত এবং আমার নিজের অগ্রগতি উদাহরণ প্রদর্শন করতে চেয়েছিলেন। regexr.com/3trtg
—
David Rubino
মনে হচ্ছে রেজেক্স অনুসন্ধানকে বাইপাস করার অসীম সংখ্যক উপায় হতে পারে, রেজেক্সটি কতটা সাবধানে তৈরি করা যায় তা কতই না সতর্ক। আপনার কাছে কি অন্যান্য বিকল্প আছে? আপনি প্রেরকের ভৌগোলিক আইপি অবস্থান দ্বারা ফিল্টার করতে সক্ষম হবেন, সম্ভবত হাইপারলিঙ্কটি সন্ধান করুন এবং এটি একটি অভ্যন্তরীণ (সাদা তালিকাভুক্ত) আইপি-এর সাথে সংযোগ করে কিনা তা দেখুন, হাইপারলিঙ্কটি সন্ধান করুন এবং এটি আপনার সার্ভার / ডোমেন নিয়ামক (যেমন সাজানোর মতো) লিঙ্কটি যাচাই করার জন্য একটি হ্যান্ডশেক), বা চেকের অন্য কোন ফর্ম যা আরও নিরাপদ হতে পারে। Regex আপনি ব্যবহার করার অপশন আছে সব?
—
Trenly