আপনি এখানে সফ্টওয়্যারটির একটি অংশ লিখতে পারেন:
- নিয়মিত অভিব্যক্তি থেকে কীওয়ার্ডগুলি নিন;
- গুগল কীওয়ার্ড এবং ফলাফলের একটি তালিকা পান;
- প্রতিটি ফলাফলযুক্ত ইউআরআই ক্রল করুন এবং এটি সম্পূর্ণ নিয়মিত অভিব্যক্তি দিয়ে ফিল্টার করুন।
আসুন একটি কেস অধ্যয়ন করুন: থেকে site:gog.com
স্প্যানিশ ভয়েস-ওভার থাকা সমস্ত গেমগুলি সন্ধান করুন।
নিয়মিত প্রকাশটি হ'ল:
Audio[^:]*:[^.,]*Spanish
এটি মিলবে, উদাহরণস্বরূপ:
Audio lanuage: English, German, Spanish, French.
এবং মেলে না:
Audio language: only-English. Text language: Spanish.
পদক্ষেপ ১. আপনার সফ্টওয়্যারটিকে এটি গুগলে অনুসন্ধান করতে দিন:
site:gog.com audio Spanish inurl:game
inurl:game
এখানে কেবল গেমের বর্ণনা পৃষ্ঠায় অনুসন্ধান করা
পদক্ষেপ 2. 300 টির ফলে প্রাপ্ত লিঙ্কগুলি পান এবং সেগুলির প্রত্যেকটিতে ক্রল করুন।
পদক্ষেপ 3. প্রদত্ত নিয়মিত অভিব্যক্তি দিয়ে ফলাফল ফিল্টার করুন:
Audio[^:]*:[^.,]*Spanish
এটি নির্মাণ করা সহজ হওয়া উচিত। আসলে আমি বুঝতে পারছি না যে আমি ইতিমধ্যে সেভাবে তৈরি এমন কিছু কেন পাই না।
যেহেতু অনুসন্ধান ইঞ্জিনগুলি নিয়মিত অভিব্যক্তি দিয়ে তাদের ডেটা স্ক্যান করার জন্য সংস্থানটি বহন করতে পারে না, তাই এই নোংরা কাজটি আপনার পক্ষ থেকে পড়ে এবং আপনার কম্পিউটারটি সার্চ ইঞ্জিনগুলি ইতিমধ্যে সরবরাহ করে যা তা করা উচিত।