আমার স্ট্রিংগুলি ফাইল পাথের মতো s/14/11/13/15/n7ce49B_235_25ed2d70.jpg; আমার নিদর্শনগুলি বেশ সহজ, সমস্ত পছন্দ n7ce49B_.+।
আমি চলছি GNU grep 2.6.3অধীনে ডেবিয়ান 6.0.10 তে ডেল DL360G7 : সার্ভারে (আমি এটা উল্লেখ শুধু এই মেশিন perfomance একটা ধারনা দিতে) 15k HDDs, এবং এই আদেশের সঙ্গে time LC_ALL=C grep -E -f path_to_patterns_file path_to_strings_fileখুব খারাপভাবে সার্ভার অদলবদল - শুধু সম্পূর্ণ করতে পারেন না। 20 কে নিদর্শন সহ এটি 3 ঘন্টারও বেশি সময় নেয়।
এটা আমার কাছে অযৌক্তিক বলে মনে হচ্ছে।
প্রতি মন্তব্য অনুরোধের জন্য, ফাইলগুলি রয়েছে: 20k ধরণের ফাইলের পথ
এক সাথে ইনপুট লাইন এবং নিদর্শনগুলির সংখ্যা পরীক্ষা ও সমন্বয় করতে পারে:
xxd -p /dev/urandom | fold -sw 100 | head -n 1250 |
grep -Ef <(xxd -p /dev/urandom | fold -sw 10 | head -n 20000)
grep।
xxd -p /dev/urandom | fold -sw 100 | head -n 1250 | grep -Ef <(xxd -p /dev/urandom | fold -sw 10 | head -n 20000)। দেখে মনে হচ্ছে সময়টি রেগেক্সপগুলি সংকলন করতে এবং প্রচুর স্মৃতি বরাদ্দ করতে ব্যয় করেছে। সঙ্গে -Fপরিবর্তে -E, এটা ক্ষণিক আছে।
n7ce49B_.+এটি সমান নয়n7ce49B_.
90k, বর্ণনায়20Kনিদর্শন রয়েছে