আমার স্ট্রিংগুলি ফাইল পাথের মতো s/14/11/13/15/n7ce49B_235_25ed2d70.jpg
; আমার নিদর্শনগুলি বেশ সহজ, সমস্ত পছন্দ n7ce49B_.+
।
আমি চলছি GNU grep 2.6.3
অধীনে ডেবিয়ান 6.0.10 তে ডেল DL360G7 : সার্ভারে (আমি এটা উল্লেখ শুধু এই মেশিন perfomance একটা ধারনা দিতে) 15k HDDs, এবং এই আদেশের সঙ্গে time LC_ALL=C grep -E -f path_to_patterns_file path_to_strings_file
খুব খারাপভাবে সার্ভার অদলবদল - শুধু সম্পূর্ণ করতে পারেন না। 20 কে নিদর্শন সহ এটি 3 ঘন্টারও বেশি সময় নেয়।
এটা আমার কাছে অযৌক্তিক বলে মনে হচ্ছে।
প্রতি মন্তব্য অনুরোধের জন্য, ফাইলগুলি রয়েছে: 20k ধরণের ফাইলের পথ
এক সাথে ইনপুট লাইন এবং নিদর্শনগুলির সংখ্যা পরীক্ষা ও সমন্বয় করতে পারে:
xxd -p /dev/urandom | fold -sw 100 | head -n 1250 |
grep -Ef <(xxd -p /dev/urandom | fold -sw 10 | head -n 20000)
grep
।
xxd -p /dev/urandom | fold -sw 100 | head -n 1250 | grep -Ef <(xxd -p /dev/urandom | fold -sw 10 | head -n 20000)
। দেখে মনে হচ্ছে সময়টি রেগেক্সপগুলি সংকলন করতে এবং প্রচুর স্মৃতি বরাদ্দ করতে ব্যয় করেছে। সঙ্গে -F
পরিবর্তে -E
, এটা ক্ষণিক আছে।
n7ce49B_.+
এটি সমান নয়n7ce49B_.
90k
, বর্ণনায়20K
নিদর্শন রয়েছে