লিনাক্সে, আমার কাছে প্রচুর ফাইল সহ একটি ডিরেক্টরি রয়েছে। তাদের মধ্যে কিছুতে ASCII নন অক্ষর রয়েছে তবে তারা সমস্ত বৈধ ইউটিএফ -8 । একটি প্রোগ্রামে একটি ত্রুটি রয়েছে যা এটি ASCII নন ফাইলের সাথে কাজ করতে বাধা দেয় এবং আমাকে কতগুলি ক্ষতিগ্রস্থ হয়েছে তা খুঁজে বের করতে হবে। আমি এটি দিয়ে যাচ্ছি findএবং তারপরে অ-এসসিআইআই অক্ষরগুলি মুদ্রণের জন্য একটি গ্রেপ করব এবং তারপরে wc -lনম্বরটি সন্ধানের জন্য একটি করণীয় করব । এটি গ্রেপ হতে হবে না; আমি যে কোনও মানক ইউনিক্স নিয়মিত প্রকাশ করতে পারি , যেমন পার্ল , সেড , এডাব্লুকে ইত্যাদি
তবে, 'এমন কোনও চরিত্র যা ASCII চরিত্র নয়' এর জন্য নিয়মিত প্রকাশ আছে?
/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F-\x9F]