লিনাক্সে, আমার কাছে প্রচুর ফাইল সহ একটি ডিরেক্টরি রয়েছে। তাদের মধ্যে কিছুতে ASCII নন অক্ষর রয়েছে তবে তারা সমস্ত বৈধ ইউটিএফ -8 । একটি প্রোগ্রামে একটি ত্রুটি রয়েছে যা এটি ASCII নন ফাইলের সাথে কাজ করতে বাধা দেয় এবং আমাকে কতগুলি ক্ষতিগ্রস্থ হয়েছে তা খুঁজে বের করতে হবে। আমি এটি দিয়ে যাচ্ছি find
এবং তারপরে অ-এসসিআইআই অক্ষরগুলি মুদ্রণের জন্য একটি গ্রেপ করব এবং তারপরে wc -l
নম্বরটি সন্ধানের জন্য একটি করণীয় করব । এটি গ্রেপ হতে হবে না; আমি যে কোনও মানক ইউনিক্স নিয়মিত প্রকাশ করতে পারি , যেমন পার্ল , সেড , এডাব্লুকে ইত্যাদি
তবে, 'এমন কোনও চরিত্র যা ASCII চরিত্র নয়' এর জন্য নিয়মিত প্রকাশ আছে?
/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F-\x9F]