আমার কাছে একটি ফাইলে প্রায় মিলিয়ন সংখ্যক লাইন রয়েছে। লাইনে আমার একটি ক্ষেত্র নামে পরিচিত transactionid
, যার পুনরাবৃত্তি মান রয়েছে। আমার যা করা দরকার তা হ'ল এগুলি স্বতন্ত্রভাবে গণনা করা।
কোনও মান কতবার পুনরাবৃত্তি করা যায় না কেন, এটি একবারে গণনা করা উচিত।
... No matter of how many times a value is repeated, it should be counted as 1. ...
cat <file_name> | awk -F"|" '{if ((substr($2,0,8)=='20120110')) print $28}' | sort -u | wc -l
যদি অনুচ্ছেদটি তারিখের অন্য চেকের জন্য মনে হয় যেমন এটি সুস্পষ্ট বলে মনে হয় :)