আমি উত্তর মাধ্যমে গিয়েছিলাম এই সহায়ক থ্রেড , কিন্তু আমার সমস্যা বিভিন্ন যথেষ্ট যে আমি ভাল উত্তর (অন্তত সঙ্গে মনে করতে পারেন না মনে করা হয় sed
)।
নীচের মতো দেখতে সারিগুলির সাথে আমার কাছে একটি বৃহত সিএসভি ফাইল (200+ গিগাবাইট) রয়েছে:
<alphanumerical_identifier>,<number>
যেখানে <alphanumerical_identifier>
পুরো ফাইল জুড়ে অনন্য। আমি একটি পৃথক ফাইল তৈরি করতে চাই যা প্রথম কলামকে সূচক দ্বারা প্রতিস্থাপন করে , অর্থাত্
<index>,<number>
যাতে আমরা পাই:
1, <number>
2, <number>
3, <number>
awk
মেমরিতে পুরো ফাইলটি লোড না করে একটি বর্ধমান সূচক তৈরি করতে পারে ?
যেহেতু সূচক একঘেয়েভাবে বৃদ্ধি পায়, কেবল সূচকটি বাদ দেওয়া আরও ভাল। এর সমাধান কি আলাদা হবে?, যেমন:
<number>
<number>
<number>
awk -F, '{print ++n, $2}'
কাজ করবে। বা awk -F, '{print $2}'
দ্বিতীয় প্রকরণের জন্য।
FNR
ঠিক তত ভালভাবে কাজ করবে++n