আমার একটি পিসি ইন্টেল (আর) পেন্টিয়াম (আর) সিপিইউ জি 640 @ 2.80 গিগাহার্টজ এবং 8 জিবি র্যামের সাথে রয়েছে। আমি এটিতে এক্সটি 3 ফাইল সিস্টেম সহ বৈজ্ঞানিক লিনাক্স 6.5 চালাচ্ছি।
এই সেটআপে, sort -u
200 গিগাবাইট ফাইলটিতে আমি সবচেয়ে দ্রুতগতিতে কী করতে পারি ?
আমি কি ফাইলগুলি ছোট ফাইলগুলিতে (8 গিগাবাইটের চেয়ে ছোট) sort -u
বিভক্ত করব, সেগুলি একসাথে রেখে, আবার তাদের আবার আলাদা আকারে ভাগ করে নেব sort -u
, ইত্যাদি? বা এমন কোনও বাছাই করা স্ক্রিপ্ট, প্রোগ্রাম রয়েছে যা আমার সীমিত পরিমাণে র্যামের সাহায্যে এই ফাইলগুলিকে বড় আকারে পরিচালনা করতে পারে?
parallel
বেশি সরঞ্জামের চেয়ে আপনার মনে হয় এর জন্য আপনার জিএনইউ প্রয়োজন parallel
।
sort(1)
স্থান শেষ হতে পারে /tmp
; যদি তা হয় তবে আপনি পরিবেশের পরিবর্তনশীল TMPDIR
, বা পতাকা সহ অস্থায়ী ফাইলগুলির জন্য অন্য একটি অঞ্চল নির্ধারণ করতে পারেন-T=<tmpdir>
/tmp
।