আমি একটি পোস্টগ্র্যাসকিএল ডেটাবেজে একটি দুর্দান্ত দৈত্য ফাইল লোড করছি। এটি করার জন্য আমি প্রথমে split
ফাইলটিতে ছোট ফাইল (প্রতিটি 30 জিবি) পাওয়ার জন্য ব্যবহার করি এবং তারপরে এবং প্রতিটি ব্যবহার করে ছোট ছোট ফাইলটি ডাটাবেসে লোড করি GNU Parallel
এবং psql copy
।
সমস্যাটি হ'ল এটি ফাইলটি বিভক্ত করতে প্রায় 7 ঘন্টা সময় নেয় এবং তারপরে এটি প্রতিটি পিছু একটি ফাইল লোড করা শুরু করে। আমার যা দরকার তা হ'ল split
স্ট্যান্ড আউটপুটে ফাইলের নাম মুদ্রণ করার সময় এটি ফাইলটি লেখার সমাপ্তি হয় যাতে আমি এটিতে পাইপ রাখতে পারি Parallel
এবং এটি ফাইলটি split
লেখার সময় লোড করা শুরু করে। এটার মতো কিছু:
split -l 50000000 2011.psv carga/2011_ | parallel ./carga_postgres.sh {}
আমি split
ম্যান পেজগুলি পড়েছি এবং আমি কিছুই খুঁজে পাচ্ছি না। এটি করার কোনও উপায় split
বা অন্য কোনও সরঞ্জাম রয়েছে?