আমি একটি পোস্টগ্র্যাসকিএল ডেটাবেজে একটি দুর্দান্ত দৈত্য ফাইল লোড করছি। এটি করার জন্য আমি প্রথমে splitফাইলটিতে ছোট ফাইল (প্রতিটি 30 জিবি) পাওয়ার জন্য ব্যবহার করি এবং তারপরে এবং প্রতিটি ব্যবহার করে ছোট ছোট ফাইলটি ডাটাবেসে লোড করি GNU Parallelএবং psql copy।
সমস্যাটি হ'ল এটি ফাইলটি বিভক্ত করতে প্রায় 7 ঘন্টা সময় নেয় এবং তারপরে এটি প্রতিটি পিছু একটি ফাইল লোড করা শুরু করে। আমার যা দরকার তা হ'ল splitস্ট্যান্ড আউটপুটে ফাইলের নাম মুদ্রণ করার সময় এটি ফাইলটি লেখার সমাপ্তি হয় যাতে আমি এটিতে পাইপ রাখতে পারি Parallelএবং এটি ফাইলটি splitলেখার সময় লোড করা শুরু করে। এটার মতো কিছু:
split -l 50000000 2011.psv carga/2011_ | parallel ./carga_postgres.sh {}
আমি splitম্যান পেজগুলি পড়েছি এবং আমি কিছুই খুঁজে পাচ্ছি না। এটি করার কোনও উপায় splitবা অন্য কোনও সরঞ্জাম রয়েছে?