ডেভ স্ন্যাপশটের জন্য কেবল টেবিলের কিছু অংশের ডাম্প পোস্টগ্র্যাগ করে

Question 1

উত্পাদনে আমাদের ডাটাবেসটি কয়েকশ গিগাবাইট আকারে। বিকাশ এবং পরীক্ষার জন্য, আমাদের এই ডাটাবেসের স্ন্যাপশট তৈরি করতে হবে যা কার্যকরীভাবে সমতুল্য, তবে আকারগুলি কেবল 10 বা 20 জিগ।

চ্যালেঞ্জটি হ'ল আমাদের ব্যবসায়িক সত্তাগুলির ডেটা অনেকগুলি টেবিল জুড়ে ছড়িয়ে রয়েছে। আমরা কোনও ধরণের ফিল্টারযুক্ত স্ন্যাপশট তৈরি করতে চাই যাতে ডাম্পের মধ্যে কেবলমাত্র কয়েকটি সত্তা অন্তর্ভুক্ত থাকে। এইভাবে আমরা দেব এবং পরীক্ষার জন্য প্রতিমাস বা ততোধিক স্ন্যাপশট পেতে পারি।

উদাহরণস্বরূপ, আসুন আমরা বলি যে আমাদের সত্ত্বা রয়েছে যার অনেকগুলি থেকে বহু সম্পর্ক রয়েছে:

সংস্থার এন বিভাগ রয়েছে
বিভাগে এন কর্মচারী রয়েছে
কর্মচারীর এন উপস্থিতির রেকর্ড রয়েছে

সম্ভবত 1000 টি সংস্থা, 2500 বিভাগ, 175000 কর্মচারী এবং কয়েক মিলিয়ন উপস্থিতির রেকর্ড রয়েছে। প্রথম ১০০ টি সংস্থা এবং এর সমস্ত উপাদান বিভাগ, কর্মচারী এবং উপস্থিতি রেকর্ডটি টানতে, বলার জন্য আমরা একটি প্রতিরূপযোগ্য উপায় চাই ।

আমরা বর্তমানে স্কিমাটির জন্য পিজি_ডাম্প ব্যবহার করি এবং তারপরে ছোট টেবিলগুলি থেকে সমস্ত ডেটা বের করার জন্য - ডিজিবল-ট্রিগার এবং --ডাটা-দিয়ে pg_dump চালাই run আমরা ডেটার অংশটি টেনে আনতে কাস্টম স্ক্রিপ্টগুলি লিখতে চাই না কারণ আমাদের দ্রুত বিকাশ চক্র রয়েছে এবং কাস্টম স্ক্রিপ্টগুলি ভঙ্গুর হবে এবং সম্ভবত তার মেয়াদ শেষ হওয়ার সম্ভাবনা রয়েছে।

এটা আমরা কিভাবে করতে পারি? এমন কি তৃতীয় পক্ষের সরঞ্জাম রয়েছে যা ডাটাবেস থেকে যৌক্তিক পার্টিশনগুলি টানতে সহায়তা করতে পারে? এই সরঞ্জামগুলি কী বলা হয়?

কোন সাধারণ পরামর্শও প্রশংসা!

Question 2

আপনার বড় টেবিলগুলিতে আপনি উপগ্রহগুলি বের করতে কপি আদেশটি ব্যবহার করতে পারেন ...

COPY (SELECT * FROM mytable WHERE ...) TO '/tmp/myfile.tsv'

COPY mytable FROM 'myfile.tsv'

https://www.postgresql.org/docs/current/static/sql-copy.html

আপনার উত্পাদনের একটি উপসেট কেবল টানানোর চেয়ে আপনার ডেভলপমেন্ট ডেটার একটি সেট বজায় রাখা বিবেচনা করা উচিত। আপনি ইউনিট পরীক্ষা লিখছেন যে ক্ষেত্রে, আপনি পরীক্ষার জন্য প্রয়োজনীয় একই ডেটা ব্যবহার করতে পারেন, সম্ভাব্য সমস্ত ব্যবহারের ক্ষেত্রে হিট করার চেষ্টা করে।

Question 3

ইতিমধ্যে এটি করা কোনও সফ্টওয়্যার সম্পর্কে আমি জানি না, তবে আমি 3 টি বিকল্প সমাধানের কথা ভাবতে পারি। দুর্ভাগ্যক্রমে, তাদের সকলের জন্য কিছু কাস্টম কোডিং প্রয়োজন।

একটি পৃথক স্কিমাতে সমস্ত টেবিলগুলি পুনরায় তৈরি করুন, তারপরে সেই টেবিলগুলিতে অনুলিপি করুন যা আপনি ডাম্প করতে চান তা ব্যবহার করে INSERT INTO copy.tablename SELECT * FROM tablename WHERE ...এবং ডাম্প করতে চান।
এসকিউএল স্টেটমেন্ট হিসাবে ডাম্পিং ডেটার জন্য আপনার নিজের স্ক্রিপ্ট লিখুন। আমি এই পদ্ধতির অতীতে ব্যবহার করেছি এবং এটি পিএইচপি এর 20-30 লাইনের মতো কিছু নিয়েছে।
Pg_dump সংশোধন করুন যাতে এটি কোনও একক টেবিল ডাম্প করার সময় -t সুইচ সহ একটি শর্তও গ্রহণ করে।

Question 4

http://jailer.sourceforge.net/ এটি করে।