কর্মক্ষেত্রে আমরা আমাদের মাইএসকিএল ডাটাবেসের একটি রাতের ডাম্প করি। দিনে দিনে, আমি অনুমান করব যে 90-95% ডেটার সদৃশ হয়, সময় বাড়ার সাথে সাথে এটি বাড়ছে। (এই মুহুর্তে হেক কিছু সম্ভবত 99%)
এই ডাম্পগুলি যেখানে এক লাইনটি একক মাইএসকিএল INSERT বিবৃতি, তাই কেবলমাত্র পার্থক্যগুলি সম্পূর্ণ লাইন এবং সেগুলি ফাইলে যে ক্রমে থাকে are যদি আমি সেগুলি বাছাই করে ফেলি তবে ফাইল থেকে ফাইলের মধ্যে আসল পার্থক্যটি খুব কম হবে।
আমি খুঁজছিলাম, এবং আমি ডাম্প উপর আউটপুট বাছাইয়ের কোন উপায় খুঁজে পাইনি। sort
যদিও আমি কমান্ডের মাধ্যমে এটি পাইপ করতে পারি । তারপরে অভিন্ন লাইনের দীর্ঘ, দীর্ঘ ব্লক থাকবে।
সুতরাং আমি কেবলমাত্র ভিন্নতাগুলি সংরক্ষণ করার জন্য একটি উপায় নির্ধারণ করার চেষ্টা করছি। আমি একটি মাস্টার ডাম্প দিয়ে শুরু করতে পারি এবং প্রতি রাতে তার থেকে পৃথক হতে পারি। তবে প্রতি রাতে ভিন্নতা আরও বড় হবে। অথবা, আমি ঘূর্ণায়মান বিভিন্নতা তৈরি করতে পারতাম, যা স্বতন্ত্রভাবে খুব ছোট হবে তবে মনে হয় এটি গণনা করতে আরও বেশি সময় লাগবে, যদি আমি প্রতি রাতে পুরো সিরিজের একটি মাস্টার ডিফ করে রাখি।
এটা কি সম্ভব? কি সরঞ্জাম দিয়ে?
সম্পাদনা আমি কীভাবে মাইএসকিএল ব্যাকআপ করব তা জিজ্ঞাসা করছি না। মুহুর্তের জন্য মাইএসকিএল ভুলে যান। এটি একটি লাল রঙের হেরিং। আমি যেটি জানতে চাইছি তা হ'ল ফাইলগুলির একটি সিরিজ থেকে রোলিংয়ের ভিন্নতা কীভাবে তৈরি করা যায়। প্রতি রাতে আমরা একটি ফাইল পাই (যা মাইসকিल्डম্প ফাইল হিসাবে ঘটে ) এটি তার আগের 99% এর মতো similar হ্যাঁ, আমরা সেগুলি সব জিপ করি। তবে এই সমস্ত অপ্রয়োজনীয়তা প্রথম স্থানে রাখা অপ্রয়োজনীয়। আমার যা দরকার তা হ'ল আগের রাত থেকে পার্থক্যগুলি ... যা আগের রাত থেকে মাত্র 1% আলাদা ... ইত্যাদি ইত্যাদি। সুতরাং আমি যা করছি তা হল কীভাবে বিভিন্ন ধারা তৈরি করতে হয় তাই প্রতি রাতে আমার কেবল 1% স্টোর দরকার।