ওয়েবসাইট ব্যাকআপের জন্য যা আরও ভাল - rsync বা গিট পুশ


16

আমি দুর্যোগ পুনরুদ্ধারের উদ্দেশ্যে বিভিন্ন সরবরাহকারীগুলিতে 2 এলএএমপি ওয়েব সার্ভার চালিত করি - একটি উচ্চ ক্ষমতা সম্পন্ন লাইভ সার্ভার, এবং স্বল্প শক্তিযুক্ত ব্যাকআপ সার্ভার।

বর্তমানে আমি লাইভ সার্ভার থেকে ব্যাকআপ সার্ভারে 4 ঘন্টা একবার একবারে সমস্ত ডেটা আরসিএনসি করি।

এটি ঠিকঠাক কাজ করে, তবে কোন ফাইলগুলি পরিবর্তিত হয়েছে তা সিএসসিএন-র পরিসংখ্যানগুলির মধ্যে স্পাইক সিস্টেম লোড করে।

যেহেতু সমস্ত ওয়েবসাইটগুলিও গিট সংগ্রহস্থলে বাস করে, আমি ভাবছি যে গিট পুশ আরও ভাল ব্যাকআপ কৌশল হবে কিনা।

আমি গিট রেপোতে লাইভ আপলোড ফোল্ডারটি অন্তর্ভুক্ত করতে চাই; এবং তারপরে ব্যাকআপ প্রক্রিয়াটি হ'ল:

live$ git add .
live$ git commit -a -m "{data-time} snapshot"
live$ git push backup live_branch

এবং তারপরে প্রতিটি ধাক্কায় চেকআউট করার জন্য ব্যাকআপ সার্ভারে একটি পোস্ট কমিট হুক করুন।

প্রতিটি ওয়েবসাইটের আকার 50M থেকে 2GB অবধি থাকে। আমি প্রায় 50 টি পৃথক গিট রেপো দিয়ে শেষ করব।

এটি কি আরএসআইএনসি-র চেয়ে "উন্নত" সমাধান?

  • কোন ফাইলগুলি পরিবর্তিত হয়েছে তা গণনায় গিট কি আরও ভাল?
  • গিট কি আরও কার্যকর যে আরএসসিএন পুশ করে
  • আমি কি ভুলে গেছি?

ধন্যবাদ!

---- কিছু তুলনা পরীক্ষা থেকে ডেটা ------

1) 52MB ফোল্ডার এর পরে একটি নতুন 500k ফোল্ডার যুক্ত করুন (মূলত পাঠ্য ফাইলগুলি)

rsync

sent 1.47K bytes  received 285.91K bytes  
total size is 44.03M  speedup is 153.22

real    0m0.718s    user    0m0.044s    sys     0m0.084s

Git

Counting objects: 38, done.
Delta compression using up to 4 threads.
Compressing objects: 100% (37/37), done.
Writing objects: 100% (37/37), 118.47 KiB, done.
Total 37 (delta 3), reused 0 (delta 0)

real    0m0.074s     user   0m0.029s    sys     0m0.045s

2) 1.4G ফোল্ডার এর পরে একটি নতুন 18 এম ফোল্ডার যুক্ত করুন (মূলত চিত্রগুলি)

rsync

sent 3.65K bytes  received 18.90M bytes
total size is 1.42G  speedup is 75.17

real    0m5.311s    user    0m0.784s    sys     0m0.328s

Git

Counting objects: 108, done.
Delta compression using up to 4 threads.
Compressing objects: 100% (106/106), done.
Writing objects: 100% (107/107), 17.34 MiB | 5.21 MiB/s, done.
Total 107 (delta 0), reused 0 (delta 0)

real    0m15.334s    user   0m5.202s    sys     0m1.040s

3) 52 এম ফোল্ডারটি পরে একটি নতুন 18 এম ফোল্ডার যুক্ত করুন (প্রধানত চিত্রগুলি)

rsync

sent 2.46K bytes  received 18.27M bytes  4.06M bytes/sec
total size is 62.38M  speedup is 3.41

real    0m4.124s    user    0m0.640s    sys     0m0.188s

Git

Counting objects: 108, done.
Delta compression using up to 4 threads.
Compressing objects: 100% (106/106), done.
Writing objects: 100% (107/107), 17.34 MiB | 5.43 MiB/s, done.
Total 107 (delta 1), reused 0 (delta 0)

real    0m6.990s    user    0m4.868s    sys     0m0.573s

4) 1.4G ফোল্ডার এর পরে একটি নতুন 500k ফোল্ডার যুক্ত করুন (মূলত পাঠ্য)

rsync

sent 2.66K bytes  received 916.04K bytes  612.47K bytes/sec
total size is 1.42G  speedup is 1547.14

real    0m1.191s    user    0m0.180s    sys     0m0.268s

Git

Counting objects: 49, done.
Delta compression using up to 4 threads.
Compressing objects: 100% (48/48), done.
Writing objects: 100% (48/48), 177.90 KiB, done.
Total 48 (delta 3), reused 0 (delta 0)

real    0m1.776s    user    0m0.390s    sys     0m0.497s

5) 1.4G ফোল্ডার - কোনও পরিবর্তন নেই

rsync

sent 1.72K bytes  received 716.44K bytes  287.26K bytes/sec
total size is 1.42G  speedup is 1979.18

real    0m1.092s    user    0m0.168s    sys     0m0.272s

Git

nothing to commit (working directory clean)

real    0m0.636s    user    0m0.268s    sys     0m0.348s

5) 52 এম ফোল্ডার - কোনও পরিবর্তন নেই

rsync

sent 528 bytes  received 88.40K bytes  59.29K bytes/sec
total size is 62.38M  speedup is 701.41

real    0m0.779s    user    0m0.044s    sys     0m0.144s

Git

nothing to commit (working directory clean)

real    0m0.156s    user    0m0.057s    sys     0m0.097s

3
একটি "চমৎকার আরএসএনসিএন" সম্পর্কে কী? সিস্টেম লোড স্পিকিং হ'ল আপনি যা চান: প্রক্রিয়াটি এএপিএপ সমাপ্ত করুন এবং এটি ওয়েবসাইটের ক্রিয়াকলাপে কোন হস্তক্ষেপ না করবে ততক্ষণ ঠিক।

1
ধন্যবাদ - আমি ইতিমধ্যে একটি "দুর্দান্ত আরএসএনসিএন" করছি, যা সাহায্য করে
ডেভিড লইং

উত্তর:


4

আসলে আমি উভয়ের সুষম মিশ্রণটি ব্যবহার করার পরামর্শ দেব। আপনার মূল ব্যাকআপটি প্রতি রাতে প্রতিশ্রুতিবদ্ধ হতে হবে (কমপক্ষে) সপ্তাহে একবার বা দু'বার এটি অন্য মেশিনে সিঙ্ক করুন যা আরএসইএনসি ব্যবহার করে প্রোডাকশন বক্স থেকে দূরে রাখা হয়েছে।

গিট আপনাকে তাত্ক্ষণিক পুনরুদ্ধার করতে সহায়তা করবে এবং আপনার ব্যাকআপটি ভার্সন-এড হওয়ার কারণে এবং এর পরিবর্তনের লগ রয়েছে বলে তথ্য বিশ্লেষণকে আরও সহজ করে তোলে। ডেটাতে যে কোনও বড় পরিবর্তনের পরে, আপনি একটি প্রতিশ্রুতিবদ্ধ করতে পারেন এবং ম্যানুয়ালি গিট দেওয়ার জন্য এবং কারণটি চেঞ্জলগে রাখতে পারেন। যদি গিট খারাপ হয়ে যায় তবে আরএসসিএনসি উদ্ধার করতে আসবে তবে মনে রাখবেন যে আপনি আরএসইএনসি-এর ফ্রিকোয়েন্সি অনুসারে ডেটা আলগা করে রাখবেন।

থাম্বের বিধি: যখন ব্যাকআপগুলি এবং দুর্যোগ পুনরুদ্ধারের বিষয়টি আসে তখন আপনাকে কোনও 100% পুনরুদ্ধার দেওয়ার গ্যারান্টি দিতে পারে না।


2

Rsync একটি বিস্ময়কর সিঙ্ক টুল, কিন্তু সার্ভার (গুলি) তে গীত চলমান, এবং আপনি একটি আরো অনেক বহুমুখিতা পেতে pushing বা pullআপডেট ing।

আমাদের সার্ভারে ব্যবহারকারীর উত্পন্ন সামগ্রীর ট্র্যাক এবং ব্যাকআপ নিতে হবে। productionসার্ভার Git রেপো একটি কপি আছে, এবং প্রতি রাতে এটি স্বয়ংক্রিয়ভাবে যোগ করা হয়েছে এবং ক্রন মাধ্যমে নতুন সব ফাইল হলেও ক্ষতি নেই। এগুলি pushআমাদের গিটোলাইট সার্ভারে সম্পাদিত, যা পরে বাকী সার্ভারগুলিকে সিঙ্ক করতে হুক ব্যবহার করে।

যেহেতু সার্ভারগুলিতে বোর্ডের অনুলিপি অনুলিপি রয়েছে, আপনি কেবল একটি স্ন্যাপশটই পাবেন না, তবে ইতিহাসের বিশদ সম্পর্কিত তথ্য যা আপনার সার্ভারে কিছু ঘটলে সহজেই আপনাকে বাঁচাতে পারে।

আমি মনে করি যে আপনি উভয়ই কি অফার করেন তা সম্পর্কে আপনার বেশ বোঝা আছে, আমি কেবল সার্ভারগুলি থেকে কোডবেস রফতানি / রফতানি করার জন্য নিজের চিন্তাভাবনার রেখাটি কেবলমাত্র তাদের নিজস্ব রেপোতে পরিবর্তন করেছিলাম। আরেকটি ধারণা হ'ল আপনি নিজের মিডিয়া ফাইলগুলি আরএসসিঙ্ক করতে পারেন (আপনি এই সাইটের কয়েকটিতে 2 জিবি বলেছিলেন, যা আমাকে ভাবায় যে প্রচুর মিডিয়া ধরণের ফাইল রয়েছে?) এবং গিটগুলিতে সেগুলি ট্র্যাক না করে।


আমি কিছু পারফরম্যান্স ডেটা যুক্ত করেছি; যা দেখায় যে আরএসসিএন গিটের চেয়ে প্রায় সবসময় দ্রুত। তবে, লাইভ সার্ভারে গিট রেপো রাখার অতিরিক্ত শক্তি সম্পর্কে আপনার পয়েন্টগুলি আমি পছন্দ করি - আমি ভাবছি যে হাইব্রিড পদ্ধতির সেরা না হলে পরিবর্তনগুলি গিট রেপোতে ঠেলাঠেলি করে, এবং তারপরে গিট রেপো ব্যাকআপে সংযুক্ত হয়ে যায় সার্ভার ...
ডেভিড লইং
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.