আমার কাছে আরও ছোট ইউনিট পরীক্ষা রয়েছে যা বাস্তব ডেটা সেট থেকে ছোট স্নিপেট ব্যবহার করে। আমি বহুবিধ কারণে সম্পূর্ণ প্রোগ্রাম সেটগুলির বিরুদ্ধে আমার প্রোগ্রামটি পরীক্ষা করতে চাই। একমাত্র সমস্যাটি হ'ল একক আসল ডেটাसेटটি প্রায় 5 গিগাবাইট। গিট সংগ্রহস্থলগুলি কী সঞ্চয় করতে পারে তার জন্য আমি কোনও হার্ড নম্বর পাইনি তবে এটি খুব বেশি বলে মনে হচ্ছে।
আমার দলটি যে সমাধানটি গ্রহণ করেছে তা হ'ল প্রকল্পটিতে এমন একটি ফাইল রয়েছে যা আমাদের পরীক্ষার ডেটা ধারণ করে এমন একটি নেটওয়ার্ক সংযুক্ত ফাইল সিস্টেমের পাথ ধারণ করে। ফাইলটি গিটকে উপেক্ষা করা হচ্ছে।
আমি মনে করি এটি দুটি কারণে একটি অসম্পূর্ণ সমাধান। যখন এনএএস কাজ করে না, ধীর গতিতে থাকে বা আমরা একটি সম্পূর্ণ পরীক্ষা চালাতে পারি না তার চেয়ে কম হয়। দ্বিতীয় কারণ হ'ল যখন কেউ প্রথমে কোনও সংগ্রহশালা ক্লোন করে ইউনিট পরীক্ষাগুলি ব্যর্থ হয় তাই তারা কীভাবে একটি নির্দিষ্ট নাম দিয়ে জিনিসগুলি মাউন্ট করবেন এবং পরীক্ষার পথ ফাইলটি তৈরি করতে ব্যবহৃত সিনট্যাক্সটি খুঁজে বের করতে হবে।
সুতরাং আমার প্রশ্ন দুটি ভাঁজ হয়। পুনর্বিবেশন নিয়ন্ত্রণে কতগুলি ডেটা খুব বেশি ডেটা সঞ্চয় করতে হয়?
বিপুল পরিমাণে পরীক্ষার ডেটা হ্যান্ডেল করার ভাল উপায় কী?