জিমি লিন এবং ক্রিস ডায়ার ম্যাপ্রেডুসের সাথে ডেটা-ইনটেনসিভ টেক্সট মাইনিংয়ের উপরের বইয়ের প্রথম অধ্যায়ে যেমন উল্লেখ করেছেন, বৃহত ডাটা স্কেলগুলিতে, বিভিন্ন অ্যালগরিদমের পারফরম্যান্স এমন রূপান্তরিত করে যে পারফরম্যান্সের পার্থক্য কার্যত অদৃশ্য হয়ে যায়। এর অর্থ হল যে একটি বৃহত পরিমাণে ডেটা সেট করা হয়েছে, আপনি যে অ্যালগরিদমটি ব্যবহার করতে চান সেটি হ'ল কম্পিউটারের তুলনায় কম ব্যয়বহুল। এটি কেবলমাত্র অল্প পরিমাণে স্কেল করে যা আলগোরিদিমগুলির মধ্যে পারফরম্যান্সের পার্থক্য।
যে হচ্ছে বললেন, তাদের বই (উপরে লিঙ্ক) এবং অতিরিক্ত বড় ডেটাসেট অনুযায়ী খনির আনন্দ Rajaraman, Jure থেকে Leskovec, এবং জেফ্রি ডি Ullman দ্বারা সম্ভবত দুটি বই ভাল হিসাবে আপনি চেক আউট করতে চাইবেন, বিশেষ করে তারা সরাসরি MapReduce সঙ্গে সংশ্লিষ্ট করছি ডেটা মাইনিংয়ের উদ্দেশ্যে।