২০০৫ সালের দিকে যখন "ডেটা মাইনিং" ছিল পরিসংখ্যান পেশার সর্বশেষতম হুমকি, আমি মনে করি "ডেটা মাইনিং প্রিন্সিপালস" সহ একটি পোস্টার দেখেছিলাম যার মধ্যে একটি ছিল "ডেটাতে কথা বলতে দাও" (মনে রাখতে পারে না "নিজের জন্য" কিনা অন্তর্ভুক্ত ছিল)। আপনি যদি "ডেটা মাইনিং" হিসাবে বিবেচিত আলগোরিদিমগুলি সম্পর্কে ভাবেন তবে এপ্রোরি এবং পুনরাবৃত্তিক বিভাজন মনে হয়, দুটি অ্যালগরিদম যা পরিসংখ্যানগত অনুমান ছাড়াই প্রেরণা পেতে পারে এবং এর ফলে অন্তর্নিহিত ডেটা সেটটির বেশ কয়েকটি বেসিক সংক্ষিপ্তসার ঘটতে পারে।
@ বেন তারপরে আমার বাক্যটির ইতিহাসের আরও বেশি কিছু বোঝে তবে কাগজে উদ্ধৃত উদ্ধৃতিটি নিয়ে চিন্তাভাবনা:
এমসিএকে শ্রেণিবদ্ধ তথ্যগুলির জন্য পিসিএর প্রতিচ্ছবি হিসাবে দেখা যেতে পারে এবং একটি উপসীমা সরবরাহের জন্য ডেটা মাত্রিকতা হ্রাস করা জড়িত যা প্রোজেক্ট পয়েন্টগুলির পরিবর্তনশীলতা সর্বাধিকীকরণের অর্থে উপাত্তকে উপস্থাপন করে। যেমনটি উল্লেখ করা হয়েছে, এটি প্রায়শই বেনজেক্রি [1973] এর ধারণার সাথে সামঞ্জস্য রেখে সম্ভাব্য মডেলগুলির কোনও রেফারেন্স ছাড়াই উপস্থাপিত হয় "তথ্য নিজেরাই বলুক।"
আমার কাছে মনে হয় যে এমসিএর পদ্ধতিটি অ্যাপ্রোরি বা পুনরাবৃত্তির বিভাজন (বা নরক, সেই বিষয়ে পাটিগণিতের অর্থ) এর সাথে সাদৃশ্যপূর্ণ যে এটি কোনও মডেলিং ছাড়াই অনুপ্রাণিত হতে পারে এবং এটি একটি ডেটা সেটে মেকানিক্যাল অপারেশন যা বোধগম্য করে তোলে কিছু প্রথম নীতি উপর।
ডেটা বলতে দেওয়ার একটি বর্ণালী রয়েছে। দৃ strong় প্রিয়ারদের সাথে সম্পূর্ণ বেইসিয়ান মডেলগুলি এক প্রান্তে থাকবে। ঘনঘনবাদী ননপ্রেমেট্রিক মডেলগুলি অন্য প্রান্তের কাছাকাছি থাকবে।