ডেটা ব্যবহার করে ব্যবসায়ের সমস্যাগুলি সমাধান করার সময়, এটি সাধারণ যে অন্তত পিনের ধ্রুপদী পরিসংখ্যানটি অবৈধ key বেশিরভাগ সময়, কেউই এই অনুমানগুলি যাচাই করতে বিরক্ত করে না যাতে আপনি আসলে জানেন না।
উদাহরণস্বরূপ, এখন পর্যন্ত প্রচলিত ওয়েব মেট্রিকগুলি "লম্বা লেজযুক্ত" (সাধারণ বিতরণের সাথে তুলনামূলক) তাই এখন পর্যন্ত এত ভাল নথিভুক্ত হয়েছে যে আমরা এটিকে মঞ্জুর করি। অন্য একটি উদাহরণ, অনলাইন সম্প্রদায়গুলি - এমনকি হাজার হাজার সদস্যের সম্প্রদায়গুলিতেও এটি নথিবদ্ধভাবে প্রমাণিত হয়েছে যে এই সম্প্রদায়ের বেশিরভাগ অংশে অংশ নেওয়া / অংশগ্রহনের সবচেয়ে বড় অংশটি 'সুপার-অবদানকারীদের' একটি ক্ষুদ্র গোষ্ঠীর জন্য দায়ী। (উদাহরণস্বরূপ, কয়েক মাস আগে, বিটাতে এসও এপিআই উপলব্ধ করার ঠিক পরে, স্ট্যাকওভারফ্লো সদস্য তার এপিআইয়ের মাধ্যমে সংগৃহীত ডেটা থেকে একটি সংক্ষিপ্ত বিশ্লেষণ প্রকাশ করেছিলেন; তার উপসংহার - এসও সদস্যদের এক শতাংশেরও কম অংশই বেশিরভাগের জন্য অ্যাকাউন্টে থাকে) SO উপর ক্রিয়াকলাপ (সম্ভবত প্রশ্ন জিজ্ঞাসা করা, এবং তাদের উত্তর), অন্য 1-2% বাকীগুলির জন্য দায়ী, এবং সংখ্যাগরিষ্ঠ সদস্যরা কিছুই করেন না।
এই ধরণের বিতরণ - আবার প্রায়শই ব্যতিক্রমের চেয়ে বেশি নিয়ম - প্রায়শই একটি পাওয়ার আইন ঘনত্ব ফাংশন দিয়ে সবচেয়ে বেশি মডেল করা হয় । এই ধরণের বিতরণগুলির জন্য, এমনকি কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রয়োগ করতে সমস্যাযুক্ত।
সুতরাং বিশ্লেষকদের কাছে আগ্রহের মতো জনসংখ্যার প্রাচুর্য দেওয়া, এবং দেওয়া হয়েছে যে শাস্ত্রীয় মডেলগুলি এই ডেটাগুলিতে প্রদর্শনযোগ্যভাবে খারাপভাবে সম্পাদন করে এবং জোরালো এবং প্রতিরোধী পদ্ধতিগুলি কিছু সময়ের জন্য রয়েছে (কমপক্ষে 20 বছর, আমি বিশ্বাস করি) - কেন তারা আরও প্রায়শই ব্যবহার করা হয় না? (আমি আরও ভাবছি যে আমি কেন এগুলি প্রায়শই ব্যবহার করি না, তবে ক্রসভিলেটেডের পক্ষে এটি আসলে কোনও প্রশ্ন নয় ))
হ্যাঁ আমি জানি যে পাঠ্যপুস্তক অধ্যায়গুলি সম্পূর্ণরূপে শক্তিশালী পরিসংখ্যানগুলিতে উত্সর্গীকৃত এবং আমি জানি (কয়েকটি) আর প্যাকেজগুলি রয়েছে ( রবস্টবেসই আমি যার সাথে পরিচিত এবং ব্যবহার করি) ইত্যাদি etc.
এবং তবুও এই কৌশলগুলির সুস্পষ্ট সুবিধাগুলি দেওয়া, তারা প্রায়শই স্পষ্টভাবে কাজের জন্য আরও ভাল সরঞ্জাম - কেন এগুলি বেশি বেশি ব্যবহৃত হয় না ? শাস্ত্রীয় অ্যানালগগুলির সাথে তুলনা করা আমাদের আরও দৃ often় (এবং প্রতিরোধী) পরিসংখ্যানগুলি প্রায়শই ব্যবহার করা (সম্ভবত অনুমানযোগ্যভাবে) দেখার আশা করা উচিত নয়?
আমি শুনেছি কেবলমাত্র প্রকৃত ব্যাখ্যা (যেমন, প্রযুক্তিগত) হ'ল শক্তিশালী কৌশলগুলির (একইভাবে প্রতিরোধী পদ্ধতির জন্য) শাস্ত্রীয় কৌশলগুলির শক্তি / সংবেদনশীলতার অভাব রয়েছে। কিছু ক্ষেত্রে সত্যই এটি সত্য কিনা তা আমি জানি না, তবে আমি জানি এটি অনেক ক্ষেত্রে সত্য নয়।
প্রিম্পিশনের একটি চূড়ান্ত শব্দ: হ্যাঁ আমি জানি এই প্রশ্নের কোনও একক প্রমাণের সঠিক উত্তর নেই; এই সাইটে খুব কম প্রশ্ন করা। তদুপরি, এই প্রশ্নটি একটি আসল তদন্ত; দৃষ্টিভঙ্গির অগ্রগতি করার বাহান নয় - এখানে আমার দৃষ্টিভঙ্গি নেই, কেবল একটি প্রশ্ন যার জন্য আমি কিছু অন্তর্দৃষ্টিপূর্ণ উত্তর আশা করছি।