"ডেটা নিজেরাই বলুক" এর উদ্দেশ্য কী?


10

নীচের কাগজটি পড়ার সময় , আমি নীচের বিবৃতিটি পেলাম:

যেমনটি উল্লেখ করা হয়েছে, এটি প্রায়শই বেনজেক্রি [1973] এর ধারণার সাথে সামঞ্জস্য রেখে সম্ভাব্য মডেলগুলির কোনও রেফারেন্স ছাড়াই উপস্থাপিত হয় "তথ্য নিজেরাই বলি।"

(উদ্ধৃতিটি জে পি বেনজারিকের L লানালিস ডেস ডোনিস। টোম দ্বিতীয়: লানালিস দেশ সংবাদদাতা। ডুনড, ১৯ 197৩.)

আমি এই কাগজটি কীভাবে পড়ছি তা থেকে মনে হচ্ছে "ডেটা নিজেরাই বলুক" এর অর্থ কোনও সম্ভাবনা ফাংশন বা ডেটা উত্পন্নকরণ প্রক্রিয়া বিবেচনা না করে ডেটা জুড়ে বিভিন্ন ব্যবস্থা বিবেচনা করার পংক্তির পাশাপাশি কিছু ।

আমি এর আগে "ডেটাটি নিজেরাই বলুন" উদ্ধৃতিটি শুনেছি, তবে কী বোঝানো হয়েছে সে বিষয়ে আমি কঠোর চিন্তা করি নি। আমার উক্ত ব্যাখ্যাটি কি এই উদ্ধৃতি দ্বারা স্বতন্ত্রভাবে বোঝানো হয়েছে?


9
উদ্ধৃতিটি নিজের পক্ষে কথা বলুক।
মার্ক এল স্টোন

@ মার্কএল.স্টোন: অনেকটা ডেটার মতো, উদ্ধৃতিগুলি প্রসঙ্গের সাথে আরও ভালভাবে বোঝা যায়
ক্লিফ এবি

উত্তর:


8

ব্যাখ্যাটি প্রসঙ্গে নির্ভর করে তবে কয়েকটি সাধারণ প্রসঙ্গ রয়েছে যাতে এটি প্রকাশিত হয়। বায়সিয়ান বিশ্লেষণে এই বিবৃতিটি প্রায়শই ব্যবহৃত হয় এই বিষয়টিকে জোর দেওয়ার জন্য যে আমরা আদর্শভাবে বিশ্লেষণে উত্তরোত্তর বিতরণটি পূর্বের অনুমানগুলির থেকে দৃ rob় হতে চাই, যাতে তথ্যের প্রভাব উত্তরোত্তরকে "আধিপত্য" করে দেয়। আরও সাধারণভাবে, উদ্ধৃতিটির সাধারণত অর্থ হল যে আমরা আমাদের পরিসংখ্যানের মডেলটি ডেটা কাঠামোর সাথে সঙ্গতিপূর্ণ করে তুলতে চাই, পরিবর্তে ডেটাটিকে এমন একটি ব্যাখ্যায় জোর করে না যা মডেলটির একটি অযোগ্য যাচাইযোগ্য কাঠামোগত অনুমান।

আপনি যে বিশেষ উক্তিটির কথা উল্লেখ করছেন তা অতিরিক্ত উদ্ধৃতি দ্বারা পরিপূরক: "মডেলটিকে অবশ্যই অন্য কোনও উপায়ে নয় ডেটা অনুসরণ করতে হবে" (বেনজিক্রি জে (1973) ল'অ্যানালিজ ডেস ডোনিস থেকে অনুবাদ করেছেন । টোম দ্বিতীয়: এল'লায়েস দেস সংবাদদাতা । ডুনোদ, পৃষ্ঠা 6) বেনজার্কি যুক্তি দিয়েছিলেন যে স্ট্যাটিস্টিকাল মডেলগুলিকে কাঠামো চাপিয়ে দেওয়ার পরিবর্তে ডেটা থেকে কাঠামো বের করা উচিত । তিনি বিশ্লেষককে "তথ্য বলতে বলতে" দিতে অনুমতি দেওয়ার জন্য অনুসন্ধানমূলক গ্রাফিকাল পদ্ধতির ব্যবহারকে অত্যন্ত গুরুত্বপূর্ণ হিসাবে বিবেচনা করেছিলেন।


(+1) এটি মনে রেখে, আমি মনে করি যে প্রথম লিঙ্কযুক্ত কাগজের উদ্ধৃতিটি বোঝায় যে এই পদ্ধতিগুলি একটি মডেল ভিত্তিক নির্ভরতা কাঠামোর পরিবর্তে অনুশীলনীয় সমবায় কাঠামোটির দিকে তাকাচ্ছে।
ক্লিফ এবি

1
হ্যাঁ, আমি মনে করি এটি সঠিক। এটি লক্ষণীয় যে বেনজিরিক দাবি করেছিলেন যে ডেটা বিশ্লেষণ মূলত পিসিএতে ইগেন-পচনের সমতুল্য ছিল। তাকে উদ্ধৃত করে বলা হয়েছে, "সব মিলিয়ে একটি ভাল বিশ্লেষণের ক্ষেত্রে একটি ডেটা বিশ্লেষণ করা সহজভাবে আইজেনভেেক্টরগুলি অনুসন্ধান করছে; এর সমস্ত বিজ্ঞান (বা শিল্প) তির্যক করার সঠিক ম্যাট্রিক্স সন্ধান করার জন্য।" ( হুসন এট আল 2016 , পৃষ্ঠা 2 দেখুন)
বেন - মনিকা

2
হা, এটি করার জন্য এটি একটি খুব আকর্ষণীয় দাবি। সেই প্রসঙ্গে কাগজে থাকা উক্তিটি আরও বেশি অর্থবোধ করে।
ক্লিফ এবি

হ্যাঁ, এটা বেশ চরম!
বেন - মনিকা

(+1 টি)। যদিও প্রথম নজরে, উদ্ধৃতিটির সাথে একমত হওয়া কঠিন বলে মনে হচ্ছে (কেন "চাপিয়ে দেওয়া" কোনও ভাল জিনিস হবে, সর্বোপরি?), ননপ্যারমেট্রিক পরিসংখ্যানগুলিতে মাত্রিকতার অভিশাপ, উদাহরণস্বরূপ, এটি দেখায় যে, যখন আমরা কোনও প্যারামেট্রিক মডেলের মাধ্যমে এটি শুনি তখন নিজের জন্য ডেটা বলার পক্ষে সহজ।
ক্রিস্টোফ হ্যাঙ্ক

1

২০০৫ সালের দিকে যখন "ডেটা মাইনিং" ছিল পরিসংখ্যান পেশার সর্বশেষতম হুমকি, আমি মনে করি "ডেটা মাইনিং প্রিন্সিপালস" সহ একটি পোস্টার দেখেছিলাম যার মধ্যে একটি ছিল "ডেটাতে কথা বলতে দাও" (মনে রাখতে পারে না "নিজের জন্য" কিনা অন্তর্ভুক্ত ছিল)। আপনি যদি "ডেটা মাইনিং" হিসাবে বিবেচিত আলগোরিদিমগুলি সম্পর্কে ভাবেন তবে এপ্রোরি এবং পুনরাবৃত্তিক বিভাজন মনে হয়, দুটি অ্যালগরিদম যা পরিসংখ্যানগত অনুমান ছাড়াই প্রেরণা পেতে পারে এবং এর ফলে অন্তর্নিহিত ডেটা সেটটির বেশ কয়েকটি বেসিক সংক্ষিপ্তসার ঘটতে পারে।

@ বেন তারপরে আমার বাক্যটির ইতিহাসের আরও বেশি কিছু বোঝে তবে কাগজে উদ্ধৃত উদ্ধৃতিটি নিয়ে চিন্তাভাবনা:

এমসিএকে শ্রেণিবদ্ধ তথ্যগুলির জন্য পিসিএর প্রতিচ্ছবি হিসাবে দেখা যেতে পারে এবং একটি উপসীমা সরবরাহের জন্য ডেটা মাত্রিকতা হ্রাস করা জড়িত যা প্রোজেক্ট পয়েন্টগুলির পরিবর্তনশীলতা সর্বাধিকীকরণের অর্থে উপাত্তকে উপস্থাপন করে। যেমনটি উল্লেখ করা হয়েছে, এটি প্রায়শই বেনজেক্রি [1973] এর ধারণার সাথে সামঞ্জস্য রেখে সম্ভাব্য মডেলগুলির কোনও রেফারেন্স ছাড়াই উপস্থাপিত হয় "তথ্য নিজেরাই বলুক।"

আমার কাছে মনে হয় যে এমসিএর পদ্ধতিটি অ্যাপ্রোরি বা পুনরাবৃত্তির বিভাজন (বা নরক, সেই বিষয়ে পাটিগণিতের অর্থ) এর সাথে সাদৃশ্যপূর্ণ যে এটি কোনও মডেলিং ছাড়াই অনুপ্রাণিত হতে পারে এবং এটি একটি ডেটা সেটে মেকানিক্যাল অপারেশন যা বোধগম্য করে তোলে কিছু প্রথম নীতি উপর।

ডেটা বলতে দেওয়ার একটি বর্ণালী রয়েছে। দৃ strong় প্রিয়ারদের সাথে সম্পূর্ণ বেইসিয়ান মডেলগুলি এক প্রান্তে থাকবে। ঘনঘনবাদী ননপ্রেমেট্রিক মডেলগুলি অন্য প্রান্তের কাছাকাছি থাকবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.