ধরণের ডেটা (নামমাত্র / অর্ডিনাল / অন্তর / অনুপাত) কি সত্যই ধরণের ভেরিয়েবল হিসাবে বিবেচনা করা উচিত?


10

সুতরাং উদাহরণস্বরূপ এখানে সংজ্ঞা আছে যে আমি স্ট্যান্ডার্ড পাঠ্য বই থেকে পেয়েছি

পরিবর্তনশীল - জনসংখ্যা বা নমুনার বৈশিষ্ট্য। প্রাক্তন। একটি পরীক্ষায় স্টক বা গ্রেডের দাম

ডেটা - প্রকৃত পর্যবেক্ষণ করা মান

সুতরাং একটি দুটি কলামের রিপোর্টের জন্য [নাম | আয়] কলামের নামগুলি ভেরিয়েবল এবং আসল পর্যবেক্ষণকৃত মান values ​​ডেভ | 100 কে}, {জিম | 200K ডেটা হবে

সুতরাং যদি আমি বলি যে [নাম] কলামটি নামমাত্র ডেটা এবং [আয়] অনুপাতের ডেটা, আমি কি বেশিরভাগ পাঠ্যপুস্তকের মতো এক ধরণের ডেটার পরিবর্তে পরিবর্তনশীলের ধরণ হিসাবে বর্ণনা করে আরও সঠিক হতে পারি না? আমি বুঝতে পারি যে এটি শব্দার্থবিজ্ঞান হতে পারে এবং এটি ঠিক আছে যে এখানে খুব আছে। তবে আমি আশঙ্কা করছি যে আমি এখানে কিছু মিস করছি।


অর্থপূর্ণ পার্থক্য হিসাবে আমাকে আঘাত করে না; আমি উভয় ব্যক্তিগতভাবে গ্রহণযোগ্যভাবে শব্দবন্ধ বিবেচনা করব। "পরিবর্তনশীল" এর সংজ্ঞাটি যদিও কিছুটা বন্ধ রয়েছে off
নিক স্টাওনার

2
@ নিক আমি বিশ্বাস করি যে আমরা যদি কথোপকথনের "বৈশিষ্ট্যময়" গাণিতিক "বাস্তব-মূল্যবান ফাংশন" তে অনুবাদ করি তবে আমরা একটি এলোমেলো ভেরিয়েবলের সংজ্ঞাটির অংশ পাই। (অনুপস্থিত অংশটি অবশ্যই জনসংখ্যার সিগমা ক্ষেত্রের সাথে সম্মানের সাথে পরিমাপযোগ্যতা Nor) সাধারণত, যদিও আমরা প্রযুক্তিগত শব্দটির পরিসংখ্যানগুলিতে "একটি নমুনার বৈশিষ্ট্য" অনুবাদ করব : সম্ভবত এটিই আপনি যা হিসাবে উল্লেখ করছেন "সামান্য বন্ধ।" এই অনুবাদগুলির সাথে, ভেরিয়েবলগুলির স্টিভেনস অর্থে কোনও "প্রকার" থাকে না (আমরা কেবল ধারাবাহিক বিতরণ থেকে পৃথক পৃথক করতে পারি ) - তবে কিছু তথ্য পারে।
whuber

উত্তর:


16

স্টিভেনস 'স্কেল typology অগত্যা ভেরিয়েবল কিছু সহজাত বৈশিষ্ট্য নয়, এমনকি তথ্য নিজেই, কিন্তু কিভাবে আমরা তথ্য চিকিত্সা - কি আমরা এটি ব্যবহার করছেন এর অর্থ

কিছু পরিস্থিতিতে, ঠিক একই মানটিকে অনুপাত, অন্তর, নিয়মিত বা নামমাত্র হিসাবে বিবেচনা করা যেতে পারে, আমরা এর সাথে কী করছি তার উপর নির্ভর করে - এটি আমরা যে মূল্যবোধগুলি দিয়ে থাকি তার অর্থ কী, যা এক বিশ্লেষণ থেকে পরবর্তী বিশ্বে পরিবর্তন করতে পারে। স্টিভেনসের টাইপোলজির কিছু মূল্য রয়েছে তবে এটি এ সম্পর্কে অত্যধিক ব্যবস্থাপত্র হিসাবে কাজ করে না।

অর্থ হিসাবে স্কেলটির গুরুত্বের বিষয়টি কমপক্ষে লর্ড (১৯৫৩) এর সাথে সম্পর্কিত, যিনি একটি উদাহরণ দিয়েছিলেন যেখানে একই সংখ্যার সংখ্যার নামমাত্র এবং অন্তর্বর্তী উভয় ব্যাখ্যা ছিল।

এই বিষয়টি আরও স্পষ্টভাবে ভেলম্যান এবং উইলকিনসন (1993) দ্বারা তৈরি করেছিলেন, যিনি একটি টিকিটের পুরষ্কার প্রাপ্ত পুরষ্কারের সাথে সংবর্ধনাতে টানা সংখ্যক টিকিট প্রাপ্ত লোকদের উদাহরণ উপস্থাপন করেন; টিকিটের সংখ্যা তৈরির উপর নির্ভর করে, চারটি স্কেলে তাদের ব্যাখ্যা রয়েছে।

সুতরাং, উদাহরণস্বরূপ 'আমি জিতেছি?' নামটি নামমাত্র হিসাবে বিবেচনা করা একটি প্রশ্ন, যখন 'আমি বিজয়ী টিকিট পেতে খুব তাড়াতাড়ি পৌঁছেছি?' এমন একটি প্রশ্ন যা এটিকে সাধারণ হিসাবে বিবেচনা করে; অন্যদিকে (এবং আমি মনে করি না যে এটি একটি কাগজে রয়েছে) ঘরের লোক সংখ্যা অনুপাত হিসাবে বিবেচনা করার জন্য 5 টি এলোমেলো টিকিট নম্বর ব্যবহার করে (উদাহরণস্বরূপ যদি 4 টি এলোমেলোভাবে টানা সংখ্যাগুলি পেয়েছিল সান্ত্বনা পুরষ্কার, আপনার মোট 5 টি এলোমেলো সংখ্যা থাকবে যার থেকে মোট উপস্থিতি অনুমান করার জন্য)।

তাদের যুক্তি ছিল যে "ভাল ডেটা বিশ্লেষণ ডেটা ধরণের ধারনা করে না", "স্টিভেনসের বিভাগগুলি তথ্যের নির্দিষ্ট বৈশিষ্ট্য বর্ণনা করে না", "স্টিভেনসের বিভাগগুলি ডাটা স্কেলগুলি বর্ণনা করতে অপর্যাপ্ত" এবং "স্টিভেনসের মানদণ্ড অনুযায়ী পরিসংখ্যান পদ্ধতিগুলি শ্রেণিবদ্ধ করা যায় না" (সত্যই প্রতিটি বিবৃতি একটি বিভাগ শিরোনাম)।

টুকি বিভিন্ন স্থানে সমালোচনাও করেছিলেন (যেমন মোস্টেলার ও টুকির ১৯ 197 book বইয়ের ডাটা অ্যানালাইসিস এবং রিগ্রেশন এর অধ্যায় )); মোস্টেলার এবং টুকি একটি টাইপোলজির প্রস্তাব দিয়েছিলেন - নাম , গ্রেড ( অর্ডারযুক্ত লেবেল), র‌্যাঙ্ক (1 থেকে শুরু করে যা সবচেয়ে বড় বা ক্ষুদ্রতমকে উপস্থাপন করতে পারে), গণনা ভগ্নাংশ (শূন্যের সাথে আবদ্ধ এবং এর মধ্যে শতাংশ রয়েছে), গণনা (অ-নেতিবাচক) পূর্ণসংখ্যা), পরিমাণ (অ-নেতিবাচক আসল সংখ্যা), ভারসাম্য (সীমাহীন, ধনাত্মক বা নেতিবাচক মান)।

আমার নিজের কাজকালে, আমি এমন পরিস্থিতি দেখেছি যেখানে বিশ্লেষণের সাথে গুরুতর সমস্যাগুলি স্তরগুলির সাথে সম্পর্কিত ভেরিয়েবলগুলির ( যেগুলি কখনও কখনও 'স্টক' ভেরিয়েবল বলা হয়) এবং প্রবাহের মধ্যে দুর্দান্ত পার্থক্যকে উপলব্ধি করতে ব্যর্থ হয়ে পড়েছিল - এই ধরণের একটি সাধারণ উদাহরণ পার্থক্য is পিরিয়ডগুলির ক্রমগুলির প্রতিটি ক্রমানুসারে স্টোরেজ ট্যাঙ্কে জলের পরিমাণের জন্য উপযুক্ত বিশ্লেষণের ধরণ এবং এতে কত পরিমাণে জল প্রবাহিত হয়। এগুলি (এর কয়েকটি ক্ষেত্রে) উভয়ই মোস্টেলার এবং টুকির ' পরিমাণ ' টাইপের উপ-বিভাগ হতে পারে (এবং একই ক্ষেত্রে স্টিভেনস স্কিমের উভয় অনুপাতের ভেরিয়েবল) ইঙ্গিত দেয় যে টাইপোলজির বিষয়গুলি বেশ সূক্ষ্ম হতে পারে, তবে তবুও সমালোচনামূলকভাবে উপযুক্ত বিশ্লেষণে প্রভাব ফেলতে পারে।

পিএফভেলম্যান এবং এল। উইলকিনসন (1993),
"নামমাত্র, অর্ডিনাল, ইন্টারভাল এবং অনুপাত টাইপোলজিস বিভ্রান্তিকর,"
আমেরিকান পরিসংখ্যানবিদ , খণ্ড। 47 নং 1 pp.65-72

(একটি কার্যকারী সংস্করণ এখানে ২ য় লেখকের ওয়েব পৃষ্ঠায় উপলব্ধ বলে মনে হচ্ছে )

লর্ড, এফ। (1953),
"ফুটবল সংখ্যার পরিসংখ্যানগত চিকিত্সা সম্পর্কিত"
আমেরিকান সাইকোলজিস্ট , 8 , পিপি 750-751

(এই পেপারের বছরটি ভেলম্যান এবং উইলকিনসন পেপারের সাথে সংযুক্ত আমি যে সংস্করণের সাথে সংযুক্ত করেছি, তবে সেই কাগজের মূল অংশে সঠিকভাবে উল্লেখ করা হয়েছে)


ধন্যবাদ। খুব পুঙ্খানুপুঙ্খ উত্তর। আমি সেই লাইনগুলি ধরেই ভাবছিলাম কিন্তু এই জিনিসটি বহুবার গবেষণা করার সময় তারা এটিকে মনে হয় যেন এটি দৃ concrete় এবং sensক্যমত্যে পৌঁছেছে। আমি এখানেই শেষ।
ব্যবহারকারী 42

স্টিভেনসের টাইপোলজিটি প্রথম প্রকাশিত হওয়ার পর থেকেই বিতর্ক এবং বিতর্কিত হয়েছে। এটি একটি কখনও কখনও সহায়ক কাঠামো, কোনও উপপাদ্য নয়।
গ্লেন_বি -রিনস্টেট মনিকা

স্টিভেনস এবং মোস্টেলারের পাশাপাশি কোনও "নতুন প্রিয়" আছে কি? স্তরের / প্রবাহের উদাহরণে, আমি যদি আপনাকে সঠিকভাবে বুঝতে পারি তবে উভয়েরই একই ধরণের রয়েছে, তবুও আলাদাভাবে চিকিত্সা করা দরকার? আপনি এই পার্থক্য ব্যাখ্যা করতে পারেন? এবং উদাহরণস্বরূপ, এই টাইপোলজিতে কোনও মানের লগ রূপান্তর কীভাবে মাপসই হয়? ধন্যবাদ।
এরিচ শুবার্ট

১. আমি সাম্প্রতিক কোন প্রচেষ্টা করার কথা জানি না - এবং আমি মনে করি যে তারা প্রয়োজনীয় উপযোগী নয় যেহেতু তারা লোকদের কম উপযুক্ত বিশ্লেষণে ঝুঁকিপূর্ণ করে তোলে (খেলনার উদাহরণের জন্য লর্ডসের কাগজ দেখুন তবে বিশ্লেষণের ফলাফলগুলি হ'ল) খুব বাস্তব - প্রকার অনুসারে বিশ্লেষণের সেই তালিকাগুলি ভয়াবহ পরিসংখ্যান বিশ্লেষণের শেষের কারণ নয়, যখন উপযুক্ত পরিস্থিতিতে বিবেচনার সম্ভাবনা থেকে পরিসংখ্যানের বিস্তৃত অংশ কেটে দেওয়া হয়)। .. সিটিডি
গ্লেন_বি -রাইনস্টেট মনিকা

সিটিডি ... ২. স্তরগুলি এবং প্রবাহগুলি কীভাবে একদম আলাদা তার একটি উদাহরণ: দ্রষ্টব্য যে আপনি যদি প্রতিটি স্তরের দিকে তাকান তবে আজকের স্তরটি হ'ল মধ্যস্থতাকারী বা বহির্মুখী (বা উভয়ের যোগফল) , যদি উভয়ই সম্ভব হয়)। সুতরাং স্তর পরিমাপ প্রয়োজনীয়ভাবে নির্ভরশীল, প্রায়শই অত্যন্ত তাই। এগুলি তাদের স্বাধীন হিসাবে বিবেচনা করার সাথে বোঝাপড়া করতে পারে না - তবুও আমি দেখি লোকেরা সর্বদা এটি করে। ৩. আমি নিশ্চিত নই যে আপনি লগ জিনিসটি দিয়ে কী জিজ্ঞাসা করছেন। আপনি কি সে সম্পর্কে আরও সুস্পষ্ট হতে পারেন? কোন টাইপোলজি (নোট যে আমি একের বেশি উল্লেখ করেছি)?
গ্লেন_বি -রিনস্টেট মনিকা

1

ডেটা ধরণের সম্পর্কিত হয় তবে ভেরিয়েবলের ধরণের সাথে একরকম নয়। বেশিরভাগ ক্ষেত্রে, তারা একই তবে তাদের হতে হবে না।

উদাহরণস্বরূপ, যদি আপনি একটি সাধারণ বিতরণ থেকে এন নমুনা সংগ্রহ করেন। আপনি মনে করবেন এটি একটি সংখ্যাসূচক (অনুপাত বা স্কেল) ডেটা। তবে আমি এটিও বলতে পারি যে এটি প্রতিটি বিভাগের জন্য 1 এর ফ্রিকোয়েন্সি সহ এন বিভিন্ন বিভাগের সাথে একটি শ্রেণিবদ্ধ পরিবর্তনশীল। এটি নির্বোধ দেখায় তবে এটি একটি বৈধ পরিবর্তনশীল।


এটি স্টিভেন্সের সাথে কিছুটা মতবিরোধের সাথে মনে হয় (যিনি এই টাইপোলজিটি তৈরির জন্য কৃতিত্ব দেন), যিনি লিখেছিলেন "আসল বিষয়টি পরিমাপের অর্থ।" যদিও আপনি সর্বদা এই জাতীয় ডেটা নামমাত্র হিসাবে বিবেচনা করতে বেছে নিতে পারেন, এটি স্টিভেন্সের অনুমানের ক্ষেত্রে নামমাত্র করে না। তার কাগজ gaius.fpce.uc.pt/niips/novoplano/mip1/mip1_201314/scales/…উপলব্ধ
হোবার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.