সিম্পসনের প্যারাডক্স বুঝতে: লিঙ্গ এবং উচ্চতায় আয়ের পুনঃসংশোধনের সাথে অ্যান্ড্রু গেলম্যানের উদাহরণ


22

অ্যান্ড্রু গেলম্যান তার সাম্প্রতিক একটি ব্লগ পোস্টে বলেছেন:

  1. আমি মনে করি না যে সিম্পসনের প্যারাডক্সের জন্য জবাবদিহি বা সম্ভাব্য ফলাফলগুলি প্রয়োজনীয়। আমি এটি বলছি কারণ কেউ সিম্পসনের প্যারাডক্সটিকে ভেরিয়েবলগুলির সাথে সেট করতে পারে যা ম্যানিপুলেট করা যায় না, বা যার জন্য ম্যানিপুলেশনগুলি সরাসরি আগ্রহের নয়।

  2. সিম্পসনের প্যারাডক্স আরও সাধারণ ইস্যুর একটি অংশ যে আপনি যদি আরও পূর্বাভাসক যুক্ত করেন তবে রেগশন কোফগুলি পরিবর্তিত হয়, সাইন ফ্লিপিং সত্যই প্রয়োজন হয় না।

এখানে আমি আমার শিক্ষায় ব্যবহার করি এমন একটি উদাহরণ যা উভয় পয়েন্টই তুলে ধরে:

আমি লিঙ্গ এবং উচ্চতা থেকে আয়ের ভবিষ্যদ্বাণী করে একটি রিগ্রেশন চালাতে পারি। আমি দেখতে পেলাম যে লিঙ্গের কোফটি 10,000 ডলার (যেমন, একই উচ্চতার একজন পুরুষ এবং মহিলার তুলনা করে, পুরুষটি গড়ে 10,000 ডলার আরও উপার্জন করবে ) এবং উচ্চতার সহগ হ'ল 500 ডলার (অর্থাত্, দু'জন পুরুষ বা দুই মহিলার তুলনা করা) বিভিন্ন উচ্চতার মধ্যে, গড়পড়তা লম্বা ব্যক্তি প্রতি ইঞ্চি উচ্চতার প্রতি 500 ডলার করে তুলবে )।

আমি এই কোফগুলি কীভাবে ব্যাখ্যা করতে পারি? আমি অনুভব করি যে উচ্চতার কোফটি ব্যাখ্যা করা সহজ (একই লিঙ্গের দুটি ব্যক্তিকে বিভিন্ন উচ্চতার সাথে তুলনা করা সহজেই কল্পনা করা যায়), লিঙ্গের পক্ষে নিয়ন্ত্রণ না করে উচ্চতায় ফিরে আসা কোনওভাবেই "ভুল" বলে মনে হবে , যতটা কাঁচা সংক্ষিপ্ত এবং লম্বা মানুষের মধ্যে পার্থক্য পুরুষ এবং মহিলাদের মধ্যে পার্থক্য থাকার মাধ্যমে "ব্যাখ্যা" করা যেতে পারে। তবে উপরোক্ত মডেলটিতে যৌনতার কোফটিকে ব্যাখ্যা করা খুব কঠিন বলে মনে হচ্ছে: উদাহরণস্বরূপ, কোনও পুরুষ এবং একজন মহিলার তুলনা কেন 66 66 ইঞ্চি লম্বা, উদাহরণস্বরূপ? এটি একটি লম্বা মহিলার সাথে একটি সংক্ষিপ্ত পুরুষের তুলনা হবে। এই সমস্ত যুক্তি অস্পষ্টভাবে কার্যকারণীয় বলে মনে হয় তবে আমি মনে করি না যে এটি সম্ভাব্য ফলাফলগুলি ব্যবহার করে এটি সম্পর্কে চিন্তাভাবনা করা বুদ্ধিমান।

আমি এটি নিয়ে চিন্তিত হয়েছিলাম (এবং এমনকি পোস্টে মন্তব্যও করেছি) এবং মনে করি এখানে এমন আরও কিছু রয়েছে যা এখানে আরও বেশি স্পষ্টতার সাথে বোঝা যায়।

লিঙ্গ ব্যাখ্যার অংশ না হওয়া পর্যন্ত এটি ঠিক আছে। একটি সংক্ষিপ্ত পুরুষ এবং একজন লম্বা মহিলার তুলনা করার পিছনে সমস্যা কী তা আমি দেখতে পাচ্ছি না। এখানে আমার বক্তব্য: প্রকৃতপক্ষে এটি আরও বেশি বোধগম্য হয় (এই ধারণাটি দেওয়া হয় যে পুরুষরা গড়ে লম্বা হয়)। আপনি 'শর্ট ম্যান' এবং 'সংক্ষিপ্ত' মহিলাকে ঠিক একই কারণে তুলনা করতে পারবেন না, আয়ের পার্থক্যটি কিছু অংশে উচ্চতার পার্থক্যের দ্বারা ব্যাখ্যা করা হয়েছে। লম্বা পুরুষ এবং লম্বা মহিলাদের জন্য এবং একই সাথে সংক্ষিপ্ত মহিলা এবং লম্বা পুরুষদের ক্ষেত্রেও (যা প্রশ্নটির বাইরে রয়েছে, তাই কথা বলতে হবে)। সুতরাং মূলত উচ্চতার প্রভাব কেবল তখনই সংক্ষিপ্ত হয় যখন সংক্ষিপ্ত পুরুষ এবং লম্বা মহিলাদের তুলনা করা হয় (এবং এটি লিঙ্গের উপর সহগের ব্যাখ্যা করতে সহায়তা করে)। এটি জনপ্রিয় মিলে যাওয়া মডেলগুলির পিছনে অনুরূপ অন্তর্নিহিত ধারণাগুলিতে কোনও ঘন্টা বাজায় না?

সিম্পসনের প্যারাডক্সের পিছনে ধারণাটি হল যে জনসংখ্যার প্রভাব উপ-গোষ্ঠী ভিত্তিক প্রভাবগুলির চেয়ে আলাদা হতে পারে। এটি তার পয়েন্ট 2 এর সাথে কিছুটা অর্থে এবং সত্য যে তিনি স্বীকার করেছেন যে উচ্চতাটি একা জন্য নিয়ন্ত্রণ করা উচিত নয় (আমরা বাদ দেওয়া পরিবর্তনশীল পক্ষপাত যা বলে থাকি)। তবে আমি এটি লিঙ্গ সম্পর্কিত সহগের বিতর্কটির সাথে সম্পর্কিত করতে পারি নি।

সম্ভবত আপনি আরও পরিষ্কারভাবে এটি প্রকাশ করতে সক্ষম হতে পারে? বা আমার বোঝার উপর মন্তব্য?


ক্রস বৈধতা জনসংখ্যার এলোমেলো উপগ্রহগুলি দেখায়, সর্বনিম্ন ওভার-ফিট ফিট এবং সর্বোত্তম সাধারণীকরণের চেষ্টা করে।
এনগ্রুস্টুডেন্ট - মনিকা

1
আমি যদি আপনার উদ্বেগগুলি সঠিকভাবে বুঝতে পারি তবে আমি মনে করি লর্ডসের প্যারাডক্সটি দেখে আপনি উপকৃত হতে পারেন। @ আর্টিকেল {প্রভু 67, লেখক = {লর্ড, এফএম}, শিরোনাম = group গ্রুপ তুলনা the, জার্নাল = {মনস্তাত্ত্বিক বুলেটিন}, বছর = {1967}, আয়তন = {68}, পৃষ্ঠাগুলি = {304- -305}, কীওয়ার্ডস = {পরিবর্তন স্কোর} art @ আর্টিকেল {প্রভু 69, লেখক = {লর্ড, এফএম}, শিরোনাম = p পূর্ববর্তী দলগুলির তুলনা করার সময় পরিসংখ্যানগত সামঞ্জস্য}, জার্নাল = {মনস্তাত্ত্বিক বুলেটিন year, বছর = {1969}, আয়তন = {72}, পৃষ্ঠাগুলি = {336--337}, কীওয়ার্ডস = {স্কোর পরিবর্তন করুন
m m

1
জুডিয়া পার্ল সম্প্রতি সিম্পসনের প্যারাডক্সে আরও একটি পোস্ট করেছে । আমি নিশ্চিত যে তিনি জেলমানের উপস্থাপনার সাথে একমত নন। একবারের জন্য, দ্বিতীয় পয়েন্টটি "প্যারাডক্স" নয়। আপনি যে বিষয়ে শর্ত রেখেছেন তার ফলাফল হিসাবে অনুমানের বিপরীতটি একটি গাণিতিক সত্য fact আপনি যখন উভয় অনুমানের কার্যকারণ ব্যাখ্যা করেন তখন এটিকে সম্ভাব্য বিপরীতমুখী করে তোলে। দ্বিতীয়ত, কেন হেরফেরের জন্য এই নিষেধাজ্ঞার কারণ?
এনআরএইচ

উত্তর:


9

আমি আপনার প্রশ্নের ব্যাপারে পুরোপুরি নিশ্চিত নই , তবে উদাহরণস্বরূপ তার দাবী এবং আপনার বিভ্রান্তির বিষয়ে মন্তব্য করতে পারি।

অ্যান্ড্রু খুব স্পষ্ট নয় যদি বৈজ্ঞানিক আগ্রহ উচ্চতা সমন্বয়কৃত যৌন-আয়ের সমিতি বা লিঙ্গ সমন্বিত উচ্চতা-আয়ের সংস্থার মধ্যে থাকে। কার্যকারিতা মডেল কাঠামোর মধ্যে যৌনতা উচ্চতা কারণ কিন্তু উচ্চতা যৌনতা কারণ না । সুতরাং আমরা যদি যৌনতার প্রভাব চাই, উচ্চতার জন্য সামঞ্জস্য করা মধ্যস্থতা পক্ষপাতমূলক পরিচয় দেয় (সম্ভবত ধনী ব্যক্তিরা লম্বা হয়!) আমি যখন অন্যের ব্যাখ্যা করে এমন প্রয়োগকৃত গবেষণা দেখি তখন আমি বিভ্রান্তিকর এবং মজাদার বলে মনে করি"covariates" (কনফাউন্ডার এবং যথার্থ ভেরিয়েবল) যা একটি মডেলের অন্তর্ভুক্ত। এগুলি বাজে, তবে প্রয়োজনীয় তুলনাটি করার জন্য কেবল পর্যাপ্ত স্তরায়ন সরবরাহ করে provide উচ্চতার জন্য সামঞ্জস্য করা, যদি আপনি আয়ের ক্ষেত্রে যৌন ভিত্তিক পার্থক্যের উপর নজর রাখতে আগ্রহী হন তবে এটি করা ভুল কাজ।

আমি সম্মতি জানালাম যে সিম্পসনের প্যারাডক্সটি ব্যাখ্যা করার দরকার নেই। এগুলি কেবল ডেটাগুলির জন্য একটি স্বতন্ত্র বৈশিষ্ট্য হতে পারে। আমি মনে করি অশোধিত এবং সমন্বিত উভয়ই আরআর কার্যকারণ ছাড়াই কিছুটা অর্থে সঠিক। এটি অবশ্যই আরও সমস্যাযুক্ত, যখন উদ্দেশ্যটি কার্যকারণ বিশ্লেষণ হয় এবং অতিমাত্রায় সামঞ্জস্যহীনতা (যা একটি ওআরকে সংক্রামিত করে) এবং অপর্যাপ্ত নমুনার আকারের সমস্যাগুলি প্রকাশ করে।

পাঠকদের জন্য অনুস্মারক হিসাবে: সিম্পসনের প্যারাডক্স একটি অত্যন্ত সুনির্দিষ্ট ঘটনা যা এমন একটি ঘটনাকে বোঝায় যেখানে একটি সমিতি একটি বিভ্রান্তিক পরিবর্তনশীলকে নিয়ন্ত্রণ করার পরে দিকটি পিছলে । বার্কলে ভর্তির ডেটা ছিল প্রেরণাদায়ী উদাহরণ example সেখানে, অপরিশোধিত আরআরগুলি দেখিয়েছিল যে বার্কলে নারীদের গ্রহণ করার সম্ভাবনা কম ছিল। যাইহোক, একবার বিভাগগুলি দ্বারা স্তরিত হওয়ার পরে , আরআরগুলি দেখিয়েছিল যে প্রতিটি বিভাগেই মহিলাদের গ্রহণযোগ্যতার সম্ভাবনা বেশি । তারা কেবল সেই কঠিন বিভাগগুলিতে আবেদন করার সম্ভাবনা বেশি ছিল যা অনেক লোককে প্রত্যাখ্যান করেছিল।

কার্যকারণ অনুমান তত্ত্বের ক্ষেত্রে, আমরা এই ধারণাটি ভেবে বিস্মিত হই যে বিভাগটি লিঙ্গের কারণ হিসাবে প্রয়োগ করেছে one। লিঙ্গ অভ্যন্তরীণ অধিকার? ভাল, হ্যাঁ এবং না। মিটেনেন এই জাতীয় সমস্যাগুলির জন্য "স্টাডি বেস" পদ্ধতির পক্ষে যুক্তি দেখিয়েছিলেন: জনসংখ্যা কে? এটি সমস্ত যোগ্য শিক্ষার্থী নয়, তারাই বিশেষত বার্কলে-তে আবেদন করেন। আরও প্রতিযোগিতামূলক বিভাগগুলি নারীদের বার্কলে আবেদনের জন্য আকৃষ্ট করেছে যখন তারা অন্যথায় আবেদন না করত। প্রসারিত করার জন্য: একজন মহিলা যিনি গভীর বুদ্ধিমান বোধগম্য হন ইঞ্জিনিয়ারিং প্রোগ্রামটি সেরা হতে চান। বার্কলে কোনও দুর্দান্ত ইঞ্জিনিয়ারিং প্রোগ্রাম না থাকলে তিনি যেভাবেই বার্কলে-তে আবেদন না করতেন, তিনি এমআইটি বা ক্যালপলিতে আবেদন করতেন। সুতরাং এই আলোকে, "প্রয়োগকারী শিক্ষার্থী" জনসংখ্যা, বিভাগ লিঙ্গ সৃষ্টি করে এবং একটি বিভ্রান্তকারী। (সতর্কতা: আমি প্রথম জেনারেল কলেজের ছাত্র তাই কোন প্রোগ্রামগুলি কীসের জন্য বিখ্যাত তা সম্পর্কে খুব বেশি কিছু জানেন না)।

সুতরাং আমরা এই ডেটা সংক্ষিপ্ত কিভাবে? এটি সত্য যে বার্কলে একজন মহিলার চেয়ে বেশি আবেদন করেছিলেন এমন একজনকে স্বীকার করার সম্ভাবনা বেশি ছিল। এবং এটি সত্য যে বার্কলে বিভাগগুলি পুরুষদের ভর্তির চেয়ে মহিলাদের ভর্তি করার সম্ভাবনা বেশি ছিল। অপরিশোধিত এবং স্তরিত আরআরগুলি অ-কার্যকারণীয় হলেও বুদ্ধিমান ব্যবস্থা non এটি পরিসংখ্যানবিদ হিসাবে আমাদের শব্দের সাথে সুনির্দিষ্ট হওয়া কতটা গুরুত্বপূর্ণ তা নির্দেশ করে (নম্র লেখক নিজেকে দূর থেকে সুনির্দিষ্ট বলে মনে করেন না)।

বিস্ময়করতা অ-সঙ্কোচনযোগ্যতা থেকে পৃথক একটি ঘটনা, বাদ দেওয়া পরিবর্তনশীল পক্ষপাতিত্বের অন্য রূপ তবে এটি যা অনুমানের উপর হালকা প্রভাব ফেলতে পরিচিত। লজিস্টিক রিগ্রেশন থেকে পৃথক, অ-সঙ্কোচনীয়তা রৈখিক প্রতিরোধের পক্ষপাত ঘটায় না এবং জেলম্যানের উদাহরণে অবিচ্ছিন্নভাবে বিবেচনা করা আরও বিশদভাবে বর্ণনা করা উচিত ছিল।

অ্যান্ড্রু তার যৌনতা / উচ্চতা সমন্বিত আয়ের মডেলটিতে যৌন সহগ সম্পর্কে ব্যাখ্যা মডেলটির অনুমানগুলির প্রকৃতি প্রকাশ করে: বংশের অনুমিতি। প্রকৃতপক্ষে রৈখিক মডেলটিতে, পুরুষ এবং মহিলাদের মধ্যে এই ধরনের তুলনা সক্ষম করা হয় কারণ একটি নির্দিষ্ট মহিলার জন্য, আমরা ভবিষ্যদ্বাণী করতে পারিপুরুষ তার মতো উচ্চতা অর্জন করতে পারে, এমনকি যদি তাকে পর্যবেক্ষণ না করা হয়। এটির ক্ষেত্রেও যদি কেউ প্রভাব পরিবর্তনের অনুমতি দেয়, যাতে মহিলাদের মধ্যে প্রবণতার ঝালটি পুরুষদের চেয়ে আলাদা হয়। অন্যদিকে, আমি মনে করি না যে এটি একই উঁচু পুরুষ এবং মহিলা সম্পর্কে ধারণা করা এত পাগল, inches 66 ইঞ্চি প্রকৃতপক্ষে একজন লম্বা মহিলা এবং সংক্ষিপ্ত পুরুষ হবে। এটি আমার কাছে স্থূল এক্সট্রোপোলেশনের চেয়ে হালকা প্রজেকশন বলে মনে হচ্ছে। তদুপরি, যেহেতু মডেল অনুমানগুলি স্পষ্টভাবে বলা যেতে পারে, তাই এটি পাঠকদের বুঝতে সাহায্য করে যে যৌন স্তরযুক্ত আয়-উচ্চতা সমিতি এমন তথ্য বহন করে যা পার হয়ে bণ নেওয়া হয় বা এর মধ্যে গড় হয়পুরুষ এবং মহিলা নমুনা। যদি এই জাতীয় সমিতি হ'ল অনুমানের বিষয়, তবে বুদ্ধিমান পরিসংখ্যানবিদ স্পষ্টতই প্রভাব পরিবর্তনের সম্ভাবনা বিবেচনা করবেন।


2
দুর্দান্ত আলোচনা। একজন পরিসংখ্যানবিদ হিসাবে, মানুষ যখন কোনও গবেষণার ফলাফল নিয়ে কথা বলে তখন তা আমাকে শেষ পর্যন্ত বিরক্ত করে না, তবে তারা প্রান্তিক বা শর্তসাপেক্ষ প্রভাব সম্পর্কে কথা বলছে কিনা তা নিশ্চিত নয়।
ক্লিফ এবি

1

"উদাহরণস্বরূপ, কোনও পুরুষ এবং একজনের উভয়ই 66 66 ইঞ্চি লম্বা মহিলার তুলনা করুন কেন? এটি লম্বা মহিলার সাথে একটি ছোট পুরুষের তুলনা হবে "

মডেল ধরে নেয় যে আয় লিঙ্গ এবং উচ্চতার উপর নির্ভর করে। তবে, উচ্চতা যেভাবে উচ্চ আয়ের উত্পন্ন করে তা পুরুষ এবং মহিলাদের ক্ষেত্রে একই নাও হতে পারে। মহিলারা এমন একটি উচ্চতায় লম্বা "যথেষ্ট" হিসাবে বিবেচিত হতে পারে যার জন্য কোনও পুরুষকে এখনও ছোট হিসাবে বিবেচনা করা যেতে পারে।

নিম্নলিখিত পদ্ধতিতে মডেলটিকে সহজতর করা কার্যকর হতে পারে।

ধরে নিন যে আপনি বড় পোশাক খুচরা বিক্রেতাদের দোকানে একটি সহায়ক সহকারী হিসাবে নিযুক্ত হওয়ার সম্ভাবনাটি পুনরুদ্ধার করতে চান এবং নিম্নলিখিত সনাক্তকরণ কৌশলটি বিবেচনা করুন।

আপনি পর্যবেক্ষণ করেছেন যে নিয়োগকর্তারা নির্দিষ্ট ন্যূনতম উচ্চতা পূরণকারী কর্মী নিয়োগের ক্ষেত্রে বেশি সম্ভাবনা রাখেন, যেখানে "ন্যূনতম" লিঙ্গের সাথে সম্পর্কিত।

সেন্টিমিটারে উচ্চতা পরিমাপ করার পরিবর্তে, ধরে নেওয়া যাক যে দুটি উচ্চ স্তরের মান বিদ্যমান যা নির্ধারিত হয় যে যথাক্রমে একজন পুরুষ এবং মহিলা "লম্বা":> = 180 সেমি পুরুষদের জন্য এবং> = 170 সেমি মহিলাদের জন্য।

ধরে নিই যে প্রান্তিকতা বাস্তবে বিদ্যমান (যেমন নিয়োগকর্তারা মহিলা এবং ১9৯ সেমি বা ১cm১ সেমি লম্বা হওয়ার মধ্যে একটি প্রকৃত চিহ্নিত পার্থক্য তৈরি করে) এবং সেগুলি সঠিক, আপনি লম্বা / সংক্ষিপ্ত পুরুষ এবং মহিলা নির্ধারণকারী একটি ডামি তৈরি করতে সক্ষম হন। বিভিন্ন উচ্চতার পুরুষ ও মহিলা এখনও আপনার ডামির একই বিভাগে পড়তে পারে এবং একই সময়ে আপনার পরিমাপটি সেই নির্দিষ্ট শ্রমের বাজারের প্রকৃত গতিশীলতার সাথে সামঞ্জস্যপূর্ণ।


-1

আপনি কি বলছেন (আরও স্পষ্ট ভাষায়) যে সাধারণ লিঙ্গ লড়াই বলতে পুরুষদের নারীদের চেয়ে বেশি আয়ের সম্ভাবনা রয়েছে যেহেতু তাদের আয়ের পরিমাণ%% বেশি, তেমনি বৈষম্যমূলকভাবে পক্ষপাতিত্ব করা হবে?

সম্ভবত এটি একটি পয়েন্ট। অন্তর্নিহিত অন্তর্নিহিত বিশ্লেষণগুলি না দেখে আমরা দেখতে দেখতে তাদের দেখতে দেখতে ঝোঁক।

সিম্পসনের প্যারাডক্সের goর্ধ্বে যেতে আমাদের এই প্রশ্নের উত্তর দিতে হবে "একজন মহিলার তুলনায় একই পরিমাণ নিরপেক্ষ কাজ করা একজন মহিলাকে আরও কত টাকা দেয়?" তারপরে কেউ বলতে পারেন যে তাদের গর্ভবতী হতে হবে এবং তাদের বাচ্চাদের আরও বেশি বড় করা উচিত যা তাদের সহকর্মী যা সত্য তবে গুরুত্বপূর্ণ বিষয়টি কেবল এইভাবে বলা যেতে পারে যে, "মহিলারা নারী হওয়ার খুব কম সুযোগ রয়েছে" এবং একটি গভীর শর্তসাপেক্ষ পরিসংখ্যান সহ বিশ্লেষণগুলি আমাদের দেখতে পাবে যে মূলত সমান সুযোগ রয়েছে এবং তারা যৌনতার সাথে সম্পর্কিত নয় এমন অন্যান্য কারণ যা পরিসংখ্যানকে যৌনতার সাথে সম্পর্কিত বৈষম্য বলে মনে হয়।


এটি বোঝার জন্য এটি কার্যকর হতে পারে যে এ জাতীয় বিশ্লেষণ অগত্যা কার্যকারণীয় বা ব্যাখ্যাযোগ্য হতে পারে না, তবে বিদ্যমান ঘটনার বর্ণনামূলক।
অ্যাডামো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.