ডেটা সংগ্রহ বা ব্যাখ্যার সময় মানুষ সবচেয়ে সাধারণ বায়াসগুলি কী করে?


39

আমি একক / স্ট্যাটাস মেজর। আমি সচেতন যে অর্থনীতিবিদরা মানুষের আচরণ এবং যৌক্তিকতা সম্পর্কে তাদের অনুমানগুলি সংশোধন করার চেষ্টা করেছেন পরিস্থিতি চিহ্নিত করে যেখানে লোকেরা যুক্তিযুক্ত আচরণ করে না। উদাহরণস্বরূপ, আমি তোমাকে একটা 100% সুযোগ অফার অনুমান করা $ বা 1000 হ্রাস একটি একটি 50% সম্ভাবনা $ 2500 ক্ষতি, মানুষ পছন্দ করে $ 2500 বিকল্প যদিও আধুনিক প্রত্যাশিত মান একটি চেয়ে ক্ষতি $ 1000 নিশ্চয়তা ক্ষয়। এটি "লস অ্যাওয়ার্শন" নামে পরিচিত। আচরণী অর্থনীতিবিদগণ এখন এই নিদর্শনগুলি অধ্যয়ন করে এবং মানুষগুলি সাধারণত "যুক্তিবাদী" আচরণ গঠনের জন্য ধরে নেওয়া হয় ax এখানে, আমি ধরে নিই যে এটি সর্বনিম্ন প্রত্যাশিত ক্ষতির চেয়ে বেশি যুক্তিযুক্ত ration

আমি ভাবছিলাম যে পরিসংখ্যানবিদরা ডেটা সংগ্রহের সাধারণ প্যাটার্নগুলি চিহ্নিত করেছেন যা লোকেরা কীভাবে ডেটা ব্যাখ্যা করে তা পক্ষপাতদুষ্ট ফলাফল দেয়। যদি ডেটা সংগ্রহ করার জন্য মূলত "যুক্তিযুক্ত" উপায় ছিল তবে আমি ধরে নিই যে এরকম উদাহরণ রয়েছে যেখানে মানুষ এ থেকে বিচ্যুত হয় এবং "পক্ষপাত" প্রদর্শন করে। যদি তা হয়, তথ্য সংগ্রহ বা ব্যাখ্যার সময় মানুষ সবচেয়ে সাধারণ পক্ষপাতিত্বগুলি কী করে?


5
পডসাকফ এট আল-র একটি দুর্দান্ত কাগজ রয়েছে। যে সাধারণ পদ্ধতির পক্ষপাতদর্শনগুলি পর্যালোচনা করে এবং পরিসংখ্যানগত এবং পদ্ধতিগত উভয় প্রতিকারের প্রস্তাব দেয়: ln.edu.hk/mkt/staff/gcui/CommonMethodBias.pdf টেবিল 2 এ একবার দেখুন
ayhan


10
আপনার অযৌক্তিকতার অযৌক্তিক ধারণা আছে। আপনি ফলাফলটিতে কোনও ইউটিলিটি ফাংশন প্রয়োগ করতে ব্যর্থ হচ্ছেন। আপনার বর্ণিত উদাহরণে, ধরুন যে ব্যক্তির কাছে 1000 ডলার রয়েছে এবং এটি এখন থেকে এক মিনিটের এক গ্যাংস্টারের কাছে repণ শোধ করার জন্য ব্যবহার করা উচিত, বা গুন্ডা দ্বারা হত্যা করা হবে। 100% সুযোগ $ 100% সুযোগ 1000 হ্রাস ফলাফল যেহেতু 50% সম্ভাবনা হত্যা করা, $ 2500 হ্রাস শুধুমাত্র হত্যা করা 50% সম্ভাবনা ফলাফল। ইকন মেজর হিসাবে অযৌক্তিকতা ঘোষণার আগে আপনাকে একটি প্রাথমিক পয়েন্ট হিসাবে ইউটিলিটির সাথে যুক্ত হতে হবে।
মার্ক এল স্টোন

3
পরিসংখ্যানবিদরা সাধারণত এ জাতীয় গবেষণা করেন না। আমি ভাবছি যে এই প্রশ্নটি মনোবিজ্ঞান এবং নিউরোসায়েন্স এসই সাইটের জন্য আরও উপযুক্ত কিনা ।
গুং - মনিকা পুনরায়

3
আমার মনে হয় স্ট্রিটলাইট এফেক্ট - লাইটপোস্টের নীচে হারিয়ে যাওয়া কীগুলি (ডেটা) সন্ধান করা কারণ আলোটি যেখানে রাতের বেলা রয়েছে - এটি এখন প্রচলিত, বিশেষত এখন ট্যাপে এত সহজ ডেটা সহ। // ডেটা সংগ্রহের কোনও "যুক্তিযুক্ত উপায়" নেই কারণ আপনি - গবেষক এটি সংগ্রহ করছেন - এলোমেলোভাবে নয়।
এএস

উত্তর:


23

আমি মনে করি একাডেমিয়ায় পি-মানগুলি খুব সাধারণভাবে ভুল ব্যাখ্যা করা হয়। লোকেরা ভুলে যাওয়ার প্রবণতা রয়েছে যে পি-মানটি শর্তাধীন সম্ভাবনা প্রকাশ করে। এমনকি যদি কোনও পরীক্ষা নিখুঁতভাবে পরিচালিত হয়ে থাকে এবং নির্বাচিত পরিসংখ্যান পরীক্ষার সমস্ত প্রয়োজনীয়তা পূরণ করা হয়, তবে মিথ্যা আবিষ্কারের হার সাধারণত তাত্পর্য স্তরের আলফার চেয়ে অনেক বেশি। মিথ্যা আবিষ্কারের হার পরিসংখ্যানগত শক্তি হ্রাস এবং সত্য পজিটিভের প্রসারের সাথে বেড়েছে (কলকোউন, ২০১৪; নুজো, ২০১৪)।

এছাড়াও লোকেরা তাদের অনুমানকে সত্য এবং প্যারামিটারটিকে এলোমেলো হিসাবে অনুমান করে বলে বিবেচনা করে (হালার এবং ক্রাউস, ২০০২)। উদাহরণস্বরূপ যখন তারা বলে যে "95% ক্ষেত্রে এই স্বীকৃত আত্মবিশ্বাসের ব্যবধানটি প্যারামিটারটি কভার করে" ...

পারস্পরিক সম্পর্ক এবং কার্যকারণের বিভ্রান্তি সম্ভবত ডেটা ব্যাখ্যায় খুব সাধারণ ত্রুটি।

ডেটা সংগ্রহের ক্ষেত্রে, আমি মনে করি একটি সাধারণ ত্রুটি হ'ল সর্বাধিক প্রতিনিধি নমুনার চেয়ে সবচেয়ে সহজে অ্যাক্সেসযোগ্য take

কলকোউন, ডি। (2014) মিথ্যা আবিষ্কারের হার এবং পি মানের মূল্যবোধের তদন্ত। রয়্যাল সোসাইটি ওপেন সায়েন্স, 1-15।

নুজো, আর। (2014) পরিসংখ্যানগত ত্রুটি: পি মানগুলি, পরিসংখ্যানগত বৈধতার "স্বর্ণের মান" অনেক বিজ্ঞানী মনে করেন তত নির্ভরযোগ্য নয়। প্রকৃতি, 506, 150-1515।

হ্যালার, এইচ। ও ক্রাউস, এস। (2002): তাত্পর্যটির ভুল ব্যাখ্যা: একটি সমস্যা শিক্ষার্থীরা তাদের শিক্ষকদের সাথে ভাগ করে নেয়? মনস্তাত্ত্বিক গবেষণা অনলাইন পদ্ধতি, খণ্ড 7, নং 1


19

আমি সত্যিকারের এলোমেলো দেখতে কেমন তা প্রশংসা করতে একটি সাধারণ অক্ষমতা বলব। লোকেরা এলোমেলো ইভেন্টের ক্রমগুলির তুলনায় আসলে খুব অল্প কিছু উদ্দীপক নিদর্শন প্রত্যাশা করে। যখন আমরা নিজেরাই এলোমেলোভাবে অনুকরণ করার চেষ্টা করি তখন এটিও প্রকাশিত হয়।

আর একটি মোটামুটি সাধারণ হ'ল স্বাধীনতা বোঝা না, যেমন জুয়াড়ির ত্রুটি। আমরা কখনও কখনও ভাবি যে পূর্বের ঘটনাগুলি ভবিষ্যতের ঘটনাগুলিকে প্রভাবিত করতে পারে এমনকি এটি স্পষ্টভাবে অসম্ভব, যেমন কার্ডের ঝাঁকানো ডেকের আগের চুক্তির মতো ভবিষ্যতের কোনও প্রভাব ফেলে।


7

ইতিমধ্যে এটি চিহ্নিত করা হয়েছে যে (আচরণগত) অর্থনীতিবিদদের দ্বারা "অযৌক্তিক" বা "পক্ষপাতদুষ্ট" লেবেলযুক্ত অনেকগুলি আচরণ এবং চিন্তার প্রক্রিয়া প্রকৃত বিশ্বে বাস্তবে অত্যন্ত অভিযোজিত এবং দক্ষ। তবুও, ওপির প্রশ্ন আকর্ষণীয়। তবে আমি মনে করি, অর্থনৈতিক সাহিত্যে (যেমন ক্ষতির বিপর্যয়, এন্ডোয়মেন্ট এফেক্ট, যেমন ক্ষতিগ্রস্থতা থেকে বিরত থাকা, এন্ডোয়মেন্ট এফেক্ট, - এর সাথে সম্পর্কিত) নির্দিষ্ট "পক্ষপাত" সন্ধানের চেয়ে আমাদের জ্ঞানীয় প্রক্রিয়াগুলি সম্পর্কে আরও মৌলিক, বর্ণনামূলক জ্ঞানের উল্লেখ করা লাভজনক হতে পারে, বেসরেট অবহেলা ইত্যাদি)।

উদাহরণস্বরূপ, মূল্যায়ন অবশ্যই ডেটা বিশ্লেষণে একটি সমস্যা। মূল্যায়ন তত্ত্বটি বলে যে আমরা আমাদের ওজনের ওজনের তথ্য যা ব্যাখ্যা করতে বা মূল্যায়ন করতে সহজ বলে মনে করি। একটি রিগ্রেশন সহগের ক্ষেত্রে বিবেচনা করুন। সহগের "বাস্তব-বিশ্বের" পরিণতিগুলি মূল্যায়ন করা কঠোর পরিশ্রম হতে পারে। আমাদের একটি স্বাধীন এবং নির্ভরশীল ভেরিয়েবলের ইউনিটগুলিও বিবেচনা করা দরকার যে কোনও সহগের ব্যবহারিক প্রাসঙ্গিকতা আছে কিনা তা বোঝার জন্য আমাদের স্বাধীন এবং নির্ভরশীল ভেরিয়েবলের বিতরণ ছিল। অন্যদিকে সহগের তাত্পর্য মূল্যায়ন করা সহজ: আমি কেবলমাত্র এর পি-মানটিকে আমার আলফা স্তরের সাথে তুলনা করি। গুণাগুলির সাথে তুলনামূলকভাবে পি-মানটির বৃহত্তর মূল্যায়নযোগ্যতা দেওয়া, এটি খুব কমই আশ্চর্যের বিষয় যে এতটুকু পি-মান দিয়ে তৈরি।

(স্ট্যান্ডার্ডাইজিং সহগের মূল্যায়নের পরিমাণ বাড়িয়ে দেয় তবে এটি দ্ব্যর্থহীনতা বৃদ্ধি করতে পারে : প্রাসঙ্গিক তথ্য অনুপলব্ধ বা রক্ষণযোগ্য নয় এমন ধারণাটি যেহেতু আমরা যে ডেটা প্রক্রিয়াকরণ করছি তার "আসল" ফর্মটি আমাদের কাছে উপলভ্য নয়))

একটি সম্পর্কিত জ্ঞানীয় "পক্ষপাত" হ'ল সংক্ষিপ্ততা নীতি, সিদ্ধান্তের প্রসঙ্গে "ডান" সেখানে অতিরিক্ত ওজনের তথ্যের প্রবণতা এবং স্মৃতি থেকে পুনরুদ্ধারের প্রয়োজন হয় না। (সংক্ষিপ্ততার নীতিতে আরও বলা হয়েছে যে আমরা যে ফর্ম্যাটটি দেওয়া হয়েছে তাতে তথ্য ব্যবহার করার সম্ভাবনা রয়েছে এবং রূপান্তর সম্পাদন এড়ানোর ঝোঁক রয়েছে।) পি-ভ্যালু ব্যাখ্যা করা কেবলমাত্র রিগ্রেশন আউটপুটকে দেখেই করা যেতে পারে; আমি যে বিষয়টি মডেলিং করছি তার সম্পর্কে আমার কোনও স্থিতিশীল জ্ঞান পুনরুদ্ধার করতে হবে না।

আমি প্রত্যাশা করি যে পরিসংখ্যান সংক্রান্ত তথ্যের ব্যাখ্যায় অনেক পক্ষপাতিত্বগুলি সাধারণ বোঝার সাথে সনাক্ত করা যায় যে কোনও সমস্যা সমাধান করার সময় বা রায় গঠনের সময় আমরা সহজ রুটটি গ্রহণ করতে পারি ("জ্ঞানীয় বিভ্রান্তি", "আবদ্ধ যৌক্তিকতা" দেখুন এবং তাই) । সম্পর্কিত, "স্বাচ্ছন্দ্য সহকারে" কিছু করা সাধারণত আস্থা অর্জন করে যার সাথে আমরা ফলস্বরূপ বিশ্বাসগুলি ধরে রাখি ( ফ্লুয়েন্স থিওরি )। (যে কোনও ডেটা উচ্চারণ করা সহজ যে সম্ভাবনাটিও বিবেচনা করতে পারে One- নিজের কাছে বা অন্যের কাছে - আমাদের বিশ্লেষণগুলিতে উদ্বিগ্ন।) আমি মনে করি যখন আমরা সম্ভাব্য ব্যতিক্রমগুলি বিবেচনা করি তখন এটি বিশেষভাবে আকর্ষণীয় হয়ে ওঠে। কিছু মনস্তাত্ত্বিক গবেষণা পরামর্শ দেয়, উদাহরণস্বরূপ, যদি আমরা বিশ্বাস করি যে কোনও সমস্যার সমাধান করা কঠিন হওয়া উচিত, তবে আমরা এমন পদ্ধতির এবং সমাধানগুলির পক্ষে যেতে পারি যা কম কংক্রিট এবং আরও কঠিন, যেমন, একটি সহজটির চেয়ে আরও বেশি আরকেন পদ্ধতি বেছে নিতে পারে।


7

আমি যে বৃহত্তম একক ফ্যাক্টরটির কথা ভাবতে পারি তা ব্যাপকভাবে "কনফার্মেশন বায়াস" নামে পরিচিত। আমার অধ্যয়নটি যা দেখায় তা স্থির করে, আমি অস্বীকার করে এমন ডেটা গ্রহণ করি যা এই উপসংহারে পৌঁছায়, আমি অসচেতনভাবে "সুস্পষ্ট উপকরণ ত্রুটি" হিসাবে অস্বীকার করতে পারি (বা কিছু সমতুল্য) এমন কোনও ডেটা পয়েন্ট যা আমার উপসংহারে ফিট করে না। কিছু ক্ষেত্রে, এটি ততটা আপত্তিজনক হবে না; পুরোপুরি data ডেটা পয়েন্টগুলি ছড়িয়ে দেওয়ার পরিবর্তে, আমি "ত্রুটি" মুছে ফেলার জন্য কিছু সূত্র তৈরি করব, যা আমার পূর্বনির্ধারিত সিদ্ধান্তটি নিশ্চিত করার জন্য ফলাফলগুলি সুবিধামতভাবে চালিত করবে।

এ সম্পর্কে বিশেষ অবহেলা করার মতো কিছুই নেই; এটি ঠিক কিভাবে আমাদের মস্তিষ্কের কাজ করে। এ জাতীয় পক্ষপাতিত্ব ফিল্টার করার জন্য এটি প্রচুর প্রচেষ্টা গ্রহণ করে এবং বিজ্ঞানীরা দ্বৈত-অন্ধ গবেষণা সমঝোতা করতে পছন্দ করার একটি কারণ, যা পরিমাপ সম্পাদনকারী ব্যক্তি জানেন না যে পরীক্ষাটি কী প্রমাণিত হবে বলে আশা করা হচ্ছে। তারপরে তাঁর বিশ্বস্ততার সাথে পরিমাপকৃত বিষয়গুলি সামঞ্জস্য না করার জন্য প্রচুর শৃঙ্খলার প্রয়োজন requires


1
আমি মনে করি এটি আসলেই সবচেয়ে বিপজ্জনক পক্ষপাত, কারণ এটি ইতিমধ্যে ডেটা সংগ্রহের পর্যায়ে ঘটতে পারে, উদাহরণস্বরূপ একটি ক্ষুদ্রতর নমুনায় ডেটা সংগ্রহ করা যা আপনার প্রত্যাশা নিশ্চিত করতে বা শীর্ষস্থানীয় জরিপের প্রশ্নগুলি ব্যবহার করার সম্ভাবনা বেশি is
stijn

1
নিশ্চিতকরণ পক্ষপাতগুলি শাখাগুলির মধ্যে সত্যই খারাপ হতে পারে, যেখানে শাখাগুলির কথিত মৌলিক ভিত্তিও পৃথক, নেতৃত্ব দিয়ে যে "এক্স আপনার অনুচ্ছেদে (ব্যবহারের) অসম্ভব (তবে এটি সংবেদনশীল পদ্ধতিগুলি সহ) তবে এটি আমার কাছে সুস্পষ্ট (আমরা পারি ইন্দ্রিয় এক্স) "। উদাহরণস্বরূপ আপেল গাছগুলিতে ঝুলে থাকা বা মাটিতে শুয়ে বোঝানো হয়; তারা নিজের ইচ্ছায় 'পড়তে' পারে না। প্রায়শই, শারীরিক বিজ্ঞানের ক্ষেত্রে গাণিতিক ভিত্তির একটি পরিবর্তন ঘটে যা বিভ্রান্তি লুকিয়ে রাখে।
ফিলিপ ওকলে

6

রৈখিকতা

আমি মনে করি তথ্য ব্যাখ্যা / বিশ্লেষণের সময় একটি সাধারণ পক্ষপাত হ'ল লোকেরা সাধারণত রৈখিক সম্পর্ক ধরে নিতে তত্ক্ষণাত। গাণিতিকভাবে, একটি রিগ্রেশন মডেল ধরে নেয় যে এর নির্দোষ উপাদানটি ভবিষ্যদ্বাণীকারীদের একটি লিনিয়ার ফাংশন; দুর্ভাগ্যক্রমে যে সবসময় সত্য হয় না। আমি সম্প্রতি একটি স্নাতক পোস্টার সম্মেলনে গিয়েছিলাম এবং একটি লিনিয়ার মডেলের সাথে খাপছাড়া চতুষ্কোণ বা অ-রৈখিক প্রবণতাগুলি যে পরিমাণে ফিট করে দেখলাম তা কমপক্ষে বলতে গেলে উদ্বেগজনক হয়েছিল।

p জুয়ার্সের মিথ্যাচার মূল্য ভুল ব্যাখ্যা এবং সত্য এলোমেলোতার ; সমস্ত প্রাসঙ্গিক পোস্টে +1))


2

একটি আন্তর্জাতীয় কেস হ'ল জুয়ার্স ফ্যালাসির আলোচনা।

বিদ্যমান ডেটা কি অন্তর্ভুক্ত করা উচিত বা বাদ দেওয়া উচিত? আমি যদি ইতিমধ্যে 6 ছক্কা নিয়ে এগিয়ে আছি তবে এগুলি কি আমার এক ডজন চেষ্টা চালানোর অন্তর্ভুক্ত? পূর্ববর্তী ডেটা সম্পর্কে পরিষ্কার থাকুন।

আমি কখন পরম সংখ্যা থেকে অনুপাতের দিকে পরিবর্তন করব? এটি একটি দীর্ঘ সময় লাগেআন্তঃজয়ী বিজয়ের ধারাবাহিকতায় শূন্যে ফিরে যাওয়ার জন্য এলোমেলো সুবিধার জন্য সময় (এলোমেলো হাঁটা)।

এক মিলিয়ন ডলারের 0.1% একটি বড় সংস্থার পক্ষে খুব বেশি নাও হতে পারে, তবে একক ব্যবসায়ীর জীবন ও মৃত্যু হতে পারে $ 1000 ডলার (যে কারণে বিনিয়োগকারীরা 'চালিত' লোকেরা বিনিয়োগ করতে চায়)। শতাংশে স্থানান্তর করতে সক্ষম হওয়া পক্ষপাত হতে পারে।

এমনকি পরিসংখ্যানবিদদেরও বায়াস রয়েছে।


2

আমি সুপারিশ করবে "ভাবছেন, দ্রুত এবং ধীর" দ্বারা ড্যানিয়েল Kahneman , যা স্বচ্ছ ভাষায় অনেক জ্ঞানীয় গোঁড়ামির ব্যাখ্যা করে।

আপনি " http://www.burns-stat.com/review-thinking-fast-slow-daniel-kahneman/ " কেও উল্লেখ করতে পারেন যা উপরোক্ত বইয়ের কিছু পক্ষপাতিত্বের সংক্ষিপ্তসার রেখেছে।

অধ্যায়ে বিশদ অধ্যায়ে সংক্ষিপ্তসারগুলির জন্য আপনি " https://erikreads.files.wordpress.com/2014/04/th سوچ-fast-and-slow-book- summary.pdf " পড়তে চাইতে পারেন ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.