"পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ" কেন পর্যাপ্ত নয়?


46

আমি আমার ডেটা বিশ্লেষণ সম্পন্ন করেছি এবং "পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ফলাফল" পেয়েছি যা আমার অনুমানের সাথে সামঞ্জস্যপূর্ণ। তবে পরিসংখ্যানের এক শিক্ষার্থী আমাকে বলেছিলেন এটি একটি অকালিক উপসংহার। কেন? আমার রিপোর্টে অন্তর্ভুক্ত করার মতো আর কি কি আছে?


4
এটি "হাইপোথিসিসের সাথে সামঞ্জস্যপূর্ণ পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ফলাফল পেয়েছি" তার অর্থের উপরে এটি অনেকটা নির্ভর করে। যদি আপনার অনুমানটি হ'ল বাতাস গাছ দ্বারা উত্পাদিত হয় এবং আপনার পরীক্ষাটি দেখায় যে 100% পর্যবেক্ষণে যখন গাছগুলি তাদের শাখাগুলি চলছিল তখন বাতাস ছিল, আপনি এটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ বলে মনে করেন এবং আপনার সিদ্ধান্তটি প্রমাণিত হয়েছে। যা স্পষ্টতই ভুল। সুতরাং, এটি those ক্ষেত্রেগুলির মধ্যে একটি হতে পারে।
সাশকেলো

1
ভালভাবে ডিজাইন করা ডেটা সংগ্রহ, একই মডেল এবং একই হাইপোথিসিস পরীক্ষাটি ব্যবহার করে - যথাযথতার সাথে "গুরুত্বপূর্ণ সন্ধান" নিরাপদে ঘোষণা করার জন্য আপনার সত্যিকারের ফলোআপ অধ্যয়নের প্রয়োজন হবে। এছাড়াও আপনাকে এটি নিশ্চিত করতে হবে যে আপনার বর্তমান ডেটা সেটটি "সাধারণ জনসংখ্যার" প্রতিনিধিত্ব করে যা আপনি একটি উল্লেখযোগ্য অনুসন্ধানের সাথে দাবি করছেন (এটি "বড় ডেটা" দিয়ে অনুক্রমের জন্য মূল সমস্যা)
সম্ভাব্যতাব্লোগ

1
নিশ্চয় উত্তরটি 'পারস্পরিক সম্পর্ক কার্যকারণ নয়' এর মতোই সহজ?
ভগ্নাংশ

1
এখানে আমার প্রিয় একটি: যে লোকেরা বেশি ভাত খায় তাদের বেশি বাচ্চা হয়। পরীক্ষা করা হচ্ছে পুরো বিশ্ব জনসংখ্যা, আপনি পরিসংখ্যানগত signifcant ফলাফল পেতে হবে ...
Karoly Horvath

4
দুর্দান্ত উত্তর, তবে আমি অবাক হয়েছি কেউই এর সুস্পষ্ট সমাধানের পরামর্শ দেয়নি: তাকে জিজ্ঞাসা করুন। যখনই কেউ আপনাকে বলে যে আপনি আপনার কাজের বিষয়ে বা অন্য কোনও বিষয় সম্পর্কে আপনার সম্পর্কে ভুল, কেবল জিজ্ঞাসা করুন। কাউকে তার ভুল বলা কারণ এক্স, ওয়াই এবং জেড দুর্দান্ত - এটি একটি শেখার সুযোগ। তবে কাউকে নিজের ভুল বলার কথা বলা এবং তাড়াহুড়ো করা ডিক মুভ।
সিলভারড্রাগ

উত্তর:


53

হাইপোথিসিস পরীক্ষা বনাম প্যারামিটার অনুমান mation

সাধারণত হাইপোথেসিসগুলি বাইনারি পদ্ধতিতে ফ্রেম করা হয়। আমি দিকনির্দেশক হাইপোথিসিকে একদিকে রাখব, কারণ তারা বিষয়টি খুব বেশি পরিবর্তন করে না। কমপক্ষে মনোবিজ্ঞানের ক্ষেত্রে, হাইপোথেসিসের বিষয়ে কথা বলা সাধারণ: গ্রুপের অর্থ পার্থক্য শূন্য নয় বা নয়; পারস্পরিক সম্পর্ক শূন্য বা না; রিগ্রেশন সহগ শূন্য বা না; আর-বর্গটি শূন্য বা না। এই সমস্ত ক্ষেত্রে, কোনও প্রভাবের একটি নাল অনুমান, এবং একটি প্রভাবের বিকল্প অনুমান আছে।

এই বাইনারি চিন্তাভাবনাটি আমরা সাধারণত যা আগ্রহী তা নয়। একবার আপনি যখন আপনার গবেষণা প্রশ্নটি সম্পর্কে চিন্তা করেন, আপনি প্রায় সর্বদা খুঁজে পাবেন যে আপনি প্যারামিটারগুলি অনুমান করতে আগ্রহী। আপনি গ্রুপের অর্থগুলির মধ্যে প্রকৃত পার্থক্য বা পারস্পরিক সম্পর্কের আকার, বা রিগ্রেশন সহগের আকার বা ভিন্নতার পরিমাণ ব্যাখ্যা করার বিষয়ে আগ্রহী।

অবশ্যই, আমরা যখন ডেটার নমুনা পাই, তখন প্যারামিটারের নমুনা অনুমান জনসংখ্যার প্যারামিটারের মতো হয় না। সুতরাং প্যারামিটারের মান কী হতে পারে সে সম্পর্কে আমাদের অনিশ্চয়তার পরিমাণ নির্ধারণের একটি উপায় আমাদের প্রয়োজন। ঘনঘনবাদী দৃষ্টিকোণ থেকে, আত্মবিশ্বাসের ব্যবধানগুলি করার একটি উপায় সরবরাহ করে, যদিও বায়সিয়ান খ্রিস্টবাদীরা তর্ক করতে পারে যে তারা আপনাকে যে-অনুভূতিটি করতে চাইতে পারে তা কঠোরভাবে অনুমতি দেয় না। বায়েশীয় দৃষ্টিকোণ থেকে, উত্তরোত্তর ঘনত্বগুলিতে বিশ্বাসযোগ্য ব্যবধানগুলি জনসংখ্যার প্যারামিটারের মান সম্পর্কে আপনার অনিশ্চয়তা প্রশমিত করার আরও প্রত্যক্ষ উপায় সরবরাহ করে।

পরামিতি / প্রভাব আকার

R2

মনোবিজ্ঞানের একটি বিশাল সাহিত্য রয়েছে (এবং অন্যান্য ক্ষেত্রগুলি) পি-মানগুলি, নাল অনুমানের তাত্পর্য পরীক্ষা করার জন্য, এবং আরও অনেক কিছুতে (এই গুগল স্কলারের অনুসন্ধান দেখুন ) focus এই সাহিত্যটি প্রায়শই একটি রেজোলিউশন হিসাবে আত্মবিশ্বাসের ব্যবধানগুলির সাথে প্রভাবের আকারগুলির প্রতিবেদন করার প্রস্তাব দেয় (উদাঃ, উইলকিনসনের এপিএ টাস্ক ফোর্স, 1999)।

বাইনারি অনুমান পরীক্ষা থেকে দূরে সরে যাওয়ার পদক্ষেপ for

আপনি যদি এই চিন্তাভাবনাটি অবলম্বন করার কথা ভাবছেন তবে আমি মনে করি যে আপনি নিতে পারেন ক্রমহ্রাসমান আরও পরিশীলিত পন্থা রয়েছে:

  • পন্থা 1 এ। কাঁচা এবং মানক উভয় পদেই আপনার নমুনা প্রভাব (উদাহরণস্বরূপ, গ্রুপ মানে পার্থক্য) এর পয়েন্ট আনুমানিক রিপোর্ট করুন। যখন আপনি আপনার ফলাফলগুলি প্রতিবেদন করেন তত্ত্ব এবং অনুশীলনের জন্য এরকম বিশালতা কী হবে তা নিয়ে আলোচনা করে।
  • অ্যাপ্রোচ 1 বি। 1a যোগ করুন, কমপক্ষে খুব বেসিক স্তরে, আপনার নমুনা আকারের উপর ভিত্তি করে আপনার প্যারামিটার অনুমানের আশেপাশের কিছুটা অনিশ্চয়তার অনুভূতি।
  • পদ্ধতির ২. এছাড়াও প্রভাব আকারের উপর আস্থা অন্তরগুলি প্রতিবেদন করুন এবং আগ্রহের প্যারামিটারের কলুষিত মূল্যবোধগুলি সম্পর্কে আপনার চিন্তাভাবনায় এই অনিশ্চয়তা অন্তর্ভুক্ত করুন।
  • পদ্ধতির ৩. বায়েশিয়ানের বিশ্বাসযোগ্য ব্যবধানগুলির প্রতিবেদন করুন এবং সেই বিশ্বাসযোগ্য ব্যবধানে বিভিন্ন অনুমানের প্রভাবগুলি পরীক্ষা করুন, যেমন পূর্বের পছন্দ, আপনার মডেল দ্বারা সূচিত ডেটা উত্পন্নকরণ প্রক্রিয়া ইত্যাদি and

অনেকগুলি সম্ভাব্য উল্লেখগুলির মধ্যে, আপনি অ্যান্ড্রু গেলম্যান তার ব্লগে এবং তার গবেষণায় এই বিষয়গুলি সম্পর্কে প্রচুর কথা বলবেন।

তথ্যসূত্র

  • নিকারসন, আরএস (2000) নাল হাইপোথিসিস তাত্পর্য পরীক্ষা: একটি পুরানো এবং অব্যাহত বিতর্ক একটি পর্যালোচনা। মানসিক পদ্ধতি, 5 (2), 241।
  • উইলকিনসন, এল। (1999) মনোবিজ্ঞান জার্নালে পরিসংখ্যান পদ্ধতি: নির্দেশিকা এবং ব্যাখ্যা। আমেরিকান মনোবিজ্ঞানী, 54 (8), 594. পিডিএফ

12
জেরোমির এই মন্তব্যে আরও আমি কী সুপারিশ করতে পারি যে আপনার কাছে পরিসংখ্যানগত তাত্পর্য সম্পর্কিত ধর্মগ্রন্থ সম্পর্কিত একটি জিলিয়াক এবং ম্যাকক্লোস্কির রচনা রয়েছে। এটি সর্বাধিক উদ্বেগজনক পরিসংখ্যান নয়, তবে এটি প্রভাবশালী মাপ, ব্যবহারিক তাত্পর্য এবং ক্ষতির কার্যকারিতা অত্যন্ত গুরুত্বপূর্ণ কেন তা নিয়ে চিন্তাশীল - এবং বিনোদনমূলক - সরবরাহ করে provide deirdremccloskey.com/docs/jsm.pdf
জিম

আমি মনে করি কখনও কখনও পি .05 এর চেয়ে কম সেট করা উচিত। আপনাকে সকলকে ধন্যবাদ: গাং, জেরোমি এবং জিম
জিম ভন

1
জিলিয়াক [এনবি] এবং ম্যাকক্লোস্কি: আপনি যদি ব্যস্ত থাকেন তবে প্রথমে phil.vt.edu/dmayo/personal_website/… পড়ুন । আপনি যদি ব্যস্ত না হন, তবুও এটি প্রথমে পড়ুন।
নিক কক্স

আপনাকে স্বাগতম, জিমভন on এফডাব্লুআইডাব্লু, আমার মাঝে মাঝে মনে হয় পি .05 এর চেয়ে বেশি সেট করা উচিত । এটা ঠিক নির্ভর করে।
গুং - মনিকা পুনরায়

1
ড। গেলম্যান নামকরণ করা দেখতে পেয়ে খুব খুশী। স্পষ্টতই তিনি পি-মানগুলি প্রতিবেদন করতেও পছন্দ করেন না , গুরুতর অনুমানের জন্য এগুলি ব্যবহার করতে দিন। অবশ্যই অবশ্যই আপনার সমস্ত ভেরিয়েবলকে মানক করার জন্য একটি ভাল কেস তৈরি করেছে।
ছায়াছবির

26

কেবল বিদ্যমান উত্তরগুলিতে যুক্ত করতে (যা দুর্দান্ত, উপায় দ্বারা)। সচেতন হওয়া জরুরী যে পরিসংখ্যানগত তাত্পর্যটি নমুনা আকারের একটি ক্রিয়া

আপনি যখন আরও এবং বেশি ডেটা পান, আপনি যেখানেই দেখেন সেখানে পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ পার্থক্য খুঁজে পেতে পারেন। যখন ডেটার পরিমাণ বিশাল হয়, এমনকি ক্ষুদ্রতম প্রভাবগুলি পরিসংখ্যানিক তাত্পর্যও বাড়ে। এর দ্বারা বোঝানো হয় না যে প্রভাবগুলি কোনও ব্যবহারিক উপায়ে অর্থবহ।

pp


এটি আমার স্লাইড 13 এড্রেসড পয়েন্ট :)
স্টাফেন লরেন্ট

6
এই জন্য +1। তাত্পর্য উপলব্ধি না করা লোকেরা নমুনা আকারের একটি কাজ আমাকে বাদাম চালায়।
ফোমাইট

12

আপনার অধ্যয়নটি চালানোর আগে যদি আপনার হাইপোথিসিস সন্দেহের পক্ষে যুক্তিসঙ্গত ভিত্তি ছিল; এবং আপনি একটি ভাল গবেষণা চালিয়েছেন (উদাহরণস্বরূপ, আপনি কোনও বিভ্রান্তি প্ররোচিত করেন নি); এবং আপনার ফলাফলগুলি আপনার অনুমানের সাথে সামঞ্জস্যপূর্ণ এবং পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ ছিল; তবে আমি মনে করি আপনি ঠিক আছেন, যতদূর যায়।

যাইহোক, আপনার ভাবা উচিত নয় যে তাত্পর্যগুলি আপনার ফলাফলগুলিতে গুরুত্বপূর্ণ। প্রথমত, আপনার পাশাপাশি প্রভাবের আকারটিও দেখতে হবে (আমার উত্তরটি এখানে দেখুন: তাত্পর্য হিসাবে তাত্পর্য হিসাবে প্রভাবের আকার )। আপনি আপনার ডেটাটি কিছুটা এক্সপ্লোর করতে চাইতে পারেন এবং আপনি যদি এমন কোনও সম্ভাব্য আকর্ষণীয় চমক পেতে পারেন যা অনুসরণ করার জন্য উপযুক্ত হতে পারে।


আপনার মানে হাইপোথিসিসটি যুক্তিসঙ্গত হওয়া উচিত? এবং কীভাবে বিচার করবেন যে আমার অনুমানটি অর্থহীন ডেটা বিশ্লেষণে নেতৃত্ব দেবে? "সম্ভাব্য আকর্ষণীয় আশ্চর্য" পোস্ট-হক দ্বারা প্রকাশ করা উচিত?
জিম ভন

আমার অর্থ হ'ল, সম্ভবত 1 ম স্থানে অধ্যয়ন চালানোর কোনও বৈধ কারণ ছিল। বর্তমান তাত্ত্বিক জ্ঞান এবং / অথবা সাম্প্রতিক গবেষণাগুলি পরামর্শ দিয়েছিল যে আপনার অনুমানটি সত্য হতে পারে। আপনার অনুমানটি অসম্পূর্ণ না হলে "অর্থহীন ডেটা বিশ্লেষণের দিকে পরিচালিত" করার সম্ভাবনা নেই। আপনার ডেটার সম্ভাব্য আকর্ষণীয় আশ্চর্য / বৈশিষ্ট্যগুলি পোস্ট-হক খুব ভালভাবে আবিষ্কার করা যেতে পারে; তারা বিস্মিত হওয়ার বিষয়টি বোঝায় যে আপনি অধ্যয়নের পরিকল্পনা করার সময় সেগুলি ঘটবে তা জানতেন না। "পোস্ট-হক" সম্পর্কিত সমস্যাটি অবাক করে বিশ্বাস করতে হবে কিনা - ভবিষ্যতের গবেষণার মাধ্যমে তাদের নিশ্চিত হওয়া দরকার।
গুং - মনিকা পুনরায়

7

এটি এবং এই এবং এই এবং এই সম্পর্কে রিপোর্ট করার আগে আপনি পরীক্ষামূলক ডেটা থেকে আপনার কী শিখতে চান তা সূচনা করে শুরু করুন। সাধারণ হাইপোথিসিস টেস্টগুলির প্রধান সমস্যা (এই পরীক্ষাগুলি আমরা স্কুলে শিখি ...) দ্বিখণ্ডতা নয়: মূল সমস্যাটি হ'ল অনুমানের পরীক্ষা যা আগ্রহের হাইপোথিসিস নয়। 13 স্লাইড এখানে দেখুন (অ্যানিমেশন প্রশংসা করতে পিডিএফ ডাউনলোড করুন)। প্রভাব আকারগুলি সম্পর্কে , এই ধারণার কোনও সাধারণ সংজ্ঞা নেই । সত্যই আমি এটি অ-বিশেষজ্ঞ পরিসংখ্যানবিদদের জন্য ব্যবহার করার পরামর্শ দেব না, এগুলি প্রযুক্তিগত, প্রাকৃতিক নয়, "প্রভাব" এর পদক্ষেপ। আপনার আগ্রহের হাইপোথিসিসটি সাধারণ লোকদের দ্বারা বোধগম্য পদে রচনা করা উচিত।


1
একটি ছোট সংযোজন - নাল অনুমানের আসলে স্ট্যান্ডার্ড এইচটি প্রয়োগের জন্য বর্তমান ডেটা বিশ্লেষণের প্রসঙ্গে বাইরে কিছু বোঝানো উচিত। এটি "উদ্ভাবিত" হওয়া উচিত নয় যাতে আপনার তত্ত্ব / সন্ধানের পক্ষে প্রত্যাখ্যান করার মতো কিছু থাকে।
সম্ভাব্যতা ব্লগ

2

আমি পরিসংখ্যান বিশেষজ্ঞ থেকে অনেক দূরে, তবে আমি আজ পর্যন্ত করা স্ট্যাটাস কোর্সে একটি বিষয়কে গুরুত্ব দেওয়া হয়েছে সেটি হ'ল "ব্যবহারিক তাত্পর্য" এর বিষয়টি। আমি বিশ্বাস করি যে "এফেক্ট সাইজ" উল্লেখ করার সময় জেরোমি এবং গাং কী নিয়ে কথা বলছে তার প্রতি ইঙ্গিত দেয়।

আমাদের একটি 12 সপ্তাহের ডায়েটের ক্লাসে একটি উদাহরণ রয়েছে যা পরিসংখ্যানগতভাবে ওজন হ্রাসের ফলাফল হিসাবে পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ, তবে 95% আত্মবিশ্বাসের ব্যবধানে গড় ওজন হ্রাস 0.2 এবং 1.2 কেজি দেখায় (ঠিক আছে, সম্ভবত ডেটা তৈরি হয়েছিল তবে এটি একটি বিন্দুর চিত্র তুলে ধরে) । যদিও "পরিসংখ্যানগতভাবে উল্লেখযোগ্যভাবে" "শূন্য থেকে পৃথক, 200 সপ্তাহের ওজন হ্রাস 12 সপ্তাহের বেশি হওয়া কি স্বাস্থ্যকর হওয়ার চেষ্টা করা অতিরিক্ত ওজনের ব্যক্তির" কার্যকরভাবে গুরুত্বপূর্ণ "ফলাফল?


এটি আমার স্লাইড 13 নিম্নলিখিত পয়েন্ট :) :)
স্টাফেন লরেন্ট

2
এটি "ভুল" নাল অনুমানের পরীক্ষা করার উদাহরণও। এটি আপনার আগ্রহী সিদ্ধান্তে নয়। আরও ভাল অনুমানের পরীক্ষাটি হ'ল যে ওজন হ্রাস 5 কেজি থেকে 5 কেজি এর চেয়ে কম কম loss
সম্ভাব্যতা

1

আপনার অধ্যয়নের আরও বিশদ এবং ব্যক্তির সমালোচনা না জেনে সঠিক উত্তর দেওয়া অসম্ভব। তবে এখানে একটি সম্ভাবনা রয়েছে: আপনি যদি একাধিক পরীক্ষা চালিয়েছেন এবং আপনি p<0.05যেটিকে অন্যের সামনে এসে পৌঁছেছেন এবং তার প্রতি দৃষ্টিপাত করেন তার দিকে মনোনিবেশ করা বেছে নিয়ে থাকেন, তবে আপনার "নির্বাচনী মনোযোগের" দিকে তাত্পর্যপূর্ণ হওয়ার কারণে সেই "তাত্পর্য" হ্রাস পেয়েছে। এর জন্য একটি অন্তর্দৃষ্টি পাম্প হিসাবে, মনে রাখবেন যে এর p=0.05অর্থ হল "নাল অনুমানটি সত্য থাকলেও এই ফলাফলটি ঘটনাক্রমে (কেবলমাত্র) 5% হয়ে যাবে"। সুতরাং আপনি যত বেশি পরীক্ষা চালান, তত বেশি সম্ভাবনা রয়েছে যে তাদের মধ্যে অন্তত একটি "সুযোগ" দ্বারা "উল্লেখযোগ্য" ফলাফল হবে। এমনকি সেখানে কোনও প্রভাব না থাকলেও। দেখুন http://en.wikipedia.org/wiki/Multiple_comparisons এবং http://en.wikipedia.org/wiki/Post-hoc_analysis


0

আমি আপনাকে নিম্নলিখিতটি পড়ার পরামর্শ দিচ্ছি:

অ্যান্ডারসন, ডিআর, বার্নহ্যাম, কেপি, থম্পসন, ডাব্লুএল, 2000. নাল অনুমানের পরীক্ষা: সমস্যা, প্রসার এবং একটি বিকল্প ale জে ওয়াইল্ড পরিচালনা করুন। 64, 912-923। জিগেরেনজার, জি।, 2004. মাইন্ডলেস পরিসংখ্যান। সামাজিক-অর্থনীতি জার্নাল 33, 587-606। জনসন, ডিএইচ, 1999. পরিসংখ্যানের গুরুত্বের পরীক্ষার তুচ্ছতা। জার্নাল অফ ওয়াইল্ড লাইফ ম্যানেজমেন্ট 63, 763-772।

নাল হাইপোথেসিসগুলি এই অর্থে খুব কমই আকর্ষণীয় যে কোনও পরীক্ষা বা পর্যবেক্ষণের সেট থেকে দুটি ফলাফল পাওয়া যায়: নালটিকে সঠিকভাবে প্রত্যাখ্যান করা বা দ্বিতীয় ধরণের ত্রুটি করা। প্রভাব আকারটি যা আপনি সম্ভবত নির্ধারণে আকর্ষণীয় এবং একবার হয়ে গেলে, আপনার প্রভাবের আকারের জন্য আত্মবিশ্বাসের অন্তর অন্তর্ভুক্ত করা উচিত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.