অ-সাধারণ তথ্য জন্য সমতা পরীক্ষা?


9

আমার কাছে এমন কিছু ডেটা রয়েছে যা আমি সাধারণ বিতরণ থেকে আঁকার জন্য অগত্যা ধরে নিতে পারি না এবং আমি গ্রুপগুলির মধ্যে সমতার টেস্ট পরিচালনা করতে চাই। সাধারণ তথ্যের জন্য, টোস্টের মতো কৌশল রয়েছে (দুটি একতরফা টি-টেস্ট)। নরমাল ডেটার জন্য টোস্টের সাথে সদৃশ কিছু আছে কি?


1
আমি টোস্টের সাথে পরিচিত নই, তবে আপনি কি মান-হুইটনি খুঁজছেন? এটি একটি অ-পরীক্ষামূলক পরীক্ষা (এই অর্থে যে বিতরণ সম্পর্কে কোনও অনুমান করা হয় না) যা প্রমাণ দেয় যে দুটি গ্রুপ বিভিন্ন বিতরণ থেকে এসেছে।
নিক সাব্বে

1
আমি এমন একটি পরীক্ষার সন্ধান করছি যেখানে নাল অনুমানটি সেখানে পার্থক্য রয়েছে এবং বিকল্প অনুমানটি হ'ল (প্রায়) কোনও পার্থক্য নেই।
রায়ান সি থম্পসন

ছোট নমুনাগুলির জন্য, আপনার স্ট্যাটাস.স্ট্যাকেক্সেঞ্জাওয়েজ / প্রশ্নগুলি / 49782/… এর উত্তরগুলি একবার দেখতে পারেন । বৃহত্তর নমুনাগুলির জন্য, টি টেস্ট সহ ক্লাসিক পদ্ধতির কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি ধন্যবাদ fine
মাইকেল এম

3
"দুটি একতরফা পরীক্ষা" বাক্যাংশে কিছুই নেই - বা অন্তর্নিহিত যুক্তিটি সাধারণ-তত্ত্বকে বোঝায় না। এটি একটি অ-স্বাভাবিক বিতরণ সহ লোকেশন-শিফ্ট বিকল্পের সাথে মানিয়ে নেওয়া পুরোপুরি সম্ভব। তবে সাবধানতা অবলম্বন করুন - নরমাল ডেটা সহ অনেক ক্ষেত্রে আপনি যা চান তা হ'ল স্কেল শিফট ধরণের সমতুল্য পরীক্ষা এবং অন্য ধরণের ডেটা সহ এর পরিবর্তে অন্য কিছু। কী প্রয়োজন তা জেনে রাখা আপনি কী পরিমাপ করছেন এবং কোন সমস্যার সমাধান করছেন তার উপর নির্ভর করে। আপনার প্যাগটি একটি বৃত্তাকার গর্তে চেপে দেখার চেষ্টা করার পরিবর্তে এটি প্যাগটি পরীক্ষা করার জন্য অর্থ প্রদান করে।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


8

ওয়াল্ড-টাইপ টি এবং জেড পরীক্ষার পরিসংখ্যানগুলির জন্য নিযুক্ত টোস্টের যুক্তি (যেমনθ/গুলিθ এবং θ/σθযথাক্রমে) সাইন, সাইন র‌্যাঙ্ক এবং র‌্যাঙ্ক যোগ পরীক্ষার মতো ননপ্যারমেট্রিক পরীক্ষাগুলির জন্য z অনুমানের ক্ষেত্রে প্রয়োগ করা যেতে পারে । সরলতার জন্য আমি ধরে নিয়েছি যে একক শব্দটির সাথে সমতুল্য প্রতিসাম্পত্তিকরূপে প্রকাশিত হয়েছে তবে অসমমিতিক সমতুল্য শর্তে আমার উত্তর প্রসারিত করা সহজবোধ্য।

এটি করার সময় একটি সমস্যা উত্থাপিত হয় তা হ'ল যদি কেউ সমতা শব্দটি প্রকাশ করতে অভ্যস্ত হয় (তবে বলুন, Δ) একই ইউনিট হিসাবে θ, তারপরে সমতুল্য শব্দটি অবশ্যই নির্দিষ্ট চিহ্ন, স্বাক্ষরিত র‌্যাঙ্ক, বা র‌্যাঙ্কের পরিসংখ্যানের ইউনিটে প্রকাশ করা আবশ্যক, যা উভয়ই গর্ভকালীন, এবং এন এর উপর নির্ভরশীল ।

তবে, পরীক্ষার পরিসংখ্যানগুলির নিজেই ইউনিটে টোস্টের সমতা শর্তগুলি প্রকাশ করতে পারে। টোস্টে এটি বিবেচনা করুন, যদিz- র=θ/σθতাহলে z- র1=(Δ-θ)/σθ, এবং z- র2=(θ+ +Δ)/σθ। যদি আমরা করিε=Δ/σθতাহলে z- র1=ε-z- র, এবং z- র2=z- র+ +ε। (এখানে প্রকাশিত পরিসংখ্যান উভয়ই ডান লেজে মূল্যায়ন করা হয় :p1=P(Z>z1) এবং p2=P(Z>z2)।) সমতা / প্রাসঙ্গিকতার প্রান্তিক সংজ্ঞা নির্ধারণের জন্য z ডিস্ট্রিবিউশনের ইউনিটগুলি ব্যবহার করা অনু-প্যারাম্যাট্রিক পরীক্ষাগুলির জন্য পছন্দনীয় হতে পারে, যেহেতু বিকল্পটি স্বাক্ষরযুক্ত-র‌্যাঙ্ক বা র‌্যাঙ্ক সংখ্যার ইউনিটগুলিতে প্রান্তিক সংজ্ঞা দেয়, যা গবেষকদের কাছে যথেষ্ট অর্থহীন এবং কঠিন হতে পারে ব্যাখ্যা।

যদি আমরা তা স্বীকার করি (প্রতিসাম্য সমতুল্য ব্যবধানের জন্য) কোনও টোস্ট নাল হাইপোথিসিসকে প্রত্যাখ্যান করা সম্ভব না যখন εz1α, তারপরে আমরা সেই অনুযায়ী সমতুল্য শব্দটির উপযুক্ত আকারের বিষয়ে সিদ্ধান্ত নিতে এগিয়ে যেতে পারি। উদাহরণ স্বরূপε=z1α+0.5

এই পন্থাটি স্টাটার জন্য প্যাকেজ টুস্টে ধারাবাহিকতা সংশোধন ইত্যাদি বিকল্পের সাথে বাস্তবায়িত হয়েছে (যার মধ্যে এখন শাপিরো-উইলক এবং শাপিরো-ফ্রান্সিয়া পরীক্ষার জন্য নির্দিষ্ট টোস্ট বাস্তবায়ন অন্তর্ভুক্ত রয়েছে), যা আপনি স্টাটাতে টাইপ করে অ্যাক্সেস করতে পারবেন:

সম্পাদনা করুন: কেন টোস্টের যুক্তিটি সুস্পষ্ট, এবং সমতা পরীক্ষার ফর্মেশনগুলি সর্বনিম্ন পরীক্ষায় প্রয়োগ করা হয়েছে, আমি দৃ pers়প্রত্যয়ী হয়েছি যে আমার সমাধানটি শ্যাপিরো-উইলক এবং শাপিরো-ফ্রান্সিয়া পরীক্ষার জন্য আনুমানিক পরিসংখ্যানের গভীর ভুল বোঝাবুঝির উপর ভিত্তি করে ছিল


3

এটি প্রতি সেস্টে টোস্ট নয়, তবে কমলগোরোভ-স্মিমনভ পরীক্ষাটি একজনকে নমুনা বিতরণ এবং দ্বিতীয় রেফারেন্স বিতরণের মধ্যে পার্থক্যের তাৎপর্যের জন্য পরীক্ষা করতে দেয় যা আপনি নির্দিষ্ট করতে পারেন। আপনি এই পরীক্ষাটি ব্যবহার করতে পারেন নির্দিষ্ট ধরণের বিভিন্ন বিতরণকে রায় দেওয়ার জন্য, তবে সাধারণভাবে বিভিন্ন বিতরণ নয় (কমপক্ষে, সমস্ত সম্ভাব্য বিকল্পের পরীক্ষায় ত্রুটি মুদ্রাস্ফীতি নিয়ন্ত্রণ না করেই ... যদি তা কোনওভাবেই সম্ভব হয়)। যে কোনও একটি পরীক্ষার বিকল্প অনুমানটি যথারীতি কম নির্দিষ্ট "ক্যাচ-অল" অনুমান হিসাবে থাকবে।

যদি আপনি দুটি গ্রুপের মধ্যে বিতরণমূলক পার্থক্যের পরীক্ষার জন্য নিষ্পত্তি করতে পারেন যেখানে নাল হাইপোথিসিসটি হল যে দুটি গ্রুপ সমানভাবে বিতরণ করা হয়েছে, আপনি কোমলগোরোভ-স্মারনভ পরীক্ষাটি একটি গ্রুপের বিতরণকে অন্য গ্রুপের সাথে তুলনা করতে ব্যবহার করতে পারেন। এটি সম্ভবত প্রচলিত পদ্ধতি: পার্থক্যগুলি যদি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ না হয় তবে তা উপেক্ষা করুন এবং একটি পরীক্ষার পরিসংখ্যান সহ এই সিদ্ধান্তকে ন্যায়সঙ্গত করুন।

যাই হোক না কেন, আপনি শূন্য অনুমানকে প্রত্যাখ্যান করার জন্য "অল-অ-কিছুই না" পদ্ধতির উদ্ভূত কিছু গভীর বিষয় বিবেচনা করতে পারেন। ক্রস যাচাইকরণে এই জাতীয় একটি সমস্যা এখানে খুব জনপ্রিয়: " স্বাভাবিকতা পরীক্ষাটি কি 'প্রয়োজনীয়ভাবে অকেজো'? " মানুষ স্বাভাবিকতা-পরীক্ষার প্রশ্নগুলির একটি প্রশ্নের উত্তর দিতে পছন্দ করে: "আপনি কেন এটি পরীক্ষা করতে চান?" আমার ধারণা, উদ্দেশ্যটি সাধারণত পরীক্ষার কারণকে অকার্যকর করে তোলা, যা শেষ পর্যন্ত সঠিক দিকে পরিচালিত করতে পারে। আমি এখানে লিঙ্ক করেছি এমন প্রশ্নের প্রতিক্রিয়াগুলির সংক্ষিপ্তসারটি নীচে বলে মনে হচ্ছে:

  1. যদি আপনি প্যারামেট্রিক পরীক্ষা অনুমানের লঙ্ঘন সম্পর্কে উদ্বিগ্ন হন তবে আপনার কেবল এমন একটি ননপ্রেমেট্রিক পরীক্ষা পাওয়া উচিত যা পরিবর্তে বিতরণযোগ্য অনুমানগুলি তৈরি করে না। আপনার ননপ্যারমেট্রিক পরীক্ষা ব্যবহার করতে হবে কিনা তা পরীক্ষা করবেন না; শুধু এটি ব্যবহার করুন!
  2. আপনার প্রশ্নটি প্রতিস্থাপন করা উচিত, "আমার বিতরণটি কি উল্লেখযোগ্যভাবে অস্বাভাবিক?" সহ, "আমার বিতরণটি কতটা অ-স্বাভাবিক, এবং কীভাবে এটি আমার আগ্রহের বিশ্লেষণগুলিকে প্রভাবিত করতে পারে?" উদাহরণস্বরূপ, কেন্দ্রীয় প্রবণতা সম্পর্কিত পরীক্ষা (বিশেষত অর্থের সাথে জড়িত) কুর্তোসিসের চেয়ে স্কিউনেসের প্রতি আরও সংবেদনশীল হতে পারে এবং এর বিপরীতে (কো) বৈকল্পিকতা সম্পর্কিত পরীক্ষাগুলিও হতে পারে। তবুও, বেশিরভাগ বিশ্লেষণমূলক উদ্দেশ্যে এমন শক্ত বিকল্প রয়েছে যা উভয় ধরণের অ-স্বাভাবিকতার পক্ষে খুব সংবেদনশীল নয়।

আপনি যদি এখনও সমতার পরীক্ষা চালাতে চান তবে এখানে ক্রস ভ্যালিডেটের উপর আরেকটি জনপ্রিয় আলোচনা যা সমতুল্য পরীক্ষার সাথে জড়িত।


1
ইক্যুয়্যালেন্স পরীক্ষাটি সুপ্রতিষ্ঠিত এবং আপনি এর নাল অনুমানগুলি ভুল বোঝেন যা সাধারণত এইচ ফর্মের0:|θθ0|Δ। এটি একটি অন্তর্বর্তী অনুমান যা অনুবাদ করতে পারে, উদাহরণস্বরূপ, দুটি একতরফা পরীক্ষায় (টোস্ট): এইচ01:θθ0Δ, বা এইচ01:θθ0Δ। যদি কেউ এইচ01 ও এইচ02, তাহলে আপনাকে অবশ্যই এই সিদ্ধান্তে পৌঁছাতে হবে Δ<θθ0<Δ, অর্থাত্ আপনার গ্রুপগুলি অন্তরের মধ্যে সমান[Δ,Δ]
অ্যালেক্সিস

যথেষ্ট ফর্সা; আমি সম্ভবত কিছুটা বিভ্রান্তিকর ছিল। আপনি যে অংশগুলিকে আপত্তি করছেন বলে আমি মনে করি সেগুলি সরিয়ে নিয়েছি। যাইহোক, আমি মনে করি আপনি আপনার মন্তব্যটি কিছুটা জোরালোভাবে বলেছেন। বাধ্যতামূলক দ্বিধাত্বক fail to/ rejectদৃষ্টিভঙ্গি সুপ্রতিষ্ঠিত হওয়া সত্ত্বেও , বেশিরভাগ নমুনা সম্পূর্ণরূপে নাল সত্য বলে সম্ভাবনাটি হ্রাস করতে পারে না। কেউ যদি প্রত্যাখ্যানের জন্য জোর দেয় তবে প্রায়শই মিথ্যা প্রত্যাখ্যান ত্রুটির কিছুটা সম্ভাবনা থাকে যা সাধারণত আক্ষরিক অর্থে প্রয়োজনীয় হয় না। মূলত এটিই আমি তৈরি করা সবচেয়ে গুরুত্বপূর্ণ পয়েন্ট ছিল। আশা করি মুছে ফেলা জিনিসগুলি ছাড়াই এটি এখন আরও পরিষ্কার
নিক স্টাউনার

2
ঠিক আছে, আমার মতে, সমতুল্য পরীক্ষার শক্তি (যেমন এইচ0) পার্থক্যের জন্য পরিচিত পরীক্ষাগুলির সাথে তাদের সংমিশ্রণ থেকে আসে (যেমন এইচ0+)। এটি পরীক্ষা করে দেখুন: (1) এইচ প্রত্যাখ্যান করুন0+ & প্রত্যাখ্যান এইচ0, প্রাসঙ্গিক পার্থক্য উপসংহার ; (২) প্রত্যাখ্যান নয় এইচ0+ & প্রত্যাখ্যান এইচ0সমতা সমাপ্ত (জন্যΔ); (3) এইচ0+ & প্রত্যাখ্যান এইচ0, তুচ্ছ পার্থক্য শেষ করুন (অর্থাত্ এটি আছে, কিন্তু আপনি যত্ন করেন না); এবং (4) প্রত্যাখ্যান এইচ0+ & প্রত্যাখ্যান এইচ0, উপসংহার অনিরাপদ _ / _ আন্ডারপাওয়ার্ড পরীক্ষাগুলি শেষ করুন । রাখে ক্ষমতা বিশ্লেষণ মধ্যে থেকে কার্যকররূপে।
অ্যালেক্সিস

অবশ্যই, সংবেদনশীলতা এবং নির্দিষ্টকরণের বিষয়গুলি, পিপিভি এবং এনপিভি দূরে যায় না।
অ্যালেক্সিস

-1

সমতা কখনই আমরা পরীক্ষা করতে পারি না । অনুমান সম্পর্কে চিন্তা করুন:এইচ0:এক্সY বনাম এইচ1:এক্স=Y। এনএইচএসটি তত্ত্ব আমাদের জানায় যে নালীর নীচে আমরা বেছে নিতে পারি কোনও কিছু নীচে পারিএইচ0যে ডেটা সেরা ফিট করে। এর অর্থ আমরা প্রায় সবসময় ইচ্ছামত বিতরণের কাছাকাছি যেতে পারি। উদাহরণস্বরূপ, যদি আমি পরীক্ষা করতে চাইএক্স~এন(0,1), সম্ভাব্যতা মডেল যা পৃথক বিতরণের অনুমতি দেয় ^এক্স এবং ^Yসমালোচনামূলক পরীক্ষার অনুমানের লঙ্ঘন, নালীর নীচে সর্বদা বেশি সম্ভাবনা থাকে। এমনকি যদি নমুনা হয়এক্স=ওয়াই অনুরূপভাবে, আমি একটি সম্ভাবনা অনুপাত পেতে পারি যা নির্বিচারে 1 এর সাথে কাছাকাছি হয় Yএক্স

আপনি যদি ডেটার জন্য উপযুক্ত সম্ভাব্যতা মডেল জানেন তবে আপনি বিকল্প মডেলগুলি র‌্যাঙ্ক করার জন্য একটি দন্ডিত তথ্য মাপদণ্ড ব্যবহার করতে পারেন । একটি উপায় হ'ল দুটি সম্ভাব্যতা মডেলের বিআইসি ব্যবহার করা (যার মধ্যে একটি অনুমান করা হয়এইচ0 এবং এইচ1। আমি একটি সাধারণ সম্ভাবনার মডেল ব্যবহার করেছি তবে আপনি হাতের মাধ্যমে বা জিএলএম ব্যবহার করে যে কোনও ধরণের সর্বাধিক সম্ভাবনা পদ্ধতি থেকে সহজেই একটি বিআইসি পেতে পারেন। এই স্ট্যাকওভারফ্লো পোস্টটি ফিটিং বিতরণের জন্য মর্যাদাপূর্ণ rit এটি করার একটি উদাহরণ এখানে রয়েছে:

set.seed(123)
p <- replicate(1000, { ## generate data under the null
  x <- rnorm(100)
  g <- sample(0:1, 100, replace=T)
  BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)

দেয়

> mean(p)
[1] 0.034

পিএখানে নলের মডেলগুলির বিআইসি (পৃথক মডেল) বিকল্প মডেলের (সমমানের মডেল) তুলনায় ভাল (নিম্ন) ভাল বলে অনুপাত এখানে। এটি পরিসংখ্যান পরীক্ষার নামমাত্র ০.০৫ স্তরের খুব অসাধারণ।

অন্যদিকে যদি আমরা গ্রহণ করি:

set.seed(123)
p <- replicate(1000, { ## generate data under the null
  x <- rnorm(100)
  g <- sample(0:1, 100, replace=T)
  x <- x + 0.4*g
  BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)

দেয়:

> mean(p)
[1] 0.437

NHST এর মতো এখানেও বিদ্যুতের সূক্ষ্ম সমস্যা এবং মিথ্যা ইতিবাচক ত্রুটি হারগুলি রয়েছে যা সুনির্দিষ্ট সিদ্ধান্তে নেওয়ার আগে সিমুলেশন দিয়ে অন্বেষণ করা উচিত।

আমি মনে করি অনুরূপ (সম্ভবত আরও সাধারণ পদ্ধতি) বায়েসিয়ান পরিসংখ্যান ব্যবহার করছে সম্ভাব্যতার মডেল অনুসারে উত্তরোত্তর তুলনা করতে।


2
অ্যাডামো আপনি "টেস্টিং সমতা" এর সাথে "পরীক্ষার সাম্য" কে বিবাদ করছেন বলে মনে হচ্ছে। পরবর্তীকালের পদ্ধতি এবং প্রয়োগে এক দশক পুরাতন এবং শক্ত সাহিত্য রয়েছে।
অ্যালেক্সিস

1
উদাহরণস্বরূপ, ওয়েল্লেক, এস (2010) দেখুন। সাম্য এবং অহীনতার পরিসংখ্যান অনুমানের পরীক্ষা করা । চ্যাপম্যান এবং হল / সিআরসি প্রেস, দ্বিতীয় সংস্করণ।
অ্যালেক্সিস

@ অ্যালেক্সিস হুম, দুর্ভাগ্যক্রমে আমাদের কোনও লাইব্রেরিতে অ্যাক্সেস নেই। আপনি কি বলছেন যে সমতুল্যতা হীন-হীনমন্যতার অনুরূপ যেমন একটি প্রান্তিকের মধ্যে থাকা অনুমানকে সমতুল্য বলে বিবেচনা করা হয়?
অ্যাডমো

1
একেবারে নয়: অ-হীনমন্যতা কোনও মানদণ্ড বিয়োগের তুলনায় আরও খারাপ কিছু সম্পাদন করে না এমন একটি পার্শ্ববর্তী পরীক্ষা যা একটি প্রাইরি নির্দিষ্ট করা হয় । সমানতা জন্য টেস্ট নাল হাইপোথিসিস পরীক্ষা করে দুই (বা তার বেশি) পরিমাণে চেয়ে ক্ষুদ্রতম প্রাসঙ্গিক পার্থক্য নিদিষ্ট আরো বাই দিক বিভিন্ন-ইন পারেন হয় অবরোহী । কিছু সেমিনাল কাগজপত্র:
অ্যালেক্সিস

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.