মজবুত টি-টেস্ট


17

আমি এলোমেলো ভেরিয়েবল জন্য স্থানীয় বিকল্প বিপরীতে নাল পরীক্ষা করার চেষ্টা করছি , যা এলোমেলো ভেরিয়েবলের হালকা থেকে মাঝারি স্কিউ এবং কুর্তোসিসের সাপেক্ষে। উইলকক্সের 'রবস্ট এস্টিমেশন অ্যান্ড হাইপোথেসিস টেস্টিংয়ের ভূমিকা'-এর পরামর্শ অনুসরণ করে, আমি ছাঁটাইযুক্ত গড়, মধ্যস্থতা, পাশাপাশি অবস্থানের এম-এসিমেটার (উইলকক্স' "এক-পদক্ষেপ" পদ্ধতি) এর উপর ভিত্তি করে পরীক্ষাগুলি দেখেছি। এই শক্তিশালী পরীক্ষাগুলি স্ট্যান্ডার্ড টি-টেস্টকে ছাড়িয়ে যায়, শক্তির নিরিখে, যখন বিতরণ না করে পরীক্ষা করা হয় যা স্কিউনবিহীন, তবে লেপটোকার্টোটিক।E[X]=0E[X]>0X

যাইহোক, স্কিউডযুক্ত বিতরণ দিয়ে পরীক্ষা করার সময়, এই একতরফা পরীক্ষাগুলি নাল অনুমানের অধীনে হয় খুব বেশি উদারবাদী বা অনেক বেশি রক্ষণশীল, যথাক্রমে বন্টন বামে-বা ডান-স্কিউডের উপর নির্ভর করে। উদাহরণস্বরূপ, 1000 টি পর্যবেক্ষণ সহ, মিডিয়ানের ভিত্তিতে পরীক্ষাটি আসলে নামমাত্র 5% স্তরে ~ 40% সময়কে প্রত্যাখ্যান করে। এর কারণ সুস্পষ্ট: স্কেল বিতরণের জন্য, মধ্যমা এবং গড়টি ভিন্ন। যাইহোক, আমার অ্যাপ্লিকেশনটিতে, আমার সত্যিকারের গড় পরীক্ষা করতে হবে, মিডিয়ান নয়, ছাঁটাই করা গড়টি নয়।

টি-টেস্টের আরও শক্তিশালী সংস্করণ রয়েছে যা প্রকৃতপক্ষে গড়টির জন্য পরীক্ষা করে, তবে স্কিউ এবং কুর্তোসিসের জন্য অভেদ্য?

আদর্শভাবে পদ্ধতিটি নো-স্কিউ, উচ্চ-কুরটোসিস ক্ষেত্রেও ভালভাবে কাজ করবে। 'বাঁক' প্যারামিটার তুলনামূলকভাবে উচ্চতর সেট করে 'এক-পদক্ষেপ' পরীক্ষাটি প্রায় যথেষ্ট ভাল, তবে কোনও স্কিউ না থাকাকালীন এটি ছাঁটাই গড় পরীক্ষার চেয়ে কম শক্তিশালী, এবং স্কিউের অধীনে প্রত্যাখ্যানের নামমাত্র স্তর বজায় রাখতে কিছুটা সমস্যা হয় ।

পটভূমি: কারণটি সম্পর্কে আমি সত্যিই আগ্রহী না কেন এবং মিডিয়ান নয়, তা হ'ল এই পরীক্ষাটি কোনও আর্থিক প্রয়োগে ব্যবহৃত হত। উদাহরণস্বরূপ, যদি আপনি পরীক্ষা করতে চান যে কোনও পোর্টফোলিওতে ইতিবাচক প্রত্যাশিত লগ রিটার্ন রয়েছে কিনা, গড়টি আসলে যথাযথ কারণ আপনি যদি পোর্টফোলিওতে বিনিয়োগ করেন তবে আপনি সমস্ত রিটার্ন (যা নমুনার সংখ্যার গড় সময়) অনুভব করবেন মধ্যমা প্রতিলিপি। এটি, আমি আরভি এক্স থেকে অঙ্কনের যোগফলের বিষয়ে সত্যই যত্নশীল ।nnX


ওয়েলচের টি-টেস্ট ব্যবহার নিষিদ্ধ করার কোন কারণ আছে কি? এই প্রশ্নের ( stats.stackexchange.com/questions/305/… ) আমার উত্তরটি একবার দেখুন যেখানে আমি নরমালতা এবং ভিন্ন ভিন্নতার ক্ষেত্রে ওয়েলচের ব্যবহারের পক্ষে একটি কাগজ উল্লেখ করি।
হেনরিক

1
ঠিক আছে, সমস্যাটি হচ্ছে আমি 1-নমুনা পরীক্ষা চাই, 2-নমুনা পরীক্ষা না! আমি নাল , এবং । আমি কুবিঞ্জার এট দেখব। আল।, কাগজ (Ich kann schlecht Deutsche)। E[X]=μE[X1]=E[X2]
shabbychef

স্পষ্ট করার জন্য ধন্যবাদ। এই ক্ষেত্রে কুবিঞ্জার পেপার আপনার পক্ষে খুব সহায়ক হবে না। আমি দুঃখিত.
হেনরিক

উত্তর:


5

আপনি কেন নন-প্যারাম্যাট্রিক পরীক্ষা দেখছেন? টি-টেস্টের অনুমানগুলি কি লঙ্ঘিত হয়েছে? যথা, অর্ডিনাল বা নন-নরমাল ডেটা এবং ইনকন্ট্যান্ট ভেরিয়েন্সগুলি? অবশ্যই, যদি আপনার নমুনা যথেষ্ট পরিমাণে বড় হয় তবে আপনি নমুনায় স্বাভাবিকতার অভাব সত্ত্বেও এর বৃহত্তর শক্তি দিয়ে প্যারামিট্রিক টি-টেস্টকে ন্যায়সঙ্গত করতে পারেন। তেমনিভাবে যদি আপনার উদ্বেগ অসম বৈকল্পিক হয় তবে প্যারামেট্রিক টেস্টে সংশোধন রয়েছে যা সঠিক পি-মান দেয় (ওয়েলশ সংশোধন)।

অন্যথায়, আপনার ফলাফলকে টি-পরীক্ষার সাথে তুলনা করা এটির পক্ষে ভাল উপায় নয়, কারণ অনুমানগুলি পূরণ না হলে টি-পরীক্ষার ফলাফল পক্ষপাতদুষ্ট থাকে। মান-হুইটনি ইউ একটি উপযুক্ত নন-প্যারাম্যাট্রিক বিকল্প, যদি এটি আপনার সত্যিকারের প্রয়োজন হয়। আপনি কেবলমাত্র ক্ষমতা হারাবেন যখন আপনি নন-প্যারামেট্রিক পরীক্ষা ব্যবহার করছেন যখন আপনি ন্যায়সঙ্গতভাবে টি-টেস্ট ব্যবহার করতে পারেন (কারণ অনুমানগুলি মেটানো হয়েছে)।

এবং আরও কিছু পটভূমির জন্য এখানে যান ...

http://www.jerrydallal.com/LHSP/STUDENT.HTM


ডেটা খুব স্বাভাবিকভাবেই স্বাভাবিক নয় not অতিরিক্ত কুর্তোসিসটি 10-20 এর ক্রমে থাকে, স্কিউ -0.2 থেকে 0.2 হয় order আমি একটি 1-নমুনা টি-পরীক্ষা করছি, সুতরাং আমি নিশ্চিত নই যে আমি 'অসম বৈকল্পিক' বা ইউ-পরীক্ষা সংক্রান্ত আপনাকে অনুসরণ করব।
shabbychef

আমি 'প্যারাম্যাট্রিক পরীক্ষা ব্যবহার করুন' পরামর্শটি গ্রহণ করছি। এটি আমার প্রশ্নের হুবহু সমাধান করে না, তবে আমার প্রশ্নটি সম্ভবত খুব উন্মুক্ত ছিল।
shabbychef

12

আমি সম্মত হই যে আপনি যদি গ্রুপের অর্থগুলি পৃথক (গ্রুপ মিডিয়ান বা ছাঁটাইযুক্ত মাধ্যম ইত্যাদির মধ্যে পার্থক্য পরীক্ষার বিপরীতে) পরীক্ষা করতে চান তবে আপনি একটি ননপ্যারামেট্রিক পরীক্ষা ব্যবহার করতে চান না যা একটি ভিন্ন অনুমানের পরীক্ষা করে।

  1. সাধারণভাবে টি-টেস্টের পি-মানগুলিতে অবশিষ্টাংশের স্বাভাবিকতা অনুমানের মধ্য দিয়ে প্রস্থান করা মোটামুটি সঠিক থাকে। এই দৃust়তা সম্পর্কে একটি অনুজ্ঞান পেতে এই অ্যাপলেটটি দেখুন: http://onlinestatbook.com/stat_sim/robustness/index.html

  2. আপনি যদি এখনও স্বাভাবিকতা অনুমানের লঙ্ঘন সম্পর্কে উদ্বিগ্ন হন তবে আপনি বুটস্ট্র্যাপ করতে পারেন । উদাহরণস্বরূপ, http://biostat.mc.vanderbilt.edu/wiki/pub/Main/ জেনিফারতম্পসন / ms_mtg_18oct07.pdf

  3. স্বাভাবিকতা থেকে প্রস্থান নিয়ে সমস্যাগুলি সমাধান করতে আপনি স্কিউড নির্ভরশীল পরিবর্তনশীলকেও রূপান্তর করতে পারেন ।


2
+1 সুন্দর এবং স্পষ্ট উত্তর। জেরোমি, আমি পয়েন্ট 3 সম্পর্কে একটি প্রশ্ন জিজ্ঞাসা করতে পারি? আমি ডেটা রুপান্তরিত করার পিছনে যুক্তি বুঝতে পারি, কিন্তু কিছু আমাকে সর্বদা এটি করতে বিরক্ত করে। রূপান্তরিত ডেটাতে টি-টেস্টের ফলাফলগুলি অপ্রত্যাশিত ডেটাতে রিপোর্ট করার বৈধতা কী (যেখানে আপনাকে "টি-টেস্ট করার অনুমতি দেওয়া হয় না")? অন্য কথায়, ডেটা যখন দুটি গ্রুপ পৃথক হয়, উদাহরণস্বরূপ, লগ রূপান্তরিত হয়, আপনি কোন ভিত্তিতে কাঁচা তথ্যও আলাদা বলতে পারেন? মনে রাখবেন, আমি কোনও পরিসংখ্যানবিদ নই, তাই সম্ভবত আমি একেবারে বোকা কিছু বলেছি :)
নিকো

2
@ কী, ফলাফল সম্পর্কে কীভাবে রিপোর্ট করবেন বা কীভাবে চিন্তা করবেন সে সম্পর্কে আমি নিশ্চিত নই, তবে আপনি যদি সমস্ত কিছু দেখাতে চান তবে কিছু এক্স এবং ওয়াই, মি_ এক্স! = মি_ওয়াইয়ের জন্য এটি সত্য হওয়া উচিত যে সমস্ত এক্স_আই <এক্স_জে, লগ ( এক্স_আই) <লগ (এক্স_জে) এবং সমস্ত এক্স_আই> এক্স_জে, লগ (এক্স_আই)> লগ (এক্স_জে)। এ কারণেই নন-প্যারাম্যাট্রিক পরীক্ষাগুলি যা র‌্যাঙ্কগুলি নিয়ে কাজ করে, তথ্যের ট্রান্সফর্মেশনগুলি ফলাফলকে প্রভাবিত করে না। আমি এটি থেকে মনে করি, আপনি ধরে নিতে পারেন যে কোনও পরীক্ষায় যদি mu_log (X)! = Mu_log (Y) দেখায় তবে mu_X! = Mu_Y।
জোফ্রহ্ল্ড

উত্তরের জন্য ধন্যবাদ (গুলি)। প্রকৃতপক্ষে, টি-টেস্টটি হালকাভাবে স্কিউ / কুর্তোটিক ইনপুটের নীচে নামমাত্র টাইপ রেট বজায় রাখার জন্য উপস্থিত হয় appears যাইহোক, আমি আরও শক্তি দিয়ে কিছু আশা করছিলাম। পুনরায়: 2, আমি উইলকক্স বাস্তবায়ন করেছি ' trimpbএবং trimcibtতবে তারা আমার শক্তি পরীক্ষা করতে কিছুটা ধীর গতিতে কমপক্ষে আমার স্বাদ জন্য। পুনরায়: 3, আমি এই পদ্ধতিটি ভেবেছিলাম, তবে আমি রূপান্তরিত তথ্যগুলির গড় সম্পর্কে আগ্রহী (অর্থাত্, আমি কোনও টি-টেস্টের সাথে 2 আরভি তুলনা করছি না, এক্ষেত্রে, একঘেয়ে ট্রান্সফর্মটি ভাল হবে) একটি র্যাঙ্ক ভিত্তিক তুলনা, যেমন @JoFrhwld দ্বারা লক্ষনীয়)।
shabbychef

2
@nico যদি দু'টি গোষ্ঠীতে অবশিষ্টাংশের জনসংখ্যা বিতরণ একই হয়, তবে আমি কল্পনা করি যে কোনও সময় কাঁচা জনগোষ্ঠীর মধ্যে পার্থক্য রয়েছে অর্থাত্ একটি সংরক্ষণ-সংরক্ষণের রূপান্তরের গ্রুপ উপায়েও পার্থক্য থাকতে পারে। এটি বলেছে, পি-ভ্যালু এবং আত্মবিশ্বাসের ব্যবধানগুলি আপনি কাঁচা ডেটা ব্যবহার করছেন বা রূপান্তরিত ডেটা ব্যবহার করছেন তার উপর ভিত্তি করে কিছুটা পরিবর্তিত হবে। সাধারণত আমি পরিবর্তনগুলি ব্যবহার করতে পছন্দ করি যখন তারা ভেরিয়েবলটি বোঝার জন্য অর্থবহ মেট্রিকের মতো মনে হয় (যেমন, রিখটার স্কেল, ডেসিবেলস, গণনাগুলির লগ ইত্যাদি)।
জেরোমি অ্যাংলিম


0

কোনও মন্তব্যের জন্য আমার যথেষ্ট খ্যাতি নেই, উত্তর হিসাবে: এই গণনাটি একবার দেখুন । আমি মনে করি এটি একটি দুর্দান্ত উত্তর সরবরাহ করে। সংক্ষেপে:

অ্যাসিমেটোটিক পারফরম্যান্স কুর্তোসিসের আকারের চেয়ে স্বাভাবিকতা থেকে বিচ্যুতির আকারে বিচ্যুত হওয়ার চেয়ে অনেক বেশি সংবেদনশীল ... সুতরাং শিক্ষার্থীর টি-টেস্ট স্কিউনেসে সংবেদনশীল তবে ভারী লেজের বিরুদ্ধে তুলনামূলকভাবে শক্তিশালী, এবং এটির জন্য পরীক্ষা ব্যবহার করা যুক্তিসঙ্গত স্বাভাবিকতা যা টি-টেস্ট প্রয়োগের আগে স্কিউ বিকল্পগুলির দিকে পরিচালিত হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.