লগ রূপান্তরটি কি অ-স্বাভাবিক ডেটা-টেস্টিংয়ের জন্য বৈধ কৌশল?


19

একটি গবেষণাপত্র পর্যালোচনা করে, লেখকরা বলেছিলেন, "স্বাভাবিকতার পূর্বশর্ত অনুমানকে মেটাতে টি পরীক্ষা করার আগে প্রাকৃতিক লোগারিদম ব্যবহার করে ক্রমাগত বিতরণ প্রদর্শনকারী ক্রমাগত ফলাফলের পরিবর্তনগুলি পরিবর্তন করা হয়েছিল।"

অ-স্বাভাবিক তথ্য বিশ্লেষণ করার কি এটি একটি গ্রহণযোগ্য উপায়, বিশেষত যদি অন্তর্নিহিত বিতরণ অগত্যা লগমনরমাল না হয়?

এটি খুব বোকা প্রশ্ন হতে পারে, তবে আমি এর আগে এটি দেখিনি ....


3
আচ্ছা, প্রাথমিক বিতরণ যদি লগ-স্বাভাবিক না হয় তবে রূপান্তরিত ডেটা স্বাভাবিকতার পূর্বশর্ত অনুমানগুলি পূরণ করে না, তাহলে রূপান্তর দ্বারা কী অর্জন করা হচ্ছে?
ম্যাক্রো

@ ম্যাক্রো - যথেষ্ট সত্য! (+1) - তারা সম্ভবত বিতরণগুলি প্রতিসমের কাছাকাছি পেতে চেয়েছিলেন, যা টি-পরীক্ষার জন্য করানো খারাপ জিনিস নয়, তবে যতক্ষণ না তারা পরীক্ষা করে তা লিখে রাখে, আমরা জানি না লগ কিনা রূপান্তর একটি নেতিবাচক স্কিউ প্ররোচিত যা পরিস্থিতি আরও খারাপ করেছে ...
jboman

2
আমরা এটি অনুমান করতে পারি কারণ এটি স্বাভাবিকতা সন্তুষ্ট করার জন্য করা হয়েছিল এবং প্রথম স্থানে স্বাভাবিকতা পরীক্ষা করা হয়েছিল, সেই স্বাভাবিকতা পরে পরীক্ষা করা হয়েছিল। এটি এখানে ভাষায় দৃ strongly়ভাবে নিহিত।
জন

10
লগারিদমগুলির জন্য একটি টি-টেস্ট অপ্রত্যাশিত তথ্যের জন্য টি-টেস্ট বা ননপ্যারামেট্রিক পরীক্ষার মতো নয়। লগগুলিতে টি-পরীক্ষা জ্যামিতিক অর্থের তুলনা করে, (সাধারণ) পাটিগণিত মানে নয়। লোগারিদমগুলি ব্যবহারযোগ্য কিনা তা প্রয়োগ করার ক্ষেত্রে এটি বেশ কয়েকটি গুরুত্বপূর্ণ বিবেচনার মধ্যে একটি (যা প্রয়োগের উপর নির্ভর করে এটি হতে পারে)।
whuber

উত্তর:


9

স্বাভাবিক নয় এমন ডেটার মুখোমুখি হওয়ার সময় কিছুটা রূপান্তরকে স্বাভাবিকতার (যেমন লোগারিদম, বর্গাকার শিকড়, ... ব্যবহার করে) প্রয়োগ করার চেষ্টা করা সাধারণ। যদিও লোগারিদম যুক্তভাবে প্রায়শই স্কিউড ডেটার জন্য ভাল ফলাফল দেয় তবে এই বিশেষ ক্ষেত্রে এটি কার্যকর হবে এমন কোনও গ্যারান্টি নেই। রূপান্তরিত ডেটা বিশ্লেষণ করার সময় একজনকে উপরের মন্তব্যগুলিও মাথায় রাখতে হবে: "লগারিদমগুলির জন্য একটি টি-টেস্ট অপ্রত্যাশিত তথ্য বা টেস্ট-পরীক্ষার মতো নয়, লগগুলিতে টি-পরীক্ষা জ্যামিতিকের সাথে তুলনা করে মানে, (স্বাভাবিক) পাটিগণিতের অর্থ নয় ""

এন-1Σআমি=1এন(এক্সআমি-এক্স¯)3(এন-1Σআমি=1এন(এক্সআমি-এক্স¯)2)3/2 উপযুক্ত পরীক্ষা এই ক্ষেত্রে পরিসংখ্যাত হয়।

রূপান্তর (যেমন লগারিদম হিসাবে) বেছে নেওয়ার পরিবর্তে এটি বেশিরভাগ সময় কাজ করে, আমি বক্স-কক্স পদ্ধতি ব্যবহার করতে পছন্দ করি প্রদত্ত ডেটা ব্যবহার করে রূপান্তর চয়ন জন্য । যদিও এর সাথে কিছু দার্শনিক সমস্যা রয়েছে; বিশেষত এটি কি টেস্টে মুক্তির ডিগ্রির সংখ্যার উপর প্রভাব ফেলবে কিনা, যেহেতু আমরা নমুনা থেকে কিছু তথ্য ব্যবহার করেছি কোনটি রূপান্তর করতে হবে তা বেছে নেওয়ার সময়।

অবশেষে, রূপান্তরকরণের পরে টি-টেস্ট বা ক্লাসিকাল ননপ্যারামেট্রিক টেস্টের ব্যবহারের একটি ভাল বিকল্প হ'ল টি-পরীক্ষার বুটস্ট্র্যাপ অ্যানালগ ব্যবহার করা । এটির স্বাভাবিকতা অনুমানের প্রয়োজন হয় না এবং অপরিকল্পিত উপায়গুলির (এবং অন্য কোনও কিছুর বিষয়ে নয়) সম্পর্কে একটি পরীক্ষা is


1
+1 শেষে ভাল সুপারিশ সহ ভাল, চিন্তাশীল আলোচনা। T-test এর বুটস্ট্র্যাপ / রীস্যাম্পেলিং / বিন্যাস সংস্করণ সম্পর্কে আরো জানার জন্য, দয়া করে একটি সাম্প্রতিক থ্রেড দেখুন stats.stackexchange.com/q/24911
whuber

0

সাধারণত বললে যদি কোনও টি-পরীক্ষা চালানোর জন্য প্রয়োজনীয় অনুমানগুলি পূরণ না করা হয় তবে প্যারামিমেট্রিক নন পরীক্ষা করা আরও উপযুক্ত।


5
হতে পারে. অ স্থিতিমাপ পরীক্ষা প্রায় সবসময় তুলনা মধ্যমা (অথবা অন্যান্য শতকরা) বদলে মানে এবং সেইজন্য সত্যিই একটি কিছুটা ভিন্ন প্রশ্ন মোকাবেলার। তবে এটি বর্তমান প্রশ্নের সহায়ক জবাব বলে মনে হচ্ছে না, যা ডেটা লগগুলিতে টি-টেস্টিংয়ের বিষয়ে বিশেষভাবে (এবং কেবল) জিজ্ঞাসা করে।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.