বর্গমূল, লগ ইত্যাদির মতো সাধারণগুলির বাইরে অন্য কোন সাধারণকরণের রূপান্তরগুলি সাধারণত ব্যবহৃত হয়?


10

পরীক্ষার স্কোরগুলির বিশ্লেষণে (যেমন, শিক্ষা বা মনোবিজ্ঞানের ক্ষেত্রে) সাধারণ বিশ্লেষণ কৌশলগুলি প্রায়শই ধরে নেয় যে ডেটা সাধারণত বিতরণ করা হয়। তবে, সম্ভবত প্রায়শই বেশি না, স্কোরগুলি কখনও কখনও স্বাভাবিক থেকে বন্যভাবে বিচ্যুত হয়।

আমি কিছু বেসিক নরমালাইজিং ট্রান্সফর্মেশনগুলির সাথে পরিচিত, যেমন: স্কোয়ার শিকড়, লোগারিদম, ইতিবাচক স্কিউ হ্রাস করার জন্য পারস্পরিক পরিবর্তন, নেতিবাচক স্কিউ হ্রাস করার জন্য উপরের প্রতিফলিত সংস্করণ, লেপটোকার্টিক বিতরণের জন্য স্কোয়ারিং। আমি আরকসিন রূপান্তর এবং পাওয়ার ট্রান্সফর্মেশনগুলির কথা শুনেছি, যদিও আমি তাদের সম্পর্কে সত্যই জ্ঞাত নই।

সুতরাং, আমি কৌতূহলী যে অন্যান্য রূপান্তরগুলি সাধারণত বিশ্লেষকরা ব্যবহার করেন?

উত্তর:


5

বক্স-কক্সবাজার রূপান্তর আপনি যেগুলি উদাহৃত অনেক অন্তর্ভুক্ত করা হয়েছে। কিছু বিবরণের জন্য এই উত্তর দেখুন:

আপডেট: এই স্লাইডগুলি বক্স-কক্স রূপান্তরগুলির একটি দুর্দান্ত ভাল ওভারভিউ সরবরাহ করে।


যদি আমরা বক্স-কক্স রূপান্তরিত ডেটাতে টি-সরঞ্জাম প্রয়োগ করি তবে আমরা রূপান্তরিত ডেটার অর্থের পার্থক্য সম্পর্কে সূচনা পেয়ে যাব। পরিমাপের মূল স্কেলগুলিতে আমরা কীভাবে তা ব্যাখ্যা করতে পারি? (রূপান্তরিত মানগুলির গড় রূপান্তরিত গড় নয়)। অন্য কথায় (আমি সঠিক হলে), পরিবর্তিত স্কেলে গড়ের অনুমানের বিপরীত রূপান্তর করা, মূল স্কেলটিতে গড়টির কোনও অনুমান দেয় না।
জর্জ ডোনটাস

@ gd047, কিছু পরীক্ষা ডেটা নয়, গড় বিতরণের স্বাভাবিকতা ধরে নেয়। টি-পরীক্ষাটি অন্তর্নিহিত ডেটাগুলিতে বেশ শক্তিশালী আর্ট হতে পারে। আপনি ঠিক বলেছেন - পোস্ট-ট্রান্সফর্মেশন টেস্ট সহ, ফলাফলগুলি উল্টো-রূপান্তরকরণের পরে রিপোর্ট করা হয়, এবং ব্যাখ্যাটি খুব সমস্যাযুক্ত হতে পারে। এটি আপনার ডেটা কীভাবে "অস্বাভাবিক" হবে তা নেমে আসে, আপনি কী রূপান্তর বা প্রয়োগ না করে বলতে পারেন, লগ রূপান্তর যা ব্যাখ্যা করা সহজ। অন্যথায়, এটি প্রকৃত রূপান্তর এবং ডোমেনের ক্ষেত্রে প্রাসঙ্গিক এবং আমার সত্যিই ভাল উত্তর পাবে না। অন্যেরা কী বলেছে তা জিজ্ঞাসা করার যোগ্য হতে পারে?
Ars

10

প্রথম পদক্ষেপ হওয়া উচিত জিজ্ঞাসা কেন আপনার ভেরিয়েবল অ স্বাভাবিকভাবে বিতরণ করা হয়। এটি আলোকিত হতে পারে। আমার অভিজ্ঞতা থেকে সাধারণ ফলাফল:

  • সিলিং ইফেক্ট থাকে যখন ক্ষমতা পরীক্ষা (যেমন, পরীক্ষা, বুদ্ধি পরীক্ষা, ভর্তি পরীক্ষা) নেতিবাচকভাবে স্কিউড হয় এবং মেঝে প্রভাব আছে যখন ইতিবাচক skew হয়। উভয় অনুসন্ধানই প্রমাণ করে যে পরীক্ষার অসুবিধা স্তরটি নমুনার জন্য অপ্টিমাইজড নয়, হয় অত্যন্ত সহজতর বা সর্বোত্তমভাবে পার্থক্যগত দক্ষতার পক্ষে খুব জটিল। এটি আরও বোঝায় যে সুদের সুপ্ত পরিবর্তনশীলটি এখনও সাধারণভাবে বিতরণ করা যেতে পারে তবে পরীক্ষার কাঠামোটি পরিমাপযোগ্য ভেরিয়েবলের মধ্যে একটি স্কিউ প্ররোচিত করছে।
  • দক্ষতা পরীক্ষাগুলিতে কম স্কোরারের ক্ষেত্রে প্রায়শই বিদেশী থাকে। সংক্ষেপে একটি পরীক্ষা খারাপভাবে করার অনেক উপায় আছে। বিশেষত এটি পরীক্ষাগুলিতে কখনও কখনও দেখা যায় যেখানে শিক্ষার্থীদের একটি অল্প শতাংশ রয়েছে যেখানে দক্ষতার অভাব এবং প্রচেষ্টার অভাবের সংমিশ্রণটি খুব কম পরীক্ষার স্কোর তৈরি করতে মিলিত হয়েছে। এটি সূচিত করে যে সুদের সুপ্ত পরিবর্তনশীল সম্ভবত কয়েকজন বহিরাগত রয়েছে।
  • স্ব-প্রতিবেদন পরীক্ষার (যেমন, ব্যক্তিত্ব, দৃষ্টিভঙ্গি পরীক্ষা ইত্যাদি) সম্পর্কিত স্কিউ প্রায়শই ঘটে যখন নমুনাটি মাপের অভ্যন্তরীণভাবে বেশি থাকে (উদাহরণস্বরূপ, জীবনের সন্তুষ্টি বিতরণ নেতিবাচকভাবে স্কু হয় কারণ বেশিরভাগ মানুষ সন্তুষ্ট থাকে) বা যখন স্কেল হয় পরীক্ষার জন্য যে নমুনা প্রয়োগ করা হচ্ছে তার থেকে আলাদা একটি নমুনার জন্য অনুকূলিত করা হয়েছে (উদাহরণস্বরূপ, একটি নন-ক্লিনিকাল নমুনায় হতাশার ক্লিনিকাল পরিমাপ প্রয়োগ করা)।

এই প্রথম পদক্ষেপটি পরীক্ষায় নকশা পরিবর্তনের পরামর্শ দিতে পারে। আপনি যদি আগে থেকে এই বিষয়গুলি সম্পর্কে সচেতন হন তবে আপনি যদি এগুলি সমস্যা হিসাবে দেখেন তবে আপনি এগুলি এড়াতে আপনার পরীক্ষা ডিজাইনও করতে পারেন।

দ্বিতীয় ধাপ হয় কি করার সিদ্ধান্ত নেন অবস্থা যেখানে আপনি অ-স্বাভাবিক তথ্য আছে হবে। দ্রষ্টব্য রূপান্তরগুলি কেবল একটি সম্ভাব্য কৌশল। আমি স্বাভাবিকতা অ-স্বাভাবিকতা সম্পর্কে পূর্ববর্তী উত্তর থেকে পুনরাবৃত্তি করব :

  • অনেকগুলি প্রক্রিয়া যা অবশিষ্টাংশের স্বাভাবিকতা ধরে নেয় তা অবশিষ্টাংশের স্বাভাবিকতার পরিমিত লঙ্ঘনের শক্তিশালী
  • বুটস্ট্র্যাপিং সাধারণত একটি ভাল কৌশল
  • রূপান্তরগুলি আরও ভাল কৌশল। নোট করুন যে আমার অভিজ্ঞতা থেকে যে ধরণের হালকা স্কিউ সাধারণত দক্ষতা এবং স্ব-প্রতিবেদন মানসিক পরীক্ষাগুলির সাথে ঘটে তা সাধারণত লগ, স্কয়ার্ট বা বিপরীত রূপান্তর (বা বিপরীত সমতুল্য) ব্যবহার করে প্রায় সাধারণভাবে বিতরণে রূপান্তরিত হতে পারে।

9

জন টুকি ইডিএ সম্পর্কিত তাঁর বইতে রূপান্তরিত আলোচনা করেছেন discus বক্স-কক্স পরিবার ছাড়াও (পরিমিত আকারে বিদ্যুত রূপান্তরকরণ) তিনি অনুপাতের জন্য "ভাঁজ" রূপান্তরগুলির একটি পরিবারকে সংজ্ঞায়িত করেন (মূলত এক্স / (1-এক্স) এর ক্ষমতা) এবং "শুরু" গণনা (গণনা করা ডেটাতে একটি ইতিবাচক অফসেট যুক্ত করে তাদের পরিবর্তন করার আগে)। ভাঁজ রূপান্তরগুলি, যা মূলত লগিটকে সাধারণীকরণ করে, পরীক্ষার স্কোরগুলির জন্য বিশেষভাবে কার্যকর।

একেবারে ভিন্ন শিরায়, জনসন এবং কোটজ বিতরণ সম্পর্কিত তাদের বইতে পরীক্ষার পরিসংখ্যানকে আনুমানিক স্বাভাবিকতা (বা কিছু অন্যান্য লক্ষ্য বন্টনে) রূপান্তর করার উদ্দেশ্যে তৈরি করে, যেমন চি-স্কোয়ারের জন্য কিউব-রুটের রূপান্তর। এই উপাদানটি দরকারী রূপান্তরগুলির জন্য ধারণাগুলির একটি দুর্দান্ত উত্স যখন আপনি অনুমান করেন যে আপনার ডেটা কিছু নির্দিষ্ট বিতরণ অনুসরণ করবে।


2

একটি সহজ বিকল্প হ'ল স্কোরগুলির পরিবর্তে স্কোরগুলির পরিমাণ ব্যবহার করা। বিতরণের যোগফল স্বাভাবিকতার দিকে যায়। উদাহরণস্বরূপ, শিক্ষায় আপনি বেশ কয়েকটি পরীক্ষার মাধ্যমে শিক্ষার্থীর স্কোর যোগ করতে পারেন।

অবশ্যই আরেকটি বিকল্প হ'ল এমন কৌশলগুলি ব্যবহার করা যা সাধারণতা ধরে না নেয়, যা অবমূল্যায়নিত এবং নিম্নরূপিত হয়।


1
আমি বিশ্বাস করি যে পরিমাণগুলি স্বাভাবিক হওয়ার প্রবণতা বন্টনের জন্য অঙ্কগুলি স্বাভাবিক করা প্রয়োজন (উদাহরণস্বরূপ, গড় স্কোরটি ব্যবহার করুন)।

1
হা ঐটা ঠিক. আমার উদাহরণে আমি ধরে নিয়েছিলাম ক্লাসগুলির একই সংখ্যক শিক্ষার্থী থাকবে, যা বাস্তবসম্মত নয়। ধন্যবাদ.
কার্লোস অ্যাকলিওলি

1

XFY LambertW×F

XN(μ,σ2)θ=(μx,σx,δ,α)α1

এখন ডেটা ট্রান্সফরমেশন হিসাবে এটি আকর্ষণীয় হয়ে ওঠে কারণ রূপান্তরটি বাইজেক্টিভ (প্রায় স্কাই কেসটির জন্য বাইজেক্ট) এবং ল্যামবার্টের ডাব্লু ফাংশন (সুতরাং লামবার্ট ডাব্লু এক্স এফ নামটি) ব্যবহার করে স্পষ্টভাবে প্রাপ্ত করা যেতে পারে । এর অর্থ আমরা ডেটা থেকে সঙ্কোচ দূর করতে পারি এবং ভারী লেজগুলি (বাইজেক্টে! )ও সরাতে পারি।

আপনি এটি ব্যবহার করে চেষ্টা করে দেখতে পারেন LambertW আর প্যাকেজ, এটি কিভাবে ব্যবহার করতে ম্যানুয়াল দেখাচ্ছে অনেক উদাহরণ রয়েছে।

অ্যাপ্লিকেশনগুলির জন্য এই পোস্টগুলি দেখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.