বক্স-কক্স রূপান্তরিত ডেটাতে, উত্তর ইউনিটগুলির শর্তে উত্তরগুলি প্রকাশ করুন


13

কিছু পরিমাপের জন্য, বিশ্লেষণের ফলাফলগুলি যথাযথভাবে রূপান্তরিত স্কেলে উপস্থাপন করা হয়। তবে বেশিরভাগ ক্ষেত্রে, ফলাফলগুলি পরিমাপের মূল স্কেলে উপস্থাপন করা বাঞ্ছনীয় (অন্যথায় আপনার কাজটি কম বা বেশি মূল্যহীন)।

উদাহরণস্বরূপ, লগ-ট্রান্সফর্মড ডেটার ক্ষেত্রে, মূল স্কেলটিতে ব্যাখ্যার সাথে একটি সমস্যা দেখা দেয় কারণ লগ ইন করা মানগুলির গড় অর্থ লগ হয় না। লগ স্কেলে গড়ের অনুমানের অ্যান্টিএলগারিদম গ্রহণ করা মূল স্কেলে কোনও গড়ের অনুমান দেয় না।

তবে, লগ-রুপান্তরিত ডেটাগুলিতে প্রতিসম বিতরণ থাকলে নিম্নলিখিত সম্পর্কগুলি ধরে রাখে (যেহেতু লগ ক্রম সংরক্ষণ করে):

Mean[log(Y)]=Median[log(Y)]=log[Median(Y)]

(লগ মানগুলির গড়ের গড়ের অ্যান্টিএলগারিদম হল মাপার মূল স্কেলের মধ্যস্থতা)।

সুতরাং আমি কেবলমাত্র পরিমাপের মূল স্কেলে মধ্যমদের পার্থক্য (বা অনুপাত) সম্পর্কে সূচনা করতে পারি।

দ্বি-নমুনা টি-পরীক্ষা এবং আত্মবিশ্বাসের ব্যবধানগুলি সবচেয়ে নির্ভরযোগ্য যদি জনসংখ্যা প্রায় স্ট্যান্ডার্ড বিচ্যুতির সাথে প্রায় স্বাভাবিক থাকে, তাই আমাদের Box-Coxধরে রাখা স্বাভাবিকতা অনুমানের জন্য রূপান্তরটি ব্যবহার করার জন্য প্রলুব্ধ হতে পারে (আমি আরও মনে করি যে এটিও একটি বৈকল্পিক স্থিতিশীল রূপান্তর বলে মনে হয়) )।

তবে, আমরা যদি Box-Coxরূপান্তরিত ডেটাতে টি-সরঞ্জাম প্রয়োগ করি , আমরা রূপান্তরিত ডেটার মাধ্যমের পার্থক্য সম্পর্কে সূচনা পেয়ে যাব। পরিমাপের মূল স্কেলগুলিতে আমরা কীভাবে সেগুলি ব্যাখ্যা করতে পারি? (রুপান্তরিত মানগুলির গড় রূপান্তরিত গড় নয়)। অন্য কথায়, রূপান্তরিত স্কেলে গড়ের অনুমানের বিপরীত রূপান্তর করা, মূল স্কেলে গড়টির কোনও অনুমান দেয় না।

আমি কি এই ক্ষেত্রে মধ্যস্থতাকারীদের সম্পর্কেও অনুলিপি তৈরি করতে পারি? এমন কোনও রূপান্তর আছে যা আমাকে উপায়গুলিতে ফিরে যেতে অনুমতি দেবে (মূল স্কেল)?

এই প্রশ্নটি প্রথমে এখানে মন্তব্য হিসাবে পোস্ট করা হয়েছিল

উত্তর:


11

আপনি যদি মূল ভেরিয়েবলের গড় সম্পর্কে বিশেষভাবে সূচনা চান, তবে বক্স-কক্স রূপান্তরটি ব্যবহার করবেন না। আইএমও বক্স-কক্স রূপান্তরগুলি তখন সবচেয়ে কার্যকর হয় যখন রূপান্তরিত ভেরিয়েবলটির নিজস্ব ব্যাখ্যা থাকে এবং বক্স-কক্স রূপান্তরটি আপনাকে বিশ্লেষণের জন্য সঠিক স্কেল খুঁজে পেতে সহায়তা করে - এটি আশ্চর্যজনকভাবে প্রায়শই ঘটে থাকে। দুটি অপ্রত্যাশিত এক্সটেনশন যা আমি এইভাবে পেয়েছি তা হ'ল 1/3 (যখন প্রতিক্রিয়ার ভেরিয়েবল মূত্রাশয়ের ভলিউম ছিল) এবং -1 (যখন প্রতিক্রিয়া ভেরিয়েবল প্রতি মিনিটে শ্বাস ফেলা হয়েছিল)।

লগ-রূপান্তর সম্ভবত এটির ব্যতিক্রম। লগ-স্কেলের গড়টি মূল স্কেলের জ্যামিতিক গড়ের সাথে মিলে যায়, যা কমপক্ষে একটি সংজ্ঞায়িত পরিমাণ।


ঠিক আছে, আপনার অন্যান্য ব্যতিক্রমগুলিও রয়েছে। -1 হারমোনিক গড়ের সাথে মিলে যায়, ...
কেজেটিল বি হ্যালভোরসেন

9

যদি বাক্স-কক্স রূপান্তরটি একটি প্রতিসরণ বিতরণ করে তবে রূপান্তরিত ডেটার গড়টি মূল স্কেলে মিডিয়ানে ফিরে আসে। এটি বাক্স-কক্স রূপান্তরকরণ, আইএইচএস রূপান্তর ইত্যাদিসহ যে কোনও মনোোটনিক ট্রান্সফর্মেশনের ক্ষেত্রে সত্য, সুতরাং রূপান্তরিত তথ্যের মাধ্যমগুলির সূচনাগুলি মূল স্কেলের মধ্যস্থতা সম্পর্কিত সূত্রগুলির সাথে মিলে যায়।

যেহেতু মূল ডেটা স্কাই করা হয়েছিল (বা আপনি প্রথম কোনও বাক্স-কক্স রূপান্তর ব্যবহার করবেন না), আপনি কেন এর মাধ্যম সম্পর্কে অনুলিপি চান? আমি ভাবতাম মিডিয়ানদের সাথে কাজ করা এই পরিস্থিতিতে আরও বোধগম্য হবে। কেন এটিকে "মূল স্কেলটিতে ব্যাখ্যায় সমস্যা" হিসাবে দেখা হচ্ছে তা আমি বুঝতে পারি না।


বিসি প্যারামিটার In অনুমান শর্তযুক্ত - এটির কি মূল স্কেলের কোনও সহজ ব্যাখ্যা আছে? আমি মনে করি স্বাভাবিক কোর্সটি কেবলমাত্র সেভাবে এটির প্রতিবেদন করা এবং এটি ছেড়ে দেওয়া (সাধারণত অ্যাসিম্পোটিক সমতুল্যতা সম্পর্কে কিছু ফলাফলের উপর বিশ্রাম নেওয়া যা সাধারণত হিসাবে প্রয়োগ হয় না)। λ
আর্স

ধন্যবাদ. সম্ভবত কারণ নমুনা (এমন একটি জনসংখ্যার যা আমি মনে করি এটি একটি প্রায় প্রতিসাম্য বন্টন অনুসরণ করা উচিত) সম্ভবত ঘটনাক্রমে আঁকড়ে পড়েছে।
জর্জ ডোনটাস

4
কিছু পরিবেশগত ঝুঁকি মূল্যায়ন দ্বারা কেনা তা বোঝানো যায় না কেন, উপায় সম্পর্কে অনুলিপি তৈরি করার প্রয়োজনীয়তার একটি চমৎকার উদাহরণ। ব্যাপকভাবে সরল করতে, কল্পনা করুন যে আপনি একটি পার্কে জমি বিকাশের পরিকল্পনা করছেন। কিছু উদ্বেগের জন্য আপনি জমিটি পরীক্ষা করেন এবং যেমনটি প্রায়শই ঘটে থাকে তেমন ঘনত্ব ঘনিয়ে আনতে সাধারণভাবে বিতরণ করেছেন। তবুও, পার্কটি ব্যবহার করছেন এমন লোকেরা - যারা সরাসরি এই মাটিগুলির সংস্পর্শে আসতে পারেন - তারা ঘুরে বেড়ানোর সাথে সাথে এলোমেলোভাবে মাটির কার্যকরভাবে "নমুনা" দেবে। সময়ের সাথে সাথে তাদের এক্সপোজারটি গাণিতিক গড় ঘনত্ব হবে, এর জ্যামিতিক গড় নয়।
whuber

1
কখনও কখনও আমরা এমন সমস্যাগুলির মধ্যে আগ্রহী যেগুলি কোনও কিছুর মোট পরিমাণের সূত্র থেকে আসে। আপনি যদি গড়টি জানেন তবে আপনি গড় থেকে মোটের দিকে যেতে পারেন (পর্যবেক্ষণের সংখ্যায় গুণ করে)। মোটামুটি থেকে মোটে যাওয়ার কোনও উপায় নেই!
জর্জ ডোনটাস

6

আপনি যদি আসল স্কেলের মাধ্যমগুলির বিষয়ে অনুমান করতে চান তবে আপনি এমন অনুমিতি ব্যবহারের বিষয়ে বিবেচনা করতে পারেন যা একটি স্বাভাবিকতা অনুমান ব্যবহার করে না।

তবে খেয়াল রাখুন। কেবল পুনরায় মডেলিংয়ের মাধ্যমে অর্থের সরাসরি তুলনা করে প্লাগিং করুন (উভয়ই নমুনা পরীক্ষা বা বুটস্ট্র্যাপিং) যখন দুটি নমুনার ভিন্ন ভিন্নতা থাকে আপনার সমস্যা বিশ্লেষণগুলি সমান হিসাবে ধরে নিলে সমস্যা হতে পারে (এবং রূপান্তরিত স্কেলের সমান প্রকরণগুলি পার্থক্য বৈকল্পিক হবে) মূল স্কেলে যদি উপায় পৃথক হয়)। এই জাতীয় কৌশলগুলি আপনি কী করছেন তা চিন্তা করার প্রয়োজনীয়তা এড়ায় না।

f(x+h)t[μ+(Yμ)]Yμσ2t()

t(μ)

-

সবচেয়ে সহজ ক্ষেত্রে হ'ল লগ-স্কেলে আপনার স্বাভাবিকতা থাকে এবং তাই মূল স্কেলে লগইনরমাল। যদি আপনার বৈকল্পিকটি জানা থাকে (যা খুব সম্ভবত খুব কম ঘটে) তবে আপনি লগনিকাল সিআই এবং পিআই তৈরি করতে পারবেন মূল স্কেলে, এবং আপনি প্রাসঙ্গিক পরিমাণের বিতরণের গড় থেকে একটি পূর্বাভাস গড় দিতে পারেন।

tt

আপনি কোন প্রশ্নের উত্তর দিতে চাইছেন সে সম্পর্কে আপনাকে খুব সাবধানে চিন্তা করতে হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.