ইতিবাচক এবং নেতিবাচক মানগুলির সাথে ডেটা ব্যবহার করার সময় কেন প্রকরণের সহগ বৈধ নয়?


10

আমি আমার প্রশ্নের সুনির্দিষ্ট উত্তর খুঁজে পাচ্ছি না।

আমার ডেটাতে পরিমাপ করা অর্থ সহ বেশ কয়েকটি প্লট রয়েছে 0.27 থেকে 0.57 পর্যন্ত। আমার ক্ষেত্রে, সমস্ত ডেটা মানগুলি ইতিবাচক, তবে পরিমাপটি নিজেই প্রতিফলন মানগুলির অনুপাতের উপর ভিত্তি করে যা -1 থেকে +1 পর্যন্ত হতে পারে। প্লটগুলি NDVI এর মানগুলি উপস্থাপন করে যা উদ্ভিদের "উত্পাদনশীলতা" এর প্রত্যন্তভাবে উত্পন্ন সূচক।

আমার উদ্দেশ্যটি ছিল প্রতিটি প্লটের মূল্যবোধের পরিবর্তনশীলতার তুলনা করা, তবে যেহেতু প্রতিটি প্লটের পৃথক অর্থ রয়েছে, তাই আমি প্লট প্রতি এনডিভিআই মানগুলির আপেক্ষিক ছড়িয়ে দেওয়ার জন্য সিভি ব্যবহার করার সিদ্ধান্ত নিয়েছিলাম।

আমি যা বুঝতে পারি তা থেকে এই প্লটের সিভি নেওয়া কোশার নয় কারণ প্রতিটি প্লটের ইতিবাচক এবং নেতিবাচক উভয় মান থাকতে পারে। এই জাতীয় দৃষ্টান্তে সিভি ব্যবহার করা কেন উপযুক্ত নয়? কিছু কার্যকর বিকল্প কি হবে (যেমন, আপেক্ষিক ছড়িয়ে পড়া, ডাটা ট্রান্সফর্মেশন ইত্যাদির অনুরূপ পরীক্ষা)?


1
পরিবর্তনশীলতার তুলনা করার উদ্দেশ্য কী? আপনি কেবল সিভির মতো আপেক্ষিক পরিমাপের পরিবর্তে এসডি, এমএডি, ব্যাপ্তি বা যা কিছু প্রকৃত পরিবর্তনশীলতার ব্যবস্থাগুলি তুলনা করছেন না (যা এখানে কোনও অর্থবোধ করে না)?
whuber

প্লটগুলির মধ্যে পার্থক্যের জন্য আমি সিভি ব্যবহার করছি। সমস্ত প্লটে মানগুলি -1 এবং +1 এর মধ্যে রয়েছে বলে এটি কী বোঝায় না? অর্থাত্, "প্রকৃত পরিবর্তনশীলতা" প্লটগুলির মধ্যে পার্থক্যের আরও সূচক হবে?
নবী 60000

2
সংজ্ঞা অনুসারে সিভি হ'ল পরিবর্তনের একটি আপেক্ষিক পরিমাপ। এটি কোনও নেতিবাচক গড়ের জন্য অযৌক্তিক ফলাফল দেয় (আপনি নেতিবাচক পরিমাণে বিচ্ছুরণ বা বিস্তারকে ব্যাখ্যা করতে পারবেন না)। ইতিবাচক উপায়গুলির জন্য, যখন গড়টি ছোট হয় তখন এটি প্রদত্ত পরিমাণের স্প্রেডকে অনেক বড় দেখায়। যখন এটি চাওয়া হয়, আপনি যা করছেন তা কার্যকরভাবে আপনার লগারিদমিক স্কেলগুলির সাথে আপনার ডেটার তুলনা করার সমতুল্য - এবং যখনই কোনও ডেটা শূন্য বা নেতিবাচক হতে পারে তখন তা বোঝা যায় না। আপনার ডেটাটির পরিবর্তনশীলতার ভাল তুলনা করার জন্য এক ধরণের পুনরায় প্রকাশের প্রয়োজন হতে পারে; এটি কীভাবে উত্পন্ন হয় তার উপর নির্ভর করে।
whuber

ব্যাখ্যার জন্য +1। আমার প্লটগুলির মাধ্যমগুলি সমস্ত ইতিবাচক হলেও প্রতিটি প্লটের মধ্যে নেতিবাচক মান থাকতে পারে। উপরোক্ত এবং নীচে পিটারের উত্তরের ভিত্তিতে এটি সিভি ব্যবহার করে দেখাবে না এমনটি নিশ্চিত হয় না। আমি সম্ভাব্যভাবে মানগুলি পুনরুদ্ধার করতে এবং / অথবা প্রকৃত পরিবর্তনশীলতার ব্যবস্থা ব্যবহার করব।
নবী 6000091

1
যদি আপনি একটি ধ্রুবক যোগ করে আপনার ডেটাটি বুদ্ধিমানের সাথে পুনরুদ্ধার করতে পারেন তবে তার অর্থ সিভি কোনও ভাল ধারণা নয়। এর কারণ হল একটি ধ্রুবক যুক্ত করা সিভি পরিবর্তন করবে তবে ভিন্নতা পরিবর্তন করবে না।
পিটার ফ্লুম

উত্তর:


11

সিভি কী তা ভেবে দেখুন: স্ট্যান্ডার্ড বিচ্যুতির অনুপাত বলতে কী বোঝায়। তবে ভেরিয়েবলের যদি ইতিবাচক এবং নেতিবাচক মান থাকতে পারে তবে গড়টি 0 টির খুব কাছাকাছি হতে পারে; সুতরাং, সিভি আর যা করার কথা বলে তা আর করে না: এটি অর্থের তুলনায় এসডি কতটা বড় তা বোঝান।

সম্পাদনা: একটি মন্তব্যে আমি বলেছিলাম যে আপনি যদি বোধগম্যভাবে চলকটিতে একটি ধ্রুবক যুক্ত করতে পারেন তবে সিভি ভাল ছিল না। এখানে একটি উদাহরণ:

set.seed(239920)
x <- rnorm(100, 10, 2)
min(x)#To check that none are negative
(CVX <- sd(x)/mean(x))
x2 <- x + 10
(CVX2 <- sd(x2)/mean(x2))

x2 হ'ল এক্স + ১০। আমি মনে করি এটি স্বজ্ঞাতভাবে পরিষ্কার যে তারা সমানভাবে পরিবর্তনশীল; তবে সিভি আলাদা।

এর প্রকৃত জীবনের উদাহরণ হ'ল এক্স ডিগ্রি সেলসিয়াস এবং x2 ডিগ্রি কে তাপমাত্রা ছিল (যদিও সেখানে কেউ যুক্তি দিতে পারে যে কে সঠিক স্কেল, যেহেতু এটির সংজ্ঞায়িত 0 রয়েছে)।


ধন্যবাদ! সুতরাং উদ্বেগ শূন্যের কাছাকাছি গড় হওয়া এবং আপনার ডেটাতে ইতিবাচক এবং নেতিবাচক মান না রাখার বিষয়ে। যদি তা হয় তবে শূন্যের গড়ের কত কাছাকাছি অবস্থানটিকে "খুব কাছাকাছি" হিসাবে বিবেচনা করা হয়? আমার ক্ষেত্রে, আমি বলব আমি শূন্যের কাছাকাছি আমার উপায় থাকার থেকে দূরে। এটি নির্ধারণের একটি নির্দিষ্ট উপায় আছে?
নবী 60000

না, উদ্বেগটি হ'ল কেবল 1 টি নেতিবাচক মান থাকলেও সিভি আর যা করার কথা বলে তা আর করে না। আপনার যদি নেতিবাচক মান থাকে তবে সিভি ব্যবহার করবেন না। এছাড়াও, যদি আপনার মানগুলি নির্বিচারে স্কেল হয়, সিভি ব্যবহার করবেন না।
পিটার ফ্লুম

সম্পূর্ণতার জন্য, আপনি কীভাবে একটি স্বেচ্ছাসেবী স্কেল ব্যবহার করে সিভি ব্যবহারকে বাতিল করে দেয় সে সম্পর্কে আপনি আরও কিছুটা ব্যাখ্যা দিতে পারেন? ধন্যবাদ!
নবী 60000

সমস্ত ন্যায্যতার সাথে আমার মনে হয় @ হুবহু রূপান্তরিত বনাম অপরিবর্তিত তথ্যগুলির তুলনা করার পক্ষে পরামর্শ দিচ্ছিল না, তবে আপনার বক্তব্যটি নেওয়া হয়েছে: স্কেলিং সিভিকে প্রভাবিত করবে, যখন কেউ ভাবতে পারে যে ফলাফলগুলি একই থাকবে। খেলনা আর কোডের জন্য +1!
নবী 60000

এই থ্রেডে @ ভোবারের মন্তব্যে আমার কোনও যুক্তি নেই।
পিটার ফ্লুম

0

আমি এগুলিকে ভিন্নতার মডেল হিসাবে ভাবি। এমন পরিসংখ্যানমূলক মডেল রয়েছে যেখানে সিভি স্থির থাকে। যেখানে সেই কাজগুলি একটি সিভি রিপোর্ট করতে পারে। এমন মডেল রয়েছে যেখানে মানক বিচ্যুতিটি গড়ের একটি শক্তি ফাংশন। এমন মডেল রয়েছে যেখানে মানক বিচ্যুতি স্থির থাকে। একটি নিয়ম হিসাবে অনুপাত স্কেল ভেরিয়েবলের জন্য একটি ধ্রুবক এসডি মডেলের চেয়ে ধ্রুবক-সিভি মডেলই ভাল প্রাথমিক অনুমান। কেন এটি সত্য হবে তা আপনি অনুমান করতে পারেন, সম্ভবত সংযোজনমূলক মিথষ্ক্রিয়ার পরিবর্তে গুণকের বিস্তারের উপর ভিত্তি করে।

কনস্ট্যান্ট-সিভি মডেলিং প্রায়শই লোগারিদমিক ট্রান্সফর্মেশনের সাথে যুক্ত। (একটি গুরুত্বপূর্ণ ব্যতিক্রম হ'ল একটি নন-নেগেটিভ প্রতিক্রিয়া যা কখনও কখনও শূন্য থাকে)) এটি দেখার কয়েকটি উপায় রয়েছে। প্রথমত, যদি সিভি স্থির থাকে তবে লগগুলি হ'ল প্রচলিত বৈচিত্র্য-স্থিতিশীল রূপান্তর। বিকল্পভাবে, যদি আপনার ত্রুটি মডেলটি লগ স্কেলে এসডি সহ লগইনরমাল হয়, তবে সিভি সেই এসডিটির একটি সাধারণ রূপান্তর। সিভি লগ-স্কেল এসডি প্রায় সমান যখন উভয়ই ছোট হয়।

স্ট্যান্ডার্ড প্রয়োগের 101 টি পদ্ধতির দুটি উপায় হ'ল স্ট্যান্ডার্ড বিচ্যুতির মতো ডেটা আপনি যেভাবে পেয়েছেন তা বা তাদের লগগুলিতে (বিশেষত যদি এটি অনুপাতের স্কেল হয়)। আপনি সর্বোত্তম অনুমান করতে পারেন যে আপনি জেনে গেছেন যে প্রকৃতি বরং আরও জটিল হতে পারে এবং আরও অধ্যয়ন হতে পারে। ভাবেন যা আগে আপনার ধরণের ডেটা দিয়ে উত্পাদনশীল খুঁজে পেয়েছিল তা বিবেচনায় নেই।

এই জিনিসটি গুরুত্বপূর্ণ যেখানে এখানে একটি মামলা। রাসায়নিক ঘনত্বগুলি কখনও কখনও সিভি দিয়ে সংক্ষিপ্ত করা হয় বা লগ স্কেলে মডেল করা হয়। তবে, পিএইচ একটি লগ ঘনত্ব।


3
আপনার অবদানের জন্য আপনাকে ধন্যবাদ, এবং আমাদের সাইটে আপনাকে স্বাগতম! আপনার উত্তরটি কীভাবে নেতিবাচক মান থাকতে পারে এমন ডেটা বৈশিষ্ট্যযুক্ত করার জন্য কোনও সিভি ব্যবহারের বৈধতা সম্পর্কে প্রশ্নকে কীভাবে স্পষ্ট করে তুলতে পারেন? আপনার পরিস্থিতিটি কোনও মন্তব্য দ্বারা আচ্ছাদিত বলে মনে হচ্ছে না।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.