বিযুক্ত এবং অবিচ্ছিন্ন ভেরিয়েবলের মধ্যে সম্পর্ক কল্পনা করার সর্বোত্তম উপায় কী?


19

এর মধ্যে সম্পর্ক দেখানোর সর্বোত্তম উপায় কী:

  • অবিচ্ছিন্ন এবং পৃথক পরিবর্তনশীল,
  • দুটি পৃথক ভেরিয়েবল?

অবিচ্ছিন্ন ভেরিয়েবলের মধ্যে সম্পর্কটি দেখার জন্য আমি এখন পর্যন্ত স্ক্যাটার প্লট ব্যবহার করেছি। তবে পৃথক ভেরিয়েবলের ক্ষেত্রে ডেটা পয়েন্টগুলি নির্দিষ্ট বিরতিতে জমে থাকে। সুতরাং সেরা ফিট লাইন পক্ষপাতদুষ্ট হতে পারে।


4
পৃথক-বিচ্ছিন্ন মামলার জন্য, আদেশযুক্ত শ্রেণিবদ্ধ ডেটা প্লট করার ক্ষেত্রে এখানে কিছুটা সম্পর্কিত প্রশ্নের এই উত্তরটি সহায়তা করতে পারে (যদিও সম্ভবত আপনার ক্ষেত্রে বাক্সগুলি ছাড়াই)। আপনি কীভাবে এই 'পক্ষপাত' ​​উদয় করেন তা আমি সত্যিই নিশ্চিত নই; এটি ডেটা পয়েন্টগুলির ভিজ্যুয়াল ছাপকে প্রভাবিত করবে (লাইনটি যেখানে হওয়া উচিত তার চেয়ে অন্য কোথাও যেতে আশা করে ব্যবহার করবে) তবে আসল তথ্য নিজেই নয়। আপনি কি এখানে আপনার যুক্তি ব্যাখ্যা করতে পারেন?
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


26

নীচে: আসল প্লটটি বিভ্রান্তিকর হতে পারে কারণ ভেরিয়েবলের স্বতন্ত্র প্রকৃতি পয়েন্টগুলিকে ওভারল্যাপ করে তোলে:

এখানে চিত্র বর্ণনা লিখুন

এটিকে ঘিরে কাজ করার একটি উপায় হ'ল ডেটা প্রতীকে কিছুটা স্বচ্ছতা প্রবর্তন করা:

এখানে চিত্র বর্ণনা লিখুন

আরেকটি উপায় হ'ল একটি স্মিয়ার তৈরি করার জন্য প্রতীকটির অবস্থানটি হালকাভাবে স্থানচ্যুত করা। এই কৌশলটিকে "জিটটারিং:" বলা হয়

এখানে চিত্র বর্ণনা লিখুন

উভয় সমাধানই আপনাকে লিনিয়ারিটি মূল্যায়নের জন্য একটি সরলরেখায় ফিট করতে দেয়।

আপনার রেফারেন্সের জন্য আর কোড:

x <- trunc(runif(200)*10)
y <- x * 2 + trunc(runif(200)*10)
plot(x,y,pch=16)
plot(x,y,col="#00000020",pch=16)
plot(jitter(x),jitter(y),col="#000000",pch=16)

1
চমৎকার উত্তর. পরিবর্তনশীল উদাহরণ গণনা সহ বুদ্বুদ-স্ক্যাটার প্লট সম্পর্কে কী? আমি একটি বিশাল ডেটা সেটটিতে এই কৌশলগুলি ব্যবহার করার চেষ্টা করেছি এবং এটি সমস্ত বর্ণমালার রেন্ডারিংয়ে খুব দীর্ঘ সময় নিয়েছে।
জোশ

14

আমি একটি পৃথক এবং একটি অবিচ্ছিন্ন ভেরিয়েবলের মধ্যে সম্পর্ক প্রদর্শন করতে বক্সপ্লট ব্যবহার করব। আপনি স্ট্যান্ডার্ড পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার দিয়ে আপনার বক্সপ্লটগুলি উল্লম্ব বা অনুভূমিক তৈরি করতে পারেন, সুতরাং চতুর্থ বা ডিভি হিসাবে রূপান্তর করা সহজ। এটা তোলে হয় একটি বিযুক্ত এবং ক্রমাগত পরিবর্তনশীল সঙ্গে একটি scatterplot ব্যবহার করতে, শুধু বিযুক্ত পরিবর্তনশীল (যেমন, 1 & 2), এবং নার্ভাসভাবে যারা মান (ডান দিকে নোট শীর্ষ চক্রান্ত একটি সংখ্যাকে বরাদ্দ সম্ভব এখানে )।

আপনার মন্তব্য সম্পর্কে যে সেরা ফিটের লাইনটি পক্ষপাতদুষ্ট হতে পারে, এটি আপনার যা আছে তার উপর নির্ভর করে। উদাহরণস্বরূপ, আপনার যদি আইভি হিসাবে দুটি স্তর এবং আপনার ডিভি হিসাবে অবিচ্ছিন্ন পরিবর্তনশীল থাকে তবে আপনি দুটি উপায়ের মধ্য দিয়ে একটি লাইন আঁকতে পারেন এবং এটি পক্ষপাতদুষ্ট হবে না। (আমরা সাধারণত এই পরিস্থিতিটিকে টি-টেস্টের জন্য উপযুক্ত বলে মনে করব, তবে এটি আসলে একটি ফর্ম - অর্থাত্ সরল ক্ষেত্রে - রিগ্রেশনের ক্ষেত্রে, আমার উত্তরটি এখানে দেখুন )) অন্যদিকে, যদি আপনার কোনও বিবাদ থাকে আপনার ডিভি হিসাবে দুটি স্তরের সাথে ভেরিয়েবল, স্ট্যান্ডার্ড (ওএলএস) রিগ্রেশন অনুপযুক্ত হবে (লজিস্টিক রিগ্রেশন বলা হবে) এবং সেরা ফিটের লাইন পক্ষপাতমূলক হবে, তবে আপনি আপনার প্রাথমিক অংশ হিসাবে একটি নিম্ন বিন্দুতে (এবং প্লট) ফিট করতে পারেন তথ্য অনুসন্ধান।

দুটি পৃথক ভেরিয়েবলের মধ্যে সম্পর্কের চিত্রটি দেখার জন্য, আমি একটি মোজাইক প্লট ব্যবহার করব । আপনি একটি চালনী প্লট , কোনও সমিতি প্লট বা কিছু প্রোগ্রামিং সহ গতিশীল চাপের প্লটও ব্যবহার করতে পারেন ।


8

বাইনারি ফলাফলের পরিবর্তনশীল এবং একটি অবিচ্ছিন্ন ভবিষ্যদ্বাণীকের মধ্যে সম্পর্কের বিষয়টি বিবেচনা করার সময়, আমি লোস স্মুথ ব্যবহার করতাম (আউটরিয়ার সনাক্তকরণ বন্ধ করে রাখে, যেমন, আর lowess(x, y, iter=0)

আর Hmiscপ্যাকেজের পরবর্তী প্রকাশে আপনি সহজেই একটি একক latticeগ্রাফিক তৈরি করতে পারেন যা একাধিক ভবিষ্যদ্বাণীকারীদের জন্য মাল্টিপ্যানেল ডিসপ্লেতে যেমন বক্ররেখা রাখে eg

summaryRc(heart.attack ~ age + blood.pressure + weight, data=mydata)

1

আপনি যদি সাধারণ স্ক্যাটার প্লটের সাথে সন্তুষ্ট না হন তবে আপনি পৃথক পৃথক ভেরিয়েবলের প্রতিটি মূল্যে ডেটা পয়েন্টের ফ্রিকোয়েন্সি যুক্ত করতে চাইতে পারেন। এটি কীভাবে করবেন তা নির্ভর করে আপনি ব্যবহার করছেন এমন স্ট্যাটিস্টিকাল প্রোগ্রামের উপর। স্টাতার জন্য এখানে একটি উদাহরণ । আপনি এটি দুটি শ্রেণীবদ্ধ ভেরিয়েবলের স্ক্যাটার প্লটে প্রয়োগ করতে পারেন। অন্যথায় একটি বক্স প্লট বা ওভারলেড বার চার্টগুলি সূক্ষ্ম হতে পারে তবে আপনি কীভাবে এই ভেরিয়েবলগুলি উপস্থাপন করতে চান তার উপর এটি নির্ভর করে।


1

আমি http://www.boekboek.com/xb130929113026 এ দুটি বাইনারি ভেরিয়েবলের মধ্যে সংযুক্তির জন্য প্রযোজ্য একটি কাগজ পেয়েছি - এখানে, এই নিবন্ধে এটি প্রদর্শিত হয়েছে এবং প্রমাণিত হয়েছে যে দুটি বাইনারি ভেরিয়েবলের মধ্যে সংযুক্তির প্রসারিত অংশটি একটি ভগ্নাংশ হিসাবে প্রকাশ করা যেতে পারে নিখুঁত সমিতি। সুতরাং এটি বলা সম্ভব এবং অগ্রাধিকারযোগ্য হয়ে উঠবে: ভেরিয়েবল এ এবং ভেরিয়েবল বি এর মধ্যে সংযোগটি সমসাময়িকভাবে উল্লেখ করার পরিবর্তে 50% হয়: OR = 9 (ব্যাখ্যা করা সহজ নয়) বা আসল ঝুঁকি = 2 (সমসাময়িকভাবে আপেক্ষিক ঝুঁকি হিসাবে বিবেচিত হয়) খুব একটা সংস্থার পরিমাপ হতে পারে যদিও বাস্তবে এটি অ্যাসোসিয়েশন, প্রচলন বা ঘটনা এবং ইতিবাচকতা একটি ফাংশন)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.