কীভাবে একাধিক উদীয়মান রেখাগুলি নিয়ে স্ক্র্যাপপ্লট আলোচনা করবেন?


11

আমরা দুটি ভেরিয়েবল পরিমাপ করেছি এবং স্ক্যাটারপ্লট মনে হয় একাধিক "লিনিয়ার" মডেল প্রস্তাব করে। এই মডেলগুলি ছড়িয়ে দেওয়ার চেষ্টা করার কোনও উপায় আছে কি? অন্যান্য স্বতন্ত্র ভেরিয়েবলগুলি সনাক্ত করা কঠিন হয়ে দাঁড়িয়েছে।

দুটি ভেরিয়েবলের স্ক্যাটারপ্ল্লট

উভয় ভেরিয়েবলগুলি ভারী বাম-স্কিউড (ছোট সংখ্যার দিকে), এটি আমাদের ডোমেনে প্রত্যাশিত বিতরণ। বিন্দুর তীব্রতা এই < x , y > এ ডেটা পয়েন্টের পরিমাণ (একটি স্কেলে) উপস্থাপন করে । log10<x,y>

বিকল্পভাবে, পয়েন্টগুলি ক্লাস্টার করার কোনও উপায় আছে?

আমাদের ক্ষেত্রে, এটি দাবি করা হয় যে এই দুটি পরিবর্তনশীল রৈখিকভাবে সম্পর্কযুক্ত। আমাদের তথ্যগুলিতে কেন এটি হয় না তা আমরা বুঝতে / বোঝার চেষ্টা করছি।

(দ্রষ্টব্য, আমাদের 17M ডেটা পয়েন্ট রয়েছে)

আপডেট: সমস্ত উত্তরের জন্য আপনাকে ধন্যবাদ, এখানে কিছু অনুরোধ করা স্পষ্টতা রয়েছে:

  • উভয় ভেরিয়েবল কেবলমাত্র পূর্ণসংখ্যা, যা লগ স্ক্রেটারপ্লোটের কিছু নিদর্শন ব্যাখ্যা করে।
  • ভাগ্যক্রমে, সংজ্ঞা অনুসারে উভয় ভেরিয়েবলের সর্বনিম্ন মান 1 হয়।
  • 7 এম পয়েন্টগুলি (তথ্যের বাম-সঙ্কোচনের দ্বারা "ব্যাখ্যা")<3,1>

অনুরোধ করা প্লটগুলি এখানে:

লগ-লগ স্ক্যাটারপ্ল্লট: লগ লগ মধ্যে Scatterplot

(ফাঁকাগুলি পূর্ণসংখ্যার মানগুলির কারণে ঘটে)

লগ-লগ পোলার: মেরু স্থানাঙ্ক θ=y

অনুপাতের হিস্টোগ্রাম: অনুপাতের হিস্টোগ্রাম

1/3


2
(r,θ)XYθθ

Y এবং X প্রাপ্তির সাথে কি অনুপাত জড়িত? ভেরিয়েবলগুলি কি কেবল জড়িত মূল্য যুক্ত করে? এটি লগ-লগ প্লট হিসাবে দেখায় কীভাবে?
গ্লেন_বি -রিনস্টেট মনিকা

1
@ হুইবার ও গ্লেন_বি আমি এই রূপান্তরগুলির সাথে প্লট যুক্ত করেছি।
ডেভি ল্যান্ডম্যান

rθθθ

@ যে আমি প্লটটি আপডেট করেছি, থিটাটি y তে রেখেছি, এটি কি আপনার বোঝানো লাইন?
ডেভি ল্যান্ডম্যান

উত্তর:


7

YXY/X

X/kkXk

Y=0log(Y+constant)

পরিভাষা একটি বিন্দু: পরিসংখ্যান মধ্যে skewness আরও প্রসারিত যে লেজ রেফারেন্স সঙ্গে বর্ণনা করা হয়। আপনি এই পরিভাষাটিকে পিছনের দিক হিসাবে বিবেচনা করতে মুক্ত। এখানে উভয় ভেরিয়েবল উচ্চ মান বা ধনাত্মক বা ডান-স্কিউযুক্ত হয়।

Y=1Y=0

আগের মতো, আমি বৈজ্ঞানিক কারণ ছাড়াই আলাদা স্ট্রাইপগুলি আলাদাভাবে মডেলিং করার পরামর্শ দেব না তাদের আলাদা করার জন্য বা তাদের পৃথকভাবে চিকিত্সা করার জন্য। আপনার যা আছে তার চেয়ে আপনার গড় উচিত। (বিযুক্তি দমনের জন্য এই জাতীয় ডেটা সহ জ্ঞাত পদ্ধতিগুলি থাকতে পারে your আপনার ক্ষেত্রের লোকেরা যদি নিয়মিতভাবে প্রতিটি প্লটের জন্য কয়েক মিলিয়ন পয়েন্ট মাপ করেন তবে এটি বিশ্বাস করা শক্ত যে এটি এর আগে কখনও দেখা যায়নি))

পারস্পরিক সম্পর্ক অবশ্যই ইতিবাচক হওয়া উচিত। একটি আনুষ্ঠানিক তাত্পর্য পরীক্ষা ছাড়াও, যা এখানে পুরোপুরি বেহুদা হবে কারণ মিনিট পারস্পরিক সম্পর্কগুলি এই নমুনা আকারের সাথে তাত্পর্যপূর্ণ হিসাবে যোগ্যতা অর্জন করবে, এটি আপনার ক্ষেত্রের প্রত্যাশা এবং মানগুলির বিষয় কিনা strong আপনার পারস্পরিক সম্পর্ককে অন্যের ফলাফলের সাথে পরিমাণগতভাবে তুলনা করা এক উপায়।

বিশদ: পরিসংখ্যানগত কনভেনশন অনুসারে স্কিউনেসটি এখনও ভুল উপায়ে বর্ণিত হয়েছে। এই ভেরিয়েবলগুলি ডান স্কিউড; অনুভূমিক দৈর্ঘ্যের অক্ষ সহ একটি হিস্টোগ্রামের দিকে তাকানোর সময় যে জঞ্জালটি ফিট হয় এটি উল্লেখ করে যে স্যাঙ্কনেসটি দীর্ঘতর লেজের জন্য নামকরণ করা হয়েছে, আরও মান সহকারে নয়।


আমি লগ-লগ প্লট যুক্ত করেছি এবং স্কিউনেস সম্পর্কে আরও সুনির্দিষ্ট হওয়ার চেষ্টা করেছি।
ডেভি ল্যান্ডম্যান

4

Yi=α1+β1Xi+ϵi
mth
Yi=αm+βmXi+ϵi
Mmthpmmpm=1

ϵN(0,σ2)

L(α,β,σ)=m=1Mpm1σϕ(Yiα1β1Xiσ)
ϕ3M+1mpm=1,pm0αβpm1Mαβ

ZipmpmZi

L(α,β,σ)=m=1M(exp(δm+γmZi)mexp(δm+γmZi))1σϕ(Yiα1β1Xiσ)

5M+15M1δ,γ

M


2
M

2

আমি আমার কিছু ডেটা সেটগুলিতে অনুরূপ আচরণ পর্যবেক্ষণ করেছি। আমার ক্ষেত্রে আমার একাধিক প্রসেসিং অ্যালগরিদমে কোয়ান্টাইজেশন ত্রুটির কারণে একাধিক-পৃথক লাইনগুলি ছিল।

এটি হ'ল আমরা প্রসেসড ডেটার স্ক্যাটার প্লটগুলিতে দেখছি, এবং প্রসেসিং অ্যালগরিদমের কিছু পরিমানের প্রভাব ছিল, যার ফলে ডেটাগুলিতে নির্ভরতা দেখা দিয়েছে যা আপনাকে উপরের মতো দেখতে লাগছিল।

কোয়ান্টাইজেশনের প্রভাবগুলি ঠিক করা, আমাদের আউটপুটকে আরও মসৃণ এবং কম ক্ল্যাম্পড দেখায়।

আপনার "লিনিয়ার পারস্পরিক সম্পর্ক" মন্তব্য হিসাবে। আপনি যে উপস্থাপন করেছেন তা ডেটা লিনিয়ার পারস্পরিক সম্পর্কযুক্ত কিনা তা নির্ধারণের জন্য অপর্যাপ্ত। এটি হ'ল, কিছু ক্ষেত্রগুলিতে> ০. of এর একটি সংযুক্তি সহগকে শক্তিশালী রৈখিক পারস্পরিক সম্পর্ক হিসাবে বিবেচনা করা হয়। আপনার বেশিরভাগ ডেটা উত্সের কাছাকাছি থাকা সত্ত্বেও, এটি যথেষ্ট অনুমেয় যে আপনার ডেটা "প্রচলিত জ্ঞান" বলার সাথে তুলনামূলকভাবে রৈখিকভাবে সম্পর্কযুক্ত। সম্পর্ক সম্পর্কিত তথ্য ডেটা সেট সম্পর্কে আপনাকে খুব কম বলে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.