আমরা দুটি ভেরিয়েবল পরিমাপ করেছি এবং স্ক্যাটারপ্লট মনে হয় একাধিক "লিনিয়ার" মডেল প্রস্তাব করে। এই মডেলগুলি ছড়িয়ে দেওয়ার চেষ্টা করার কোনও উপায় আছে কি? অন্যান্য স্বতন্ত্র ভেরিয়েবলগুলি সনাক্ত করা কঠিন হয়ে দাঁড়িয়েছে।
উভয় ভেরিয়েবলগুলি ভারী বাম-স্কিউড (ছোট সংখ্যার দিকে), এটি আমাদের ডোমেনে প্রত্যাশিত বিতরণ। বিন্দুর তীব্রতা এই < x , y > এ ডেটা পয়েন্টের পরিমাণ (একটি স্কেলে) উপস্থাপন করে ।
বিকল্পভাবে, পয়েন্টগুলি ক্লাস্টার করার কোনও উপায় আছে?
আমাদের ক্ষেত্রে, এটি দাবি করা হয় যে এই দুটি পরিবর্তনশীল রৈখিকভাবে সম্পর্কযুক্ত। আমাদের তথ্যগুলিতে কেন এটি হয় না তা আমরা বুঝতে / বোঝার চেষ্টা করছি।
(দ্রষ্টব্য, আমাদের 17M ডেটা পয়েন্ট রয়েছে)
আপডেট: সমস্ত উত্তরের জন্য আপনাকে ধন্যবাদ, এখানে কিছু অনুরোধ করা স্পষ্টতা রয়েছে:
- উভয় ভেরিয়েবল কেবলমাত্র পূর্ণসংখ্যা, যা লগ স্ক্রেটারপ্লোটের কিছু নিদর্শন ব্যাখ্যা করে।
- ভাগ্যক্রমে, সংজ্ঞা অনুসারে উভয় ভেরিয়েবলের সর্বনিম্ন মান 1 হয়।
- 7 এম পয়েন্টগুলি (তথ্যের বাম-সঙ্কোচনের দ্বারা "ব্যাখ্যা")
অনুরোধ করা প্লটগুলি এখানে:
লগ-লগ স্ক্যাটারপ্ল্লট:
(ফাঁকাগুলি পূর্ণসংখ্যার মানগুলির কারণে ঘটে)
লগ-লগ পোলার:
অনুপাতের হিস্টোগ্রাম: