কেন এই সেট ডেটার কোনও স্বীকৃতি নেই?


8

সমবায় কীভাবে কাজ করে সে সম্পর্কে আমার বুঝতে পারস্পরিক সম্পর্কযুক্ত ডেটার কিছুটা উচ্চতর সমবায় হওয়া উচিত। আমি এমন একটি পরিস্থিতি পেরিয়ে এসেছি যেখানে আমার ডেটা সংযুক্ত মনে হচ্ছে (স্ক্যাটার প্লটে দেখানো হয়েছে) তবে সমবায়তা শূন্যের কাছাকাছি। যদি পরস্পর সম্পর্কযুক্ত হয় তবে ডেটার সমবায়তা কীভাবে শূন্য হতে পারে?

import numpy as np
x1 = np.array([ 0.03551153,  0.01656052,  0.03344669,  0.02551755,  0.02344788,
        0.02904475,  0.03334179,  0.02683399,  0.02966126,  0.03947681,
        0.02537157,  0.03015175,  0.02206443,  0.03590149,  0.03702152,
        0.02697212,  0.03777607,  0.02468797,  0.03489873,  0.02167536])
x2 = np.array([ 0.0372599 ,  0.02398212,  0.03649548,  0.03145494,  0.02925334,
        0.03328783,  0.03638871,  0.03196318,  0.03347346,  0.03874528,
        0.03098697,  0.03357531,  0.02808358,  0.03747998,  0.03804655,
        0.03213286,  0.03827639,  0.02999955,  0.0371424 ,  0.0279254 ])
print np.cov(x1, x2)

array([[  3.95773132e-05,   2.59159589e-05],
       [  2.59159589e-05,   1.72006225e-05]])

এখানে চিত্র বর্ণনা লিখুন


4
ইঙ্গিত: পারস্পরিক সম্পর্ক তাকালে কী হয়? সমবায় এবং পারস্পরিক সম্পর্কের মধ্যে পার্থক্য কী?
আলেসিং

2
যদি আপনি একটি নির্দিষ্ট স্কেলগুলিতে ছোট বা একত্রে প্রদর্শিত হওয়া সংখ্যাগুলি পরিমাপ করে থাকেন তবে তাদের মধ্যে পার্থক্যগুলিও ছোট বলে মনে হবে এবং পার্থক্যের পণ্যগুলি আরও ছোট বলে মনে হচ্ছে। আপনার সমস্ত ডেটা দিয়ে গুণানোর চেষ্টা করুন এবং তারপরে গণনাগুলি পুনরায় করুন; কোভেরিয়েন্সটি গুণ বড় হওয়া উচিত10001000000
হেনরি

উত্তর:


14

কোভেরিয়েন্সের তীব্রতা নির্ভর করে তথ্যের পরিমাণ এবং সেই ডেটার পয়েন্টগুলি কীভাবে সেই ডেটার মাঝের দিকে ছড়িয়ে ছিটিয়ে রয়েছে তার উপর। আপনি সূত্রটি দেখলে এটি দেখতে সহজ:

বনামএক্স,Y=Σ(এক্সআমি-এক্স¯)(Yআমি-Y¯)এন-1

আপনার ক্ষেত্রে, এর বক্রতা x1এবং x2গড় ডেটা পয়েন্ট x1এবং x2আছেন:

x1-mean(x1)
 [1]  0.006043341 -0.012907669  0.003978501 -0.003950639 -0.006020309 -0.000423439  0.003873601
 [8] -0.002634199  0.000193071  0.010008621 -0.004096619  0.000683561 -0.007403759  0.006433301
[15]  0.007553331 -0.002496069  0.008307881 -0.004780219  0.005430541 -0.007792829

x2-mean(x2)
 [1]  0.0039622385 -0.0093155415  0.0031978185 -0.0018427215 -0.0040443215 -0.0000098315
 [7]  0.0030910485 -0.0013344815  0.0001757985  0.0054476185 -0.0023106915  0.0002776485
[13] -0.0052140815  0.0041823185  0.0047488885 -0.0011648015  0.0049787285 -0.0032981115
[19]  0.0038447385 -0.0053722615

এখন আপনি যদি সেই দুটি ভেক্টরকে একে অপরের সাথে গুণিত করেন তবে আপনি অবশ্যই যথেষ্ট সংখ্যক নম্বর পাবেন:

(x1-mean(x1)) * (x2-mean(x2))
 [1] 2.394516e-05 1.202419e-04 1.272252e-05 7.279927e-06 2.434807e-05 4.163041e-09 1.197349e-05
 [8] 3.515290e-06 3.394159e-08 5.452315e-05 9.466023e-06 1.897897e-07 3.860380e-05 2.690611e-05
[15] 3.586993e-05 2.907425e-06 4.136268e-05 1.576570e-05 2.087901e-05 4.186512e-05

এখন যোগফলটি নিন এবং দ্বারা বিভক্ত হোন এবং আপনার কাছে সমগোত্রীয়তা রয়েছে:এন-1

sum((x1-mean(x1)) * (x2-mean(x2))) / (length(x1)-1)
[1] 2.591596e-05

এ কারণেই কেন cক্যবদ্ধতার তীব্রতা কীভাবে x1এবং x2সহ-পরিবর্তিত হয় তার শক্তি সম্পর্কে বেশি কিছু বলে না । কোভরিয়েন্সকে মানিককরণ (বা সাধারনকরণ) করে, এটি স্ট্যান্ডার্ড বিচ্যুতির পণ্য দ্বারা x1এবং x2(কোভেরিয়েন্সের সাথে খুব মিল, অর্থাত্ 2.609127e-05),

R=বনামএক্স,Yগুলিএক্সগুলিY=Σ(এক্স1-এক্স¯)(Yআমি-Y¯)(এন-1)গুলিএক্সগুলিY

আপনি এর উচ্চ সম্পর্কের সহগ পাবেন , যা আপনার প্লটে আপনি কী দেখতে পাচ্ছেন তা নিশ্চিত করে।R=0.99


7

আসুন আমরা প্লট এবং কিছু যুক্তিসঙ্গত চেকগুলির তাত্ক্ষণিক দৃষ্টিভঙ্গি থেকে কী দেখতে পাওয়া যায় সে সম্পর্কে কথা বলি (কেবল কয়েকটি মৌলিক তথ্য সজ্জিত করে ডেটা দেখার সময় এগুলি অবশ্যই জিনিস হিসাবে কাজ করতে পারে):

যাইহোক, প্রথমে নোট করুন যে স্ট্যান্ডার্ড বিচ্যুতিটির -ডমিনোমিনেটর সংস্করণটি অর্ধসীমা ছাড়িয়ে যেতে পারে না ( ডিনোমিনেটর সংস্করণটি পারে তবে কয়েকটি পর্যবেক্ষণের বেশি নয়)।এনএন-1

উভয় ভেরিয়েবল উপর রেঞ্জ ক্রম উপর 0.02 (প্রায়) যাতে ভেরিয়ানস প্রায় অর্ধেক বেশী যে, ছক, অথবা সম্পর্কে হওয়া উচিত ।10-4

ফলস্বরূপ, আপনার আউটপুটে বৈকল্পিকগুলির পর্যবেক্ষণ করা মানগুলি অর্থবোধ করে; তারা উভয়ই এর চেয়ে কম, তবে এর দশমাংশের চেয়েও বেশি।

কোভেরিয়েন্সের পরম মান অবশ্যই দুটি রূপের জ্যামিতিক গড়ের চেয়ে বেশি হওয়া উচিত না (অন্যথায় পারস্পরিক সম্পর্ক 1 ছাড়িয়ে যেতে পারে)। সুতরাং পরম মান ব্যাপ্তির পণ্যের চেয়ে অতিক্রম করা উচিত নয় ।14

তাই আপনি যদি উভয় ভেরিয়েবল পরিসর উভয় ঘনিষ্ঠ ছিল , আমরা পরম সহভেদাংক অতিক্রম আশা করতে পারে ।0.02(0.02)2/4=10-4

খুব রুক্ষ বিশ্লেষণ থেকে, কিছুই আশ্চর্যজনক মনে হয় না।

আরও সুনির্দিষ্ট বিশ্লেষণ আসলে আরও সঠিক রেঞ্জগুলি ব্যবহার করে গণনা করা এবং তার পরে প্রান্তিক বিতরণের আকারগুলি সম্পর্কে চিন্তাভাবনা থেকে আসে:
রেঞ্জগুলি যথাক্রমে এবং নিচে থাকে , সুতরাং বেশি হওয়া উচিত নয় , তবে যেহেতু প্রান্তিক বিতরণগুলি প্রায়-প্রতিসম-দ্বি-পয়েন্ট বিতরণ নয়, এটির তুলনায় এটি অবশ্যই কিছুটা কম হওয়া উচিত।0,0230.0158.6×10-5

প্রকৃতপক্ষে, যদি আমরা বলি যে তারা ইউনিফর্ম থেকে এতটা দূরে নেই, তবে সমবায়িকতা 1/4 এর চেয়ে আরও ভাল পণ্য দ্বারা আবদ্ধ হবে 1/4 - অর্থাত্ এই রেঞ্জগুলির সাথে মোট ইউনিফর্ম পরিবর্তনের জন্য এটি প্রায় চেয়ে কম হবে would - তবে খুব কম নয় কারণ পারস্পরিক সম্পর্ক বেশি। [এই রূপগুলি অভিন্ন নয় - এগুলি স্কু ফেলে রাখা হয় - তবে এটি আমাদের বর্তমান উদ্দেশ্যে যথেষ্ট নিকটে]]2.9×10-5

সুতরাং কেবল প্রতিটি পরিবর্তনশীলের পরিসীমা এবং প্লটটিতে প্রান্তিক বিতরণ এবং পারস্পরিক সম্পর্ক সম্পর্কে মোটামুটি ধারণা থেকে আমি আশা করব যে সমবায়ুতা চেয়ে কিছুটা কম হবে । এটা আসলে আমার হয় ।2.9×10-52.6×10-5

(দু'টি উল্লেখযোগ্য পরিসংখ্যান থেকে শুরু করে খামের দ্রুত পিছনের গণনার জন্য এত খারাপ নয়!)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.