পারস্পরিক সম্পর্ক মেট্রিক্সের মধ্যে একটি সম্পর্কের পরিসংখ্যানগত তাত্পর্য নির্দেশ করতে পারস্পরিক সম্পর্কের সহগের জন্য থ্রেশহোল্ড


10

আমি একটি ডেটা সেটের একটি সম্পর্কিত ম্যাট্রিক্স গণনা করেছি যার মধ্যে 455 ডেটা পয়েন্ট রয়েছে, প্রতিটি ডাটা পয়েন্ট 14 টি বৈশিষ্ট্যযুক্ত। সুতরাং পারস্পরিক সম্পর্ক মেট্রিক্সের মাত্রা 14 x 14 is

আমি ভাবছিলাম যে পারস্পরিক সম্পর্ক সহগের মানটির জন্য একটি প্রান্ত রয়েছে কিনা যা উল্লেখ করে যে সেই দুটি বৈশিষ্ট্যের মধ্যে একটি উল্লেখযোগ্য সম্পর্ক রয়েছে।

আমার মান -২.২ থেকে ০.৮৮ অবধি রয়েছে এবং আমি ভাবছিলাম যে গুরুত্বপূর্ণগুলি সেগুলি যা ০.7 এর উপরে।

  • পারস্পরিক সম্পর্ক সহগের জন্য কি সাধারণ মূল্য আছে যা থ্রেশোল্ডের জন্য বিবেচনা করা উচিত বা আমি যে ধরণের তদন্ত করছি তা কেবলমাত্র প্রাসঙ্গিক নির্ভর করে?


@ ইউজার 603 ভাল ক্যাচ: এটি কার্যত একই প্রশ্ন। এখানে নতুনত্বটি জিজ্ঞাসা করা হয়েছে যে উল্লেখযোগ্য পারস্পরিক সম্পর্কের জন্য পরীক্ষাগুলি "ডেটা টাইপ" (পড়ুন: ডেটা বিতরণ) এর উপর নির্ভর করে। আসুন আশা করা যাক যে উত্তরগুলি পুরানো জমিটি না গিয়ে এই দিকটিতে ফোকাস করে।
whuber

উত্তর:


8

পারস্পরিক সম্পর্কগুলির জন্য তাৎপর্য পরীক্ষা

পরিসংখ্যানগত তাত্পর্য রয়েছে যা পৃথক পারস্পরিক সম্পর্কের ক্ষেত্রে প্রয়োগ করা যেতে পারে, যা নাল অনুমানটি সত্য বলে ধরে নিলে নমুনা পারস্পরিক সম্পর্কের চেয়ে বড় বা বৃহত্তর একটি সম্পর্কিত সম্পর্ক প্রাপ্তির সম্ভাবনা নির্দেশ করে।

মূল বক্তব্যটি হ'ল কোন পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ পারস্পরিক সম্পর্কের সহগের উপর নির্ভর করে:

  • নমুনার আকার : বড় আকারের নমুনার আকারগুলি ছোট ছোট দোরগোড়ায় নিয়ে যাবে
  • আলফা : প্রায়শই .05 তে সেট করা থাকে, ছোট বর্ণগুলি পরিসংখ্যানগত তাৎপর্যের জন্য উচ্চতর প্রান্তিকের দিকে নিয়ে যায়
  • এক-লেজযুক্ত / দ্বি-পুচ্ছ পরীক্ষা : আমি অনুমান করছি যে আপনি দ্বি-পুচ্ছ ব্যবহার করছেন তাই সম্ভবত এটি কোনও ব্যাপার নয়
  • পারস্পরিক সম্পর্ক সহকারীর ধরণ : আমি অনুমান করছি যে আপনি পিয়ারসন ব্যবহার করছেন
  • এক্স এবং y এর বিতরণ অনুমান

সাধারণ পরিস্থিতিতে, যেখানে পিয়ারসনের পারস্পরিক সম্পর্কযুক্ত দ্বি-লেজ পরীক্ষা ব্যবহার করে আলফা .05 হয় এবং যেখানে স্বাভাবিকতা কমপক্ষে পর্যাপ্ত অনুমান হয় সেখানে কাট-অফকে প্রভাবিত করার প্রধান কারণটি নমুনা আকার।

গুরুত্বের প্রান্তে

আপনার প্রশ্নের ব্যাখ্যার আরেকটি উপায় হ'ল বিবেচনা করা যে আপনি কোনও সম্পর্কের পরিসংখ্যানগত দিক থেকে গুরুত্বপূর্ণ কিনা তা নয়, বরং এটি ব্যবহারিকভাবে গুরুত্বপূর্ণ কিনা তা নিয়ে আপনি আগ্রহী না।

কিছু গবেষক পারস্পরিক সম্পর্ক সহগের অর্থ ব্যাখ্যা করার জন্য থাম্বের বিধিগুলির প্রস্তাব দিয়েছেন, তবে থাম্বের এই নিয়মগুলি ডোমেন নির্দিষ্ট।

একাধিক তাত্পর্য পরীক্ষা

(-1)/214(13)/2=9191*.05=4.55

@ ব্যবহারকারীর 603 হিসাবে উল্লেখ করা হয়েছে, এই বিষয়গুলি এই আগের প্রশ্নটিতে ভাল আলোচনা হয়েছিল

সাধারণভাবে, উচ্চ স্তরের কাঠামোর উপর ফোকাস করার জন্য একটি পারস্পরিক সম্পর্ক ম্যাট্রিক্সের ব্যাখ্যা করার সময় আমি এটি দরকারী বলে মনে করি। পারস্পরিক সম্পর্ক মেট্রিক্সের সাধারণ নিদর্শনগুলি দেখে অনানুষ্ঠানিক উপায়ে এটি করা যেতে পারে। এটি পিসিএ এবং ফ্যাক্টর বিশ্লেষণের মতো কৌশলগুলি ব্যবহার করে আরও আনুষ্ঠানিকভাবে করা যেতে পারে। এই জাতীয় পন্থাগুলি একাধিক তাত্পর্য পরীক্ষার সাথে যুক্ত অনেকগুলি বিষয় এড়িয়ে চলে।


1

একটি বিকল্প সিমুলেশন বা অনুক্রম পরীক্ষা করা হবে। যদি আপনি জানেন যে আপনার ডেটা যে বিতরণ থেকে আসে তা সেই বিতরণ থেকে অনুকরণ করতে পারে তবে সমস্ত পর্যবেক্ষণের সাথে স্বাধীন। আপনি যদি বিতরণটি জানেন না তবে আপনি নিজের প্রতিটি ভেরিয়েবলকে একে অপরের থেকে স্বতন্ত্রভাবে অনুমতি দিতে পারেন এবং এটি আপনাকে প্রতিটি ভেরিয়েবলের একই সাধারণ প্রান্তিক বিতরণ দেবে, তবে কোনও সম্পর্ককে অপসারণের সাথে।

উপরের যে কোনও একটি করুন (নমুনার আকার এবং ম্যাট্রিক্সের মাত্রাগুলি একই রাখুন) পুরো একগুচ্ছ সময় (10,000 বা তাই) এবং সর্বাধিক পরম সংযোগ, বা আগ্রহের কারণ হতে পারে এমন কোনও উচ্চতর কোয়ান্টাইলটি দেখুন। এটি আপনাকে নাল অনুমানের থেকে বিতরণ দেবে যা আপনি তারপরে আপনার প্রকৃত পর্যবেক্ষিত পারস্পরিক সম্পর্কের সর্বাধিক তুলনা করতে পারবেন (এবং আগ্রহের অন্যান্য উচ্চ কোয়ান্টাইল)।


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.