আমি কীভাবে পরীক্ষা করব যে দুটি ধারাবাহিক পরিবর্তনশীল স্বতন্ত্র?


48

ধরুন আমার কাছে এবং যৌথ বন্টন থেকে একটি নমুনা । আমি অনুমান যে কিভাবে পরীক্ষা করছ এবং হয় স্বাধীন ?(Xn,Yn),n=1..NXYXY

কোন ধৃষ্টতা যুগ্ম বা প্রান্তিক বন্টন আইনগুলির উপর তৈরি করা হয় এবং (সমস্ত যৌথ স্বাভাবিকতার মধ্যে অন্তত, যে ক্ষেত্রে স্বাধীনতা যেহেতু পারস্পরিক সম্পর্ক হচ্ছে অভিন্ন )।XY0

এবং মধ্যে সম্ভাব্য সম্পর্কের প্রকৃতির উপর কোনও অনুমান করা হয় না ; এটি অ-রৈখিক হতে পারে, সুতরাং ভেরিয়েবলগুলি অসংরক্ষিত ( ) তবে অত্যন্ত সহ-নির্ভর ( )।XYr=0I=H

আমি দুটি পন্থা দেখতে পাচ্ছি:

  1. উভয় ভেরিয়েবল বিন করুন এবং ফিশারের সঠিক পরীক্ষা বা জি-পরীক্ষা ব্যবহার করুন

    • প্রো: সুপ্রতিষ্ঠিত পরিসংখ্যান পরীক্ষা ব্যবহার করুন
    • কন: বিনিংয়ের উপর নির্ভর করে
  2. আনুমানিক নির্ভরতা এর এবং : (এই হল স্বাধীন জন্য এবং এবং যখন তারা সম্পূর্ণরূপে একে অপরের নির্ধারণ)।XYI(X;Y)H(X,Y)0XY1

    • প্রো: একটি পরিষ্কার তাত্ত্বিক অর্থ সহ একটি সংখ্যা উত্পাদন করে
    • কন: আনুমানিক এনট্রপি গণনার উপর নির্ভর করে (অর্থাত, আবার বিন্যাস)

এই পদ্ধতির অর্থ কি?

লোকেরা কী কী পদ্ধতি ব্যবহার করে?



@ রায়কোপম্যান: ধন্যবাদ, আমি এখন দূরত্বের সংশোধন দ্বারা পরিমাপ ও পরীক্ষার নির্ভরতা পড়ছি !
এসডিএস

1
অবিচ্ছিন্ন ভেরিয়েবলের কথা বলার সময় নির্ভরতা বোঝা যায় না। অবিচ্ছিন্ন ভেরিয়েবলের অসীম এনট্রপি থাকে। এখানে, আপনি ডিফেরেনশিয়াল এনট্রপির জন্য প্রতিস্থাপন করতে পারবেন না , কারণ ডিফারেনশিয়াল এন্ট্রপি পারস্পরিক তথ্যের সাথে তুলনীয় নয়। পারস্পরিক তথ্যের একটি "পরম" অর্থ থাকা সত্ত্বেও, এবং ভেরিয়েবলগুলি পরিমাপ করতে আপনি যে ইউনিটগুলি ব্যবহার করেন তার উপর নির্ভর করে ডিফারেনশিয়াল এনট্রপিটি ইতিবাচক, শূন্য বা এমনকি নেতিবাচক হতে পারে । এইচ এক্স ওয়াইI(X;Y)/H(X;Y)HXY
ফোনিণী

@ ফোনিনি: অবশ্যই আমি বিনড ভেরিয়েবলের কথা বলছিলাম। যদিও আপনার মন্তব্যের জন্য ধন্যবাদ।
এসডিএস

উত্তর:


27

এটি সাধারণভাবে একটি খুব কঠিন সমস্যা, যদিও আপনার ভেরিয়েবলগুলি দৃশ্যত কেবলমাত্র 1 ডি এর সাহায্য করে। অবশ্যই, প্রথম পদক্ষেপটি (যখন সম্ভব হবে) ডেটা প্লট করা উচিত এবং আপনার কাছে কোনও কিছু পপ-আপ হয় কিনা তা দেখতে হবে; আপনি 2 ডি তে আছেন তাই এটি সহজ হওয়া উচিত।

এখানে কয়েকটি পদ্ধতি যা বা আরও সাধারণ সেটিংসে কাজ করে:Rn


আপনি কীভাবে সংক্ষেপে উল্লেখ করতে পারেন যে কীভাবে এই পদ্ধতির দূরত্বের সম্পর্ক সম্পর্কিত তুলনা করা হয় ? আমি বড় ডেটাসেটগুলি অনুসন্ধানের জন্য ডিসি ব্যবহার করছি (ভাল, আমার জন্য বৃহত্তর), তাই আপনার কাছে যে কোনও মন্তব্য করতে আমি আগ্রহী। ধন্যবাদ!
pteetor

1
@ পোটিটর এটি আকর্ষণীয়, আমি এর আগে দূরত্বের পারস্পরিক সম্পর্ককে ছাড়িনি। গণনামূলকভাবে, এটি বড় নমুনা আকারগুলির জন্য এনট্রপি অনুমানের পদ্ধতির চেয়ে বেশি ব্যয়বহুল বলে মনে হচ্ছে কারণ আপনার সম্পূর্ণ দূরত্বের ম্যাট্রিক্সের প্রয়োজন (যেখানে কেবলমাত্র প্রথম kপ্রতিবেশী পেতে এনট্রপি অনুমানের জন্য আপনি সূচকগুলি ব্যবহার করতে পারেন )। পরিসংখ্যানগত শক্তি / ইত্যাদির তুলনায় এটি কীভাবে তুলনা করে তা ধারণা নেই
ডগাল

4
পরবর্তী পাঠকদের জন্য: সেজদিনোভিক এট আল দ্বারা অনুমানের পরীক্ষায় দূরত্ব ভিত্তিক এবং আরকেএইচএস-ভিত্তিক পরিসংখ্যানগুলির 2013 এর কাগজ সমতা। দেখায় যে দূরত্ব পারস্পরিক সম্পর্ক এবং অন্যান্য শক্তি দূরত্বগুলি এমএমডি-র বিশেষ উদাহরণ, এইচএসআইসির পেছনের অন্তর্নিহিত পরিমাপ এবং পরীক্ষার শক্তির ক্ষেত্রে সম্পর্ক সম্পর্কিত আলোচনা করে।
ডুগল

18

H_F পরীক্ষা করতে যৌথ র‌্যাঙ্ক ব্যবহার করে দুটি ক্রমাগত ভেরিয়েবলের স্বাধীনতার জন্য হয়েফডিং একটি সাধারণ ননপ্যারামেট্রিক টেস্ট বিকাশ করেছিলেন । এই 1948 পরীক্ষাটি আর প্যাকেজের কার্যক্রমে প্রয়োগ করা হয়েছে ।H0:H(x,y)=F(x)G(y)Hmischoeffd


6

এই কাগজ সম্পর্কে কি:

http://arxiv.org/pdf/0803.4101.pdf

"দূরত্বের পারস্পরিক সম্পর্ক দ্বারা পরিমাপ ও পরিমাপ পরীক্ষা করা"। জাজ্কেলি এবং বাকিরভের কাছে সবসময় আকর্ষণীয় জিনিস থাকে।

বাস্তবায়নের জন্য মাতলাব কোড রয়েছে:

http://www.mathworks.com/matlabcentral/fileexchange/39905-distance-correlation

যদি আপনি স্বাধীনতার জন্য অন্য কোনও (প্রয়োগ করা সহজ) পরীক্ষা পান তবে আমাদের জানান।


2
@ জেএলপি, সাইটে আপনাকে স্বাগতম। আমরা আশা করি প্রশ্নোত্তর আকারে উচ্চমানের পরিসংখ্যান সম্পর্কিত তথ্যের একটি স্থায়ী ভান্ডার তৈরি করব। এর মতো, একটি বিষয় যা আমরা উদ্বিগ্ন তা হ'ল লিংকরোট। এই বিষয়টি মাথায় রেখে, আপনি কীভাবে সেই কাগজে কী আছে / তার কীভাবে প্রশ্নের উত্তর দেয়, তার একটি সংক্ষিপ্ত বিবরণ দিতে চাইবেন, যদি লিঙ্কটি মারা যায়। এটি এই থ্রেডের ভবিষ্যতের পাঠকদেরও সিদ্ধান্ত নিতে সহায়তা করবে যে তারা কাগজটি পড়ার জন্য সময় বিনিয়োগ করতে চান কিনা।
গুং - মনিকা পুনরায়

@ গুং: এটি শক্তি
এসএসএস

5

দূরবর্তী কোভেরিয়েন্স এবং কার্নেল পরীক্ষার (হিলবার্ট-শ্মিট স্বাধীনতার মানদণ্ডের উপর ভিত্তি করে) পরীক্ষার মধ্যে লিঙ্কটি কাগজে দেওয়া হয়েছে:

সেজদিনোভিক, ডি।, শ্রীপেরুমুদুর, বি।, গ্রেটটন, এ। এবং ফুকুমিজু, কে।, অনুমানের পরীক্ষায় দূরত্ব ভিত্তিক এবং আরকেএইচএস-ভিত্তিক পরিসংখ্যানের সমতা, পরিসংখ্যানের বেনাম, ৪১ (৫), পিপি ২২6363-২০২, 2013

এটি দেখানো হয়েছে যে দূরত্বের covariance কার্নেলের একটি নির্দিষ্ট পরিবারের জন্য কর্নেল পরিসংখ্যানগুলির একটি বিশেষ ক্ষেত্রে।

যদি আপনি মিউচুয়াল তথ্য ব্যবহারের উদ্দেশ্যে থাকেন তবে এমআই-এর বিনিত অনুমানের ভিত্তিতে একটি পরীক্ষা হ'ল:

গ্রেটটন, এ। এবং গির্ফি, এল।, স্বাধীনতার ধারাবাহিক ননপ্যারামেট্রিক টেস্টস, মেশিন লার্নিং রিসার্চ জার্নাল, ১১, পিপি .১৯৯১-১৪৩৩, ২০১০।

আপনি যদি সেরা পরীক্ষার শক্তি পাওয়ার বিষয়ে আগ্রহী হন, আপনি বিন্নিং এবং পারস্পরিক তথ্য না দিয়ে কার্নেল পরীক্ষাগুলি ব্যবহার করা ভাল।

এটি বলেছিল যে আপনার ভেরিয়েবলগুলি অবিচ্ছিন্ন, হাইফিডিংয়ের মতো ধ্রুপদী ননপ্যারমেট্রিক স্বাধীনতা পরীক্ষা সম্ভবত ভাল।


4

পরিসংখ্যানের মধ্যে কদাচিৎ (কখনই নয়?) আপনি প্রমাণ করতে পারবেন যে আপনার নমুনা পরিসংখ্যান = একটি পয়েন্টের মান। আপনি পয়েন্টের মানগুলির বিরুদ্ধে পরীক্ষা করতে পারেন এবং হয় সেগুলি বাদ দিন বা বাদ দিন না। তবে পরিসংখ্যানের প্রকৃতিটি এটি পরিবর্তনশীল ডেটা পরীক্ষা করার বিষয়ে ining কারণ সেখানে সর্বদা বৈকল্পিকতা থাকে তবে অগত্যা কোনও জিনিস যে সঠিকভাবে সম্পর্কিত, সাধারণ, গাউসিয়ান ইত্যাদি নয় তা জানার উপায় থাকবে না আপনি কেবল এটির জন্য বিভিন্ন মানের মূল্য জানতে পারবেন। আপনি যদি জানতে পারেন যে কোনও মানটি কলুষিত মানের সীমা থেকে বাদ দেওয়া হয়। উদাহরণস্বরূপ, কোনও সম্পর্ককে বাদ দেওয়া এবং সম্পর্কটি কত বড় তা মূল্য নির্ধারণ করা সহজ।

অতএব, কোনও সম্পর্ক প্রদর্শন করার চেষ্টা করা relationship = 0হচ্ছে না , মূলত এর পয়েন্ট ভ্যালু সাফল্যের সাথে মিলবে না। আপনার যদি সম্পর্কের এমন কয়েকটি পদক্ষেপ থাকে যা প্রায় 0 হিসাবে গ্রহণযোগ্য হয় তবে কোনও পরীক্ষা তৈরি করা সম্ভব হবে।

ধরে নিই যে আপনি এই সীমাবদ্ধতাটি মেনে নিতে পারবেন এটি লোকে বাঁকানো একটি স্ক্র্যাটারপ্লট সরবরাহ করতে আপনাকে সহায়তা করার চেষ্টা করা লোকেদের পক্ষে সহায়ক। যেহেতু আপনি আর সমাধানগুলি সন্ধান করছেন চেষ্টা করুন:

scatter.smooth(x, y)

আপনি এ পর্যন্ত দেওয়া সীমাবদ্ধ তথ্যের উপর ভিত্তি করে আমি মনে করি যে একটি সাধারণীকরণমূলক মডেলটি অ-স্বাধীনতার পরীক্ষার জন্য সেরা জিনিস হতে পারে। যদি আপনি পরিকল্পনা করেন যে সিআই এর পূর্বাভাসিত মানগুলির চারপাশে আপনি স্বাধীনতার বিশ্বাস সম্পর্কে বিবৃতি দিতে সক্ষম হতে পারেন। gamএমজিসিভি প্যাকেজে পরীক্ষা করে দেখুন । সহায়তাটি বেশ ভাল এবং সিআই সম্পর্কিত এখানে সহায়তা রয়েছে ।


2

এটি আকর্ষণীয় হতে পারে ...

গার্সিয়া, জেই; গনজালেজ-লোপেজ, ভিএ (২০১৪) দীর্ঘতম বর্ধমান অনুচ্ছেদের ভিত্তিতে অবিচ্ছিন্ন র্যান্ডম ভেরিয়েবলের জন্য স্বাধীনতা পরীক্ষা। মাল্টিভারিয়েট বিশ্লেষণ জার্নাল, v 127 p। 126-146।

http://www.sciencedirect.com/science/article/pii/S0047259X14000335


2
এই পোস্টে নিবন্ধে কী রয়েছে সে সম্পর্কে আরও বিশদ থেকে উপকার পাবেন, বিশেষত এটি পে-ওয়ালয়ের পিছনে রয়েছে।
এরিক

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.