লিনিয়ার কোভেরিয়েন্সের চেয়ে দূরত্বের সমবায় কখন কম উপযুক্ত?


21

আমি সবেমাত্র (অস্পষ্টভাবে) ব্রাউনিয়ান / দূরত্বের সমবায় / পারস্পরিক সম্পর্কের সাথে পরিচয় করিয়েছি । নির্ভরশীলতার জন্য পরীক্ষা করার সময় এটি অনেকগুলি অ-রৈখিক পরিস্থিতিতে বিশেষত কার্যকর বলে মনে হয়। তবে এটি প্রায়শই ব্যবহার করা হয় বলে মনে হয় না, যদিও প্রায়শই অ-লিনিয়ার / বিশৃঙ্খলাযুক্ত ডেটার জন্য কোভারিয়েন্স / পারস্পরিক সম্পর্ক ব্যবহৃত হয়।

এটি আমাকে ভাবছে যে দূরত্বের covariance কিছু অসুবিধা হতে পারে। তাহলে সেগুলি কী এবং কেন সকলেই সর্বদা দূরত্বের সমবায় ব্যবহার করে না?



আমি পড়েছি যে আপনি লিনিয়ার সময় সিরিজের তুলনা করতে এবং তাদের ওজনের সাথে একত্র করার জন্য dcov ব্যবহার করছিলেন..আমি ভাবছিলাম যে আপনি যা করেছেন তা একটি ভারী দূরত্বের সমবায় ব্যবহার করছেন কিনা তা মনে করে আপনি গণনা করার জন্য একটি ওয়েট ভেক্টর ব্যবহার করে আপনার ডেটাতে বিভিন্ন ওজন দিয়েছেন দূরত্ব পারস্পরিক সম্পর্ক? আমি এটি করার চেষ্টা করছি তবে আমি নিশ্চিত নই যে দূরত্বের সম্পর্কের সূত্রগুলিতে কোনও ওজন ভেক্টর প্রবর্তন করা যদি সঠিক উপায় হয়।
ব্যবহারকারী3757561

না, দুঃখিত @ ব্যবহারকারী 3757561, আমি পারস্পরিক সম্পর্কের প্রতিস্থাপন হিসাবে কেবল দূরত্বের সম্পর্কের চেষ্টা করছিলাম এবং তার ভিত্তিতে ওজন তৈরি করছিলাম। তবে আমি যাইহোক এটি ব্যবহার করে শেষ করি নি ...
naught101

উত্তর:


18

আমি নীচে তালিকাভুক্ত রেফারেন্সগুলি পড়ার থেকে আমার প্রভাবগুলির উপর ভিত্তি করে দূরত্বের সমবায় সম্পর্কে কয়েকটি মন্তব্য সংগ্রহ করার চেষ্টা করেছি। তবে আমি নিজেকে এই বিষয়ে বিশেষজ্ঞ হিসাবে বিবেচনা করি না। মন্তব্য, সংশোধন, পরামর্শ, ইত্যাদি স্বাগত।

মূল প্রশ্নে অনুরোধ হিসাবে মন্তব্যগুলি সম্ভাব্য ত্রুটিগুলির দিকে (দৃ strongly়ভাবে) পক্ষপাতদুষ্ট

আমি এটি দেখতে হিসাবে, সম্ভাব্য ত্রুটিগুলি নিম্নরূপ:

  1. পদ্ধতিটি নতুন । আমার অনুমান যে এই সময়ে জনপ্রিয়তার অভাব সম্পর্কে এটি একক বৃহত্তম ফ্যাক্টর। দূরত্বের স্বৈরশাসনের রূপরেখার কাগজগুলি 2000 এর মাঝামাঝি থেকে শুরু হয় এবং আজ অবধি অগ্রগতি হয়। উপরে বর্ণিত কাগজটি হ'ল সবচেয়ে মনোযোগ (হাইপ?) পেয়েছে এবং এটি তিন বছরেরও কম পুরানো। বিপরীতে, তত্ত্ব এবং পারস্পরিক সম্পর্ক এবং পারস্পরিক সম্পর্কের মতো পদক্ষেপের ফলাফল ইতিমধ্যে তাদের পিছনে এক শতাব্দীর বেশি কাজ করেছে।
  2. প্রাথমিক ধারণাগুলি আরও চ্যালেঞ্জিং । একটি অপারেশনাল স্তরে পিয়ারসনের পণ্য-মুহুর্তের সম্পর্ক, খুব সহজেই ক্যালকুলাস ব্যাকগ্রাউন্ড ছাড়াই কলেজ নবীনকে ব্যাখ্যা করা যেতে পারে। একটি সাধারণ "অ্যালগরিদমিক" দৃষ্টিভঙ্গি তৈরি করা যেতে পারে এবং জ্যামিতিক অন্তর্দৃষ্টি বর্ণনা করা সহজ। এর বিপরীতে, দূরত্বের সহজাততার ক্ষেত্রে, যুগলভাবে ইউক্লিডিয়ান দূরত্বের পরিমাণের পরিমাণের পণ্যগুলির ধারণাটিও কিছুটা বেশি কঠিন এবং একটি স্টোকেস্টিক প্রক্রিয়া সম্পর্কিত সম্মতিবাদের ধারণাটি এতটা শ্রোতাদের কাছে যথাযথভাবে ব্যাখ্যা করার চেয়েও অতিক্রম করে goes ।
  3. এটি গণনামূলকভাবে আরও বেশি দাবিদার । পরীক্ষার পরিসংখ্যান গণনা করার জন্য মৌলিক অ্যালগরিদম হল স্ট্যান্ডার্ড পারস্পরিক সম্পর্ক মেট্রিক্সের জন্য ( এন ) এর বিপরীতে নমুনার আকারে । ছোট নমুনা আকারের জন্য এটি কোনও বড় বিষয় নয়, তবে বৃহত্তরগুলির জন্য এটি আরও গুরুত্বপূর্ণ হয়ে ওঠে।O(n2)O(n)
  4. পরীক্ষার পরিসংখ্যানগুলি বিতরণ মুক্ত নয়, এমনকি অ্যাসেম্পোটোটিকভাবেও । এক প্রত্যাশার পারে যে একটি পরীক্ষা পরিসংখ্যাত যে সব বিকল্প বিরুদ্ধে সামঞ্জস্যপূর্ণ হয়, যে বন্টন অন্তত এসিম্পটোটিকভাবে-পারে অন্তর্নিহিত ডিস্ট্রিবিউশন স্বাধীন হতে জন্য এবং ওয়াই নাল হাইপোথিসিস অধীনে। এটি দূরত্বের সহজাততার ক্ষেত্রে নয় কারণ শূন্যের অধীনে বিতরণটি এক্স এবং ওয়াইয়ের অন্তর্নিহিত বিতরণের উপর নির্ভর করে এমনকি নমুনার আকারটি অসীমের দিকে ঝোঁক। এটা তোলে হয় সত্য যে ডিস্ট্রিবিউশন অবিশেষে একটি দ্বারা বেষ্টিত করা হয় χ 2 1 বন্টন, যা একটি হিসাব জন্য করতে পারবেন রক্ষণশীল সমালোচনামূলক মান।XYXYχ12
  5. |ρ|
  6. অজানা পাওয়ার বৈশিষ্ট্য । সমস্ত বিকল্পের বিরুদ্ধে সামঞ্জস্য বজায় রাখা মূলত গ্যারান্টি দেয় যে কিছু বিকল্পের বিরুদ্ধে দূরত্বের সম্প্রচারের খুব কম শক্তি থাকতে হবে। অনেক ক্ষেত্রেই বিশেষ স্বার্থের বিকল্পের বিরুদ্ধে অতিরিক্ত শক্তি অর্জনের জন্য কেউ সাধারণতা ত্যাগ করতে রাজি হয়। মূল কাগজপত্রগুলি এমন কয়েকটি উদাহরণ দেখায় যাতে তারা স্ট্যান্ডার্ড পারস্পরিক সম্পর্ক মেট্রিকের তুলনায় উচ্চ ক্ষমতার দাবি করে তবে আমি বিশ্বাস করি যে, উপরের দিকে (১) ফিরে গিয়ে বিকল্পগুলির বিরুদ্ধে এর আচরণটি এখনও ভালভাবে বোঝা যায় নি।

পুনরাবৃত্তি করতে, এই উত্তর সম্ভবত বেশ নেতিবাচক জুড়ে আসে। কিন্তু, এটি উদ্দেশ্য নয়। দূরত্বের covariance সম্পর্কিত কিছু খুব সুন্দর এবং আকর্ষণীয় ধারণা রয়েছে এবং এর আপেক্ষিক অভিনবত্ব এটি আরও পুরোপুরি বোঝার জন্য গবেষণার উপায়গুলিও উন্মুক্ত করে।

তথ্যসূত্র :

  1. জিজে স্পেকেলি এবং এমএল রিজো (২০০৯), ব্রাউনিয়ান দূরত্বের কোভেরিয়েন্স , আন। Appl। পরিসংখ্যানবিৎ। , খণ্ড। 3, না। 4, 1236–1265।
  2. GJ Szekely, এমএল Rizzo এবং এন কে Bakirov (2007), পরিমাপ ও দূরত্ব পারস্পরিক সম্পর্ক দ্বারা স্বাধীনতা পরীক্ষার , অ্যান। পরিসংখ্যানবিৎ। , খণ্ড। 35, 2769–2794।
  3. আর। লিয়নস (২০১২), মেট্রিক স্পেসে দূরত্বের সহকারী , আন। Probab। (প্রদর্শিত).

দুর্দান্ত উত্তর, আপনাকে ধন্যবাদ। এর কিছুটা আমার মাথার উপরে কিছুটা হলেও আমি মনে করি যে আমি নিজেই এর প্রতিকার করতে সক্ষম হব :)
নট 101

1
আরও দেখুন সারাংশ এবং আলোচনা: "Brownian দূরত্ব সহভেদাংক" পরিসংখ্যান জার্নাল ক্লাব, 36-825 বেঞ্জামিন Cowley এবং: Giuseppe ভিঞ্চি অক্টোবর 27, 2014 stat.cmu.edu/~ryantibs/journalclub/dcov.pdf
ফিলিপ জি Nievinski

2
O(nlogn)

3

আমি ভালভাবে কিছু অনুভব করতে পারি, তবে কেবল দুটি ভেরিয়েবলের মধ্যে ননলাইনারের উপর নির্ভরশীলতার পরিমাণ নির্ধারণের ফলে খুব বেশি পরিশোধ হবে বলে মনে হয় না। এটি আপনাকে সম্পর্কের আকারটি বলবে না। এটি আপনাকে অন্যের থেকে একটি ভেরিয়েবলের পূর্বাভাস দেওয়ার কোনও উপায় দেয় না। সাদৃশ্য অনুসারে, অনুসন্ধানের তথ্য বিশ্লেষণ করার সময় কেউ কখনও কখনও একটি সরলরেখা, একটি চতুর্ভুজ, একটি ঘনক ইত্যাদির সাহায্যে ডেটা সর্বাধিক মডেল করা হয় কিনা তা দেখার দিকে প্রথম ধাপ হিসাবে একটি লোয়েস বক্ররেখা (স্থানীয়ভাবে ওজনিত স্ক্রেটারপ্ল্লিট স্মুথ) ব্যবহার করে তবে লটটি ইন এবং নিজেই একটি খুব দরকারী ভবিষ্যদ্বাণীমূলক সরঞ্জাম নয়। একটি দ্বিখণ্ডিত আকার বর্ণনা করার জন্য একটি কার্যক্ষম সমীকরণ সন্ধানের পথে এটি কেবল প্রথম অনুমান। এই সমীকরণটি, লোস (বা দূরত্বের কোভেরিয়েন্স ফলাফল) এর বিপরীতে, একটি নিশ্চিতকরণকারী মডেলের ভিত্তি তৈরি করতে পারে।


আমার উদ্দেশ্যে, এটি একটি পরিশোধ আছে। আমি কোনও কিছুর পূর্বাভাস দেওয়ার জন্য ডিকভ () ব্যবহার করছি না, বরং একটি নকশায় একাধিক অ-রৈখিক সময়-সিরিজের তুলনা করে এবং তাদের নির্ভরতার উপর ভিত্তি করে ওজনগুলির সাথে সংমিশ্রণ করি। এই পরিস্থিতিতে, dcov () এর সম্ভাব্য বড় সুবিধা রয়েছে।
nnot101

@ naught101 আপনি কিছু 'আকরিক তথ্য' রাখতে পারেন ?- আপনি '-কম্বাইন' বললে? ননলাইনার নির্ভরতার উপর ভিত্তি করে ওজন বিবেচনায় এটি আমার কাছে আকর্ষণীয় মনে হচ্ছে। আপনি কি বলতে চাচ্ছেন- সময় ধারাবাহিকে দলগুলিতে শ্রেণিবদ্ধ করছেন? এছাড়াও-এই দৃশ্যে উচ্চ এবং নিম্ন ওজন কী জোর দেয়?
শবযান

2
@PraneethVepakomma: আউট আমার উত্তর চেক stats.stackexchange.com/questions/562/...
naught101

1
এছাড়াও, যদি আপনি নির্ভরতা (যেমন, বহুপদী সমীকরণ) সাধারণ ফর্ম জানেন, তাহলে আপনি নির্ভরতা সংকল্প সহগ ব্যবহার করে, দেখে, যেমন শক্তি পরিমাণ নির্ণয় করতে পারে, মূলত পেশ স্থায়ী কম্পিউটিং বহুপদী রিগ্রেশন জন্য R2 হলো
ফিলিপ জি Nievinski
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.