সমবায় সংজ্ঞা সংজ্ঞা


11

আমি দুটি এলোমেলো ভেরিয়েবলের কোভারিয়েন্সকে আরও ভালভাবে বুঝতে এবং বোঝার চেষ্টা করছিলাম যে প্রথম ব্যক্তি যিনি এটি সম্পর্কে চিন্তাভাবনা করেছিলেন, সেই সংজ্ঞাটিতে পৌঁছেছিলেন যা নিয়মিতভাবে পরিসংখ্যানগুলিতে ব্যবহৃত হয়। আমি আরও ভাল করে বুঝতে উইকিপিডিয়ায় গিয়েছিলাম । নিবন্ধটি থেকে মনে হচ্ছে ভাল প্রার্থীর পরিমাপ বা পরিমাণের নিম্নলিখিত বৈশিষ্ট্য থাকতে হবে:Cov(X,Y)

  1. দুটি র্যান্ডম ভেরিয়েবল সমান হলে এটির ইতিবাচক চিহ্ন রয়েছে (অর্থাত্ যখন একজন অপরটিকে বাড়িয়ে তোলে এবং যখন একটি হ্রাস ঘটে তখন অন্যটিও ঘটে)।
  2. দুটি এলোমেলো ভেরিয়েবল বিপরীতভাবে অনুরূপ হলে আমরা এটির নেতিবাচক চিহ্ন থাকতে চাই (অর্থাত্‍ যখন অন্যটি এলোমেলো পরিবর্তনশীল হ্রাস পায়)
  3. শেষ অবধি, আমরা চাই যে এই সমবায়ু পরিমাণটি শূন্য হতে পারে (বা সম্ভবত খুব ছোট?) যখন দুটি ভেরিয়েবল একে অপরের থেকে স্বতন্ত্র থাকে (যেমন তারা একে অপরের প্রতি সম্মানের সাথে সহ-পৃথক হয় না)।

উপরের বৈশিষ্ট্যগুলি থেকে আমরা সংজ্ঞায়িত করতে চাই । আমার প্রথম প্রশ্নটি হল, এই সম্পত্তিগুলিকে সন্তুষ্ট করে তা সম্পূর্ণই আমার কাছে স্পষ্ট নয় । আমাদের যে বৈশিষ্ট্যগুলি রয়েছে, সেগুলি থেকে আমি আদর্শ প্রার্থী হওয়ার জন্য "ডেরাইভেটিভ" -র মতো সমীকরণের আরও অনেক আশা করতাম। উদাহরণস্বরূপ, আরও কিছু ভালো লেগেছে, "যদি এক্স পজিটিভের পরিবর্তন হয় তবে Y এর পরিবর্তনটিও ইতিবাচক হওয়া উচিত"। এছাড়াও, কেন "সঠিক" জিনিসটি গড় থেকে আলাদা করা হচ্ছে?সি ভি ( এক্স , ওয়াই ) = [ ( এক্স - [ এক্স ] ) ( ওয়াই - [ ওয়াই ] ) ]Cov(X,Y)Cov(X,Y)=E[(X-[এক্স])(ওয়াই-[ওয়াই])]

আরও স্পর্শকাতর, তবে এখনও একটি আকর্ষণীয় প্রশ্ন, এখানে কি অন্যরকম সংজ্ঞা রয়েছে যা এই বৈশিষ্ট্যগুলিকে সন্তুষ্ট করতে পারত এবং এখনও অর্থবহ এবং কার্যকর হত? আমি এটি জিজ্ঞাসা করছি কারণ মনে হচ্ছে কেউই প্রশ্ন করছে না যে আমরা কেন এই সংজ্ঞাটি প্রথম স্থানে ব্যবহার করছি (এটি একধরণের মনে হয়, এর "সর্বদা এইভাবে ছিল", যা আমার মতে, একটি ভয়ানক কারণ এবং এটি বৈজ্ঞানিক এবং গাণিতিক কৌতূহল এবং চিন্তাভাবনা)। গৃহীত সংজ্ঞাটি কি আমাদের "সেরা" সংজ্ঞাটি থাকতে পারে?


গ্রহণযোগ্য সংজ্ঞাটি কেন বোধগম্য হয় সে সম্পর্কে এগুলি আমার ধারণা (এটি কেবল একটি স্বজ্ঞাত যুক্তি হতে পারে):

চলুন এক্স ভেরিয়েবল এক্সের জন্য কিছুটা পার্থক্য হোক (যেমন এটি কিছু সময়ের থেকে কিছু সময় থেকে অন্য কোনও মানের পরিবর্তিত হয়েছিল)। একইভাবে সংজ্ঞায়িত করার জন্য ।Δ ওয়াইΔএক্সΔওয়াই

সময়ের জন্য একটি উদাহরণের জন্য, আমরা গণনা করতে পারি সেগুলি সম্পর্কিত কিনা তা না করে:

গুলিআমিএন(Δএক্সΔওয়াই)

এটি কিছুটা সুন্দর! সময়ের জন্য একটি উদাহরণ হিসাবে এটি আমাদের পছন্দসই বৈশিষ্ট্যগুলি সন্তুষ্ট করে। যদি তারা উভয়ই একসাথে বৃদ্ধি পায়, তবে বেশিরভাগ সময় উপরের পরিমাণটি ইতিবাচক হওয়া উচিত (এবং একইভাবে যখন তারা বিপরীতভাবে অনুরূপ হয়, এটি নেতিবাচক হবে, কারণ বিপরীত চিহ্ন থাকবে)।ডিটিএকটি

তবে এটি কেবলমাত্র সময়ের জন্য একটি উদাহরণের জন্য আমাদের প্রয়োজনীয় পরিমাণটি দেয় এবং তারা আরভি হওয়ায় আমরা কেবলমাত্র 1 টি পর্যবেক্ষণের ভিত্তিতে দুটি ভেরিয়েবলের সম্পর্ককে স্থির করার সিদ্ধান্ত নিলে আমরা তার চেয়ে বেশি উপকার করতে পারি। তাহলে কেন পার্থক্যগুলির "গড়" পণ্যটি দেখার জন্য এটি প্রত্যাশা নেবেন না।

গুলিআমিএন([Δএক্সΔওয়াই])

উপরোক্ত সংজ্ঞায়িত গড় সম্পর্কের গড়পড়তা যা গড়ে তুলতে হবে! তবে এই ব্যাখ্যাটির একমাত্র সমস্যা হ'ল আমরা এই পার্থক্যটি কী থেকে পরিমাপ করব? যা এই পার্থক্যটি গড় থেকে পরিমাপের মাধ্যমে সম্বোধন করা বলে মনে হচ্ছে (যা কোনও কারণে সঠিকভাবে করা উচিত)।

আমি অনুমান করি যে সংজ্ঞাটি সহ আমার কাছে মূল সমস্যাটি হ'ল পার্থক্যটি ফর্মটি গ্রহণ করছে । আমি নিজেকে এখনও এটি ন্যায্য বলে মনে হয় না।


চিহ্নটিকে ব্যাখ্যা করার জন্য একটি পৃথক প্রশ্নের জন্য রেখে দেওয়া যেতে পারে, কারণ এটি আরও জটিল বিষয় বলে মনে হচ্ছে।


2
খুব শুরুর পয়েন্টটি ক্রস-প্রোডাক্টের ধারণা বা অন্তর্নিহিত হতে পারে (কোভেরিয়েন্স কেবল এটির সম্প্রসারণ)। যদি আমাদের একই দৈর্ঘ্যের X এবং Y সংখ্যার দুটি সিরিজ থাকে এবং আমরা যোগফল (Xi * Yi) হিসাবে সংক্ষিপ্ত ক্রস-পণ্যটি সংজ্ঞায়িত করি, তবে উভয় সিরিজ একই ক্রমে সাজানো থাকলে এটি সর্বাধিক করা হয় এবং যদি এক হয় তবে এটি ন্যূনতম হয় সিরিজটি আরোহী অনুসারে বাছাই করা হয়েছিল এবং অন্যটি নিম্নরূপে।
ttnphns

গড় থেকে পার্থক্যটি মৌলিক বিষয় নয়। এটি কেবলমাত্র মাত্রার যা গুরুত্বপূর্ণ, উত্স থেকে পার্থক্য; কিছু কারণে এটি প্রাকৃতিকভাবে এবং উত্সটিকে মাঝখানে স্থাপন করা সুবিধাজনক।
ttnphns

@ এনটিএনএফএনএস আপনি কি বলছেন যে তারা যদি একসাথে আধ্যাত্মিক পদক্ষেপ নিয়ে থাকে তবে তখন theকতাকে "সর্বাধিকতর" করা উচিত এবং যদি তারা কোভের বিপরীতে থাকে তবে এটি যতটা সম্ভব নেতিবাচক হওয়া উচিত? (অর্থাত্ সংক্ষিপ্তকরণ) কেন ক্রস-প্রোডাক্টের প্রত্যাশা হিসাবে সংজ্ঞায়িত হয় না?
চার্লি পার্কার 21

সহজাততা অন্তর্নিহিত উত্স ছাড়াই পরিবর্তনশীলগুলির জন্য প্রাকৃতিক। তারপরে আমরা গণনাটির অর্থটিকে মূল হিসাবে গণ্য করি (এর অর্থ সংযুক্তির থিমের সাথে সম্পর্কিত নয় এমন ভাল বৈশিষ্ট্য রয়েছে, তাই এটি সাধারণত নির্বাচিত হয়)। যদি উত্সটি সহজাত এবং অর্থবহ হয় তবে এটির সাথে লেগে থাকা যুক্তিসঙ্গত হয়, তবে "কোভেরিয়েন্স" (সহ-উত্সাহ) প্রতিসম হবে না, তবে কে চিন্তা করে?
ttnphns

1
এই উত্তরটি covariance সম্পর্কিত অন্তর্দৃষ্টি একটি খুব সুন্দর টুকরা সরবরাহ করে।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


10

কল্পনা করুন যে আমরা সংখ্যার খালি স্ট্যাক দিয়ে শুরু করি। তারপরে আমরা তাদের যৌথ বন্টন থেকে জোড়া অঙ্কন শুরু করি । চারটি জিনিসের একটি ঘটতে পারে:(এক্স,ওয়াই)

  1. যদি এক্স এবং ওয়াই উভয়ই বড় হয় তবে তাদের স্ব স্ব গড় গড়ে আমরা বলি এই জুটি একই রকম এবং তাই আমরা স্ট্যাকের উপর একটি ধনাত্মক সংখ্যা রেখেছি।
  2. যদি এক্স এবং ওয়াই উভয়ই স্বল্প হয় তবে তাদের স্ব স্ব গড়গুলি আমরা বলি যে জোড়াটি সমান এবং স্ট্যাকের উপরে একটি ধনাত্মক সংখ্যা রাখে।
  3. যদি এক্স এর গড়ের চেয়ে বড় হয় এবং ওয়াই এর গড়ের চেয়ে ছোট হয় তবে আমরা বলি যে এই জুড়িটি ভিন্ন এবং স্ট্যাকের উপর একটি নেতিবাচক সংখ্যা রাখুন।
  4. যদি এক্স এর গড়ের চেয়ে ছোট হয় এবং ওয়াই এর গড়ের চেয়ে বড় হয় তবে আমরা বলি যে এই জুড়িটি ভিন্ন এবং স্ট্যাকের উপর একটি নেতিবাচক সংখ্যা রাখুন।

তারপরে, এক্স এবং ওয়াইয়ের (ডিস-) মিলের সামগ্রিক পরিমাপের জন্য আমরা স্ট্যাকের সংখ্যার সমস্ত মান যুক্ত করব। একটি ধনাত্মক যোগফল একই সময়ে চলকগুলি একই দিকে অগ্রসর হওয়ার পরামর্শ দেয়। একটি নেতিবাচক যোগফল পরিবর্তনগুলি বিপরীত দিকের দিকে না গিয়ে প্রায়শই চালিত হওয়ার পরামর্শ দেয়। একটি শূন্য রাশি একটি ভেরিয়েবলের দিক জানার পরামর্শ দেয় অন্যটির দিকনির্দেশ সম্পর্কে আপনাকে বেশি কিছু বলে না।

কেবল 'বিগ' (বা 'পজিটিভ') এর চেয়ে 'গড়ের চেয়ে বড়' সম্পর্কে চিন্তা করা গুরুত্বপূর্ণ কারণ কোনও দুটি অ-নেতিবাচক ভেরিয়েবলের সমান হিসাবে বিবেচনা করা হবে (যেমন, এম 42 এবং পরবর্তী গাড়ি ক্রাশের আকার প্যাডিংটন ট্রেন স্টেশনে আগামীকাল কেনা টিকিটের সংখ্যা)।

সমবায় সূত্রটি এই প্রক্রিয়াটির একটি আনুষ্ঠানিককরণ:

Cov(এক্স,ওয়াই)=[(এক্স-[এক্স])(ওয়াই-[ওয়াই])]

মন্টি কার্লো সিমুলেশন না করে সম্ভাব্যতা বন্টন ব্যবহার করে এবং আমরা স্ট্যাকটিতে যে সংখ্যার আকার রেখেছি তা নির্দিষ্ট করে।


বাহ, এটি খুব ভাল উত্তর। কেবল একটি শেষ কথা, কেন পার্থক্যটি কেন তারতম্য হতে হবে তার ন্যায্যতা সম্পর্কে আরও বিশদ যুক্ত করার বিষয়ে আপনি কি মনে করেন ? কেন অন্য কিছু মূল্য? কেন এটা বোধগম্য? আমি মনে করি মূলত এই সংজ্ঞাটি পুরোপুরি অভ্যন্তরীণ করার বিষয়ে আমাকে আটকে রাখছে। ধন্যবাদ বিটিডব্লিউ!
চার্লি পার্কার

ধন্যবাদ। মনে করুন দুটি ভিন্ন দেশে দুটি বড় ট্রাক রয়েছে। এখন বড় ট্রাকগুলি বড় বোঝা বহন করে। প্রতিবার যদি প্রতিটি ট্রাক একটি বড় বোঝা বহন করে থাকে, আমরা যদি স্ট্যাকটিতে একটি ইতিবাচক সংখ্যা যুক্ত করি তবে আমরা বলতে চাই যে দুটি ট্রাকের আচরণ খুব একই রকম ছিল। কিন্তু আসলে একটি ট্রাক বহনকারী বোঝার আকার কোনও নির্দিষ্ট সময়ে অন্যের দ্বারা বহন করা বোঝার আকারের সাথে সম্পর্কিত নয়। তারা কেবল বড় ট্রাক উভয়েরই হয়ে থাকে। সুতরাং আমাদের মিলের পরিমাপটি কার্যকর হবে না। এজন্য আমাদের 'গড়ের চেয়ে বড়' সম্পর্কে ভাবতে হবে।
অনুমান

দুঃখিত এটি কিছুটা দেরীতে হলেও আমি এই বিষয়টি পর্যালোচনা করার সিদ্ধান্ত নিয়েছি এবং কেন এটির গড় থেকে পার্থক্য রয়েছে তা নিয়ে আমার এখনও একটি প্রশ্ন রয়েছে। প্রতিটি এলোমেলো ভেরিয়েবল এক্স এবং ওয়াই বিভিন্ন স্কেল থেকে আসতে পারে বলে কি তাদের নিজ নিজ থেকে পার্থক্য গুরুত্বপূর্ণ? অর্থাত্ "বড়" কী তা বোঝার জন্য তারা কোন বেস স্কেলটির উপর নির্ভর করে তার থেকে আলাদা। সুতরাং স্কেলের এই সমস্যাটি কাটিয়ে ওঠার জন্য আমরা এটিকে তাদের নিজ নিজ উপায়ে তুলনা করি?
চার্লি পার্কার

1

কোনও সমীকরণ ছাড়াই এটি দেখার আমার স্বজ্ঞাত উপায়।

  1. এটি উচ্চ মাত্রার পরিবর্তনের একটি সাধারণীকরণ। ডেটা কীভাবে আচরণ করে তা বর্ণনা করার চেষ্টা থেকে অনুপ্রেরণা এসেছে। প্রথম অর্ডারে, আমাদের এর অবস্থান - গড়। দ্বিতীয় ক্রমে, আমাদের কাছে ছড়িয়ে ছিটিয়ে থাকা - সম্প্রদায় রয়েছে।

    আমি অনুমান করি যে সংজ্ঞাটি সহ আমার কাছে মূল সমস্যাটি হ'ল পার্থক্যটি ফর্মটি গ্রহণ করছে। আমি নিজেকে এখনও এটি ন্যায্য বলে মনে হয় না।

    বিচ্ছুরণ বিতরণের কেন্দ্রের তুলনায় মূল্যায়ন করা হয়। পরিবর্তনের সর্বাধিক প্রাথমিক সংজ্ঞাটি হ'ল 'গড় থেকে বিচ্যুতি'। সুতরাং, আপনাকে কোভারিয়েন্সের ক্ষেত্রেও গড়টি বিয়োগ করতে হবে।

  2. আরেকটি প্রধান প্রেরণা যা মনে আসে তা হ'ল এলোমেলো ভেরিয়েবলের মধ্যে দূরত্ব পরিমাপ করার একটি উপায় নির্ধারণ করা। মহালানোবিস দূরত্ব এবং কোভারিয়েন্স একসাথে আসে: একটি গাউসীয় বিতরণ দেওয়া হয়েছে এবং অন্য দুটি নমুনা যা সমান ইউক্যালিডিয়ান দূরত্বের বন্টনকে বোঝায়। যদি আমি আপনাকে জিজ্ঞাসা করি যে কোনটি নমুনা গাউসীয় বিতরণ থেকে আঁকা হয়নি এমন আউটলেটর হওয়ার সম্ভাবনা বেশি, তবে ইউক্লিডিয়ান দূরত্বটি করবে না। মহালানোবিস দূরত্ব ইউক্লিডিয়ান দূরত্ব থেকে একক উল্লেখযোগ্য পার্থক্য আছে: এটি বিতরণ এর বিচ্ছুরক (Covariance) বিবেচনা করে। এটি আপনাকে এলোমেলো ভেরিয়েবলের দূরত্বকে সাধারণকরণ করতে দেয়।


1
  1. শেষ অবধি, আমরা চাই যে এই সমবায়ু পরিমাণটি শূন্য হতে পারে (বা সম্ভবত খুব ছোট?) যখন দুটি ভেরিয়েবল একে অপরের থেকে স্বতন্ত্র থাকে (যেমন তারা একে অপরের প্রতি সম্মানের সাথে সহ-পৃথক হয় না)।

(12)এক্সওয়াই[এক্সওয়াই][এক্সওয়াই]=14এক্স^=1000এক্সওয়াই^=1000ওয়াই[এক্স^ওয়াই^]=250,000(এক্স,ওয়াই)=[(এক্স-[এক্স])(ওয়াই-[ওয়াই])]

  1. দুটি এলোমেলো ভেরিয়েবল বিপরীতভাবে অনুরূপ হলে আমরা এটির নেতিবাচক চিহ্ন থাকতে চাই (অর্থাত্‍ যখন অন্যটি এলোমেলো পরিবর্তনশীল হ্রাস পায়)

এক্সওয়াই=1-এক্স[এক্সওয়াই]=0(এক্স,ওয়াই)=[(এক্স-[এক্স])(ওয়াই-[ওয়াই])]

  1. যখন দুটি র্যান্ডম ভেরিয়েবল একই রকম হয় (যেমন যখন একজন অপরটিকে বাড়িয়ে তোলে এবং অন্যটি হ্রাস পায় তখন এটিরও ইতিবাচক চিহ্ন ) থাকা উচিত ।

এক্সওয়াই=এক্স-1[এক্সওয়াই](এক্স,ওয়াই)=[(এক্স-[এক্স])(ওয়াই-[ওয়াই])] আপনি যেমন চান তেমন একটি ইতিবাচক মান দেয়।

এক্স=ওয়াই


1

আমি একই প্রশ্নটি নিয়ে ভাবছিলাম, এবং অনুমান দ্বারা প্রদত্ত অন্তর্দৃষ্টি আমাকে সহায়তা করেছিল। অন্তর্দৃষ্টিটি কল্পনা করার জন্য, আমি দুটি এলোমেলো স্বাভাবিক ভেক্টর, এক্স এবং ওয়াই নিয়েছি, স্ক্যাটারপ্লট প্লট করেছি এবং প্রতিটি পয়েন্টকে তাদের নিজস্ব উপায়গুলি থেকে বিচ্যুত করার কারণে রঙিন করেছি (ইতিবাচক মানগুলির জন্য নীল, নেতিবাচক জন্য লাল)।

প্লটটি থেকে পরিষ্কার যে পণ্যটি উপরের-ডান এবং নীচে-বাম কোয়াড্রেন্টগুলিতে সবচেয়ে ইতিবাচক, তবে এটি নীচে-ডান এবং উপরের-বাম কোয়াড্র্যান্টে সবচেয়ে নেতিবাচক। নীল পয়েন্টগুলি লালগুলি বাতিল করে দেওয়ার সাথে সাথে পণ্যগুলির সংমিশ্রণের প্রভাব 0-এ ঘটবে।

তবে আপনি দেখতে পাচ্ছেন যে আমরা যদি রেড পয়েন্টগুলি সরিয়ে ফেলি তবে অবশিষ্ট ডেটা একে অপরের সাথে একটি ইতিবাচক সম্পর্ক প্রদর্শন করে যা পণ্যের ধনাত্মক যোগ (যেমন নীল পয়েন্টের যোগফল) দ্বারা বৈধ হয়।

এখানে চিত্র বর্ণনা লিখুন


0

এলোমেলো ভেরিয়েবলের ভেক্টর স্পেসে দূরত্ব ডট পণ্যের সংজ্ঞা বা এলোমেলো ভেরিয়েবলের সম্পর্ক E এর সাথে E E (xy) ^ 2} দিয়ে দুটি র্যান্ডম ভেরিয়েবল x এবং y এর মধ্যে দূরত্বের বর্গক্ষেত্র নির্ধারণ করা যুক্তিসঙ্গত E xy} যা একরকমের সাধারণকরণের জন্য যা -E {x} এবং -E {y terms পদগুলি ব্যতীত সম্প্রচারের সংজ্ঞার সাথে সমান।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.