চি-স্কয়ার দূরত্ব ব্যবহার করে দুটি হিস্টোগ্রামের তুলনা করা


18

আমি দুটি মুখের চিত্র তুলনা করতে চাই। আমি তাদের এলবিপি-হিস্টোগ্রাম গণনা করেছি। সুতরাং এখন আমাকে এই দুটি হিস্টোগ্রামের তুলনা করতে হবে এবং এমন কিছু পাওয়া দরকার যা এই হিস্টোগ্রামগুলি কতটা সমান হবে তা বলবে (0 - 100%)।

এই কাজটি সমাধান করার অনেকগুলি উপায় রয়েছে তবে এলবিপি পদ্ধতির লেখকরা জোর দিয়েছিলেন (স্থানীয় বাইনারি প্যাটার্নগুলির সাথে মুখের বিবরণ: স্বীকৃতির মুখোমুখি।

লেখকরা চি-স্কয়ার দূরত্বের একটি সূত্রও দেখান:

i=1n(xiyi)2(xi+yi)

যেখানে অনেকগুলি বিন রয়েছে, হ'ল প্রথম মান , দ্বিতীয় মান।x i y inxiyi

কিছু গবেষণায় (উদাহরণস্বরূপ চতুষ্কোণ-চিস্টিক হিস্টگرام দূরত্ব পরিবার) আমি দেখেছি যে চি-স্কয়ার দূরত্বের সূত্রটি হ'ল:

12i=1n(xiyi)2(xi+yi)

এবং সেখানে http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm আমি দেখছি চি-স্কয়ার দূরত্বের সূত্রটি হ'ল:

i=1n(xiyi)2yi

আমি এটি আটকে। আমার বেশ কয়েকটি প্রশ্ন রয়েছে:

  1. আমার কোন অভিব্যক্তি ব্যবহার করা উচিত?
  2. পার্থক্যের ফলাফলটিকে আমি কীভাবে ব্যাখ্যা করব? আমি জানি যে পার্থক্যটি 0 এর সমান অর্থ হ'ল উভয় হিস্টোগ্রাম সমান, তবে উভয় হিস্টোগ্রাম সম্পূর্ণ পৃথক হলে আমি কীভাবে জানতে পারি? এর জন্য কি আমাকে চি-স্কোয়ার টেবিল ব্যবহার করা দরকার? বা আমার কি একটি থ্রেশোল্ড ব্যবহার করা দরকার? মূলত আমি পার্সেন্টে পার্থক্য মানচিত্র করতে চাই।
  3. এই তিনটি ভাবটি আলাদা কেন?

Yi কি একাদশের মতো একই বিনের মান নয় বরং তুলনামূলক বিতরণে দ্বিতীয় বিনের চেয়ে?
নবীনবরণ

উত্তর:


7

@ সিলভারফিশ পোলাতলেমেদারের উত্তরটির সম্প্রসারণের জন্য বলেছিলেন, যা দেওয়া হয়নি, তাই আমি এখানে এটিকে প্রসারিত করার চেষ্টা করব।

নাম চিসকোয়ার দূরত্ব কেন? কন্টিনজেন্সি টেবিলগুলির জন্য চিস্কোয়ার পরীক্ষাটি χ 2 = কোষের ( O i - E i ) 2 এর উপর ভিত্তি করে তাই ধারণাটি এই ফর্মটি রাখা এবং এটি দূরত্ব পরিমাপ হিসাবে ব্যবহার করা। এই ওপি তৃতীয় সূত্র দেয়, সঙ্গেএক্সআমিপর্যবেক্ষণ হিসেবে ব্যাখ্যা এবংYআমিপ্রত্যাশা, যা PolatAlemdar এর মন্তব্য "এটা বিযুক্ত সম্ভাব্যতা ডিস্ট্রিবিউশন ব্যবহার করা হয়" ব্যাখ্যা, উপযুক্ত পরীক্ষার ধার্মিকতা মধ্যে উদাহরণস্বরূপ হিসেবে। এই তৃতীয় ফর্মনাএকটি দূরত্ব ফাংশন, যেমন সামঁজস্যহীন হয় ভেরিয়েবলxএবংY। হিস্টোগ্রাম তুলনা জন্য, আমরা একটি দূরত্ব ফাংশন যা প্রতিসম হয় চানএক্সএবংওয়াইএবং দুটি প্রথম ফর্ম এই দেব। তাদের মধ্যে পার্থক্য কেবল একটি ধ্রুবক ফ্যাক্টর1

χ2=cells(OiEi)2Ei
xiyixyxy , যা অবধি গুরুত্বহীন যতক্ষণ না আপনি কেবল নিয়মিতভাবে একটি ফর্ম চয়ন করেন (যদিও অতিরিক্ত ফ্যাক্টর1সহ সংস্করণটি12অসমমিতিক ফর্মের সাথে তুলনা করতে চাইলে 2 আরও ভাল। এই সূত্রগুলিতে স্কোয়ারড ইউক্লিডিয়ান দূরত্বের সাথে মিলটি নোট করুন, এটি কাকতালীয় নয়, চিস্কোয়ার দূরত্ব এক ধরণেরওজনযুক্তইউক্যালিডিয়ান দূরত্ব। যে কারণে, ওপিতে থাকা সূত্রগুলি সাধারণতদূরত্বপেতে একটি মূল চিহ্নের নিচে রাখা হয়। নিম্নলিখিত আমরা এটি অনুসরণ।12

চিস্কোয়ার দূরত্ব চিঠিপত্র বিশ্লেষণেও ব্যবহৃত হয়। সেখানে ব্যবহৃত ফর্ম সাথে সম্পর্ক দেখতে, দিন সঙ্গে একটি অন্যসাপেক্ষ টেবিলের কোষ হতে আর সারি এবং সি কলাম। সারির মোট সংখ্যা x + j = i x i j এবং কলামের योगটি x i + = j x i j দ্বারা চিহ্নিত করুন । সারি মধ্যে chisquare দূরত্ব , দেওয়া হয় χ 2 ( , ) =xijRCx+j=ixijxi+=jxijl,k মাত্র দুটি সারি (দুটি হিস্টোগ্রাম) নিয়ে কেস করার জন্য এগুলি ওপি'র প্রথম সূত্রটি পুনরুদ্ধার করে (মূল চিহ্নটি মডিউল করে)।

χ2(l,k)=j1x+j(xljxl+xkjxk+)2
EDIT

নীচের মন্তব্যে প্রশ্নের জবাবে: মাইক্রো গ্রাণাক্রে (চ্যাপম্যান অ্যান্ড হল) "চিরাচরিত দূরত্বের দীর্ঘ আলোচনার একটি বই" অনুচ্ছেদে বিশ্লেষণের (দ্বিতীয় সংস্করণ) "। এটি একটি সুপ্রতিষ্ঠিত নাম, যা ক্রিস্চেন্সি টেবিলগুলির সাথে ব্যবহার হিসাবে চিস্কুয়ারের সাথে তার সাদৃশ্য থেকে আসে। এটা কি বিতরণ আছে? আমি এটি অধ্যয়ন কখনও করি নি, তবে সম্ভবত (কিছু অবস্থার অধীনে ...) এটিতে প্রায় কিছু পরিমাণে বাচ্চাদের বিতরণ হবে। অবিশ্বাস্য সারণীগুলির সাথে যা করা হয় তার প্রমাণগুলি একই রকম হওয়া উচিত, চিঠিপত্র বিশ্লেষণ সম্পর্কে বেশিরভাগ সাহিত্য বিতরণ তত্ত্বে যায় না। এমন কিছু কাগজ রয়েছে যা সম্ভবত প্রাসঙ্গিক এ জাতীয় তত্ত্বটি হ'ল http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0101-74382016000100023 । এছাড়াও দেখুন/stats//search?q=%22chisquare+distance%22 এই সাইটে আরও কিছু প্রাসঙ্গিক পোস্টের জন্য।


আমি জিজ্ঞাসা করতে পারি কেন আপনার শেষ সমীকরণটিকে চিস্কোয়ার দূরত্ব বলা হয়? এটি যেমন বিতরণ করা হয়? আপনি কি অনুগ্রহ করতে পারেন, বা একটি লিঙ্ক? আমি একটি খুঁজে পেতে পারে না।
লেস্টস্কোয়ারস ওয়ান্ডার

1
আমার সম্পাদনাগুলি উপরে দেখুন।
কেজেটিল বি হালওয়ারসেন

3

আমি এই লিঙ্কটি বেশ কার্যকর হিসাবে পেয়েছি: http://docs.opencv.org/2.4/doc/tutorials/imgproc/histograms/histogram_compistance/histogram_compistance.html

আমি কেন নিশ্চিত তা নিশ্চিত নই, তবে ওপেনসিভি চি-স্কোয়ার হিস্টোগ্রাম তুলনার জন্য আপনার তালিকার তৃতীয় সূত্রটি ব্যবহার করে।

অর্থের দিক দিয়ে, আমি নিশ্চিত নই যে কোনও পরিমাপের অ্যালগরিদম আপনাকে 0% থেকে 100% এর মতো একটি সীমাবদ্ধ পরিসর দিতে চলেছে। অন্য কথায়, আপনি নিশ্চিতভাবে বলতে পারেন যে দুটি চিত্র একই: তবে দুটি চিত্রের চেয়ে কতটা আলাদা তার সীমা নির্ধারণ করা শক্ত: একটি সম্পূর্ণ সাদা চিত্র বনাম সম্পূর্ণ সাদা চিত্রের সাথে তুলনা করুন, সংখ্যার মানটি হবে ইনফিনিটি বা সম্ভবত নন-এ-সংখ্যা।


2

এক্সY

অন্য দুটি হিস্টোগ্রামের মিলগুলি গণনা করতে ব্যবহৃত হয়।


1
$x$এক্স

2
এক্সY

0

যেমন ওপি অনুরোধ করেছে, শতাংশের মান (সমীকরণ 1 এর জন্য):

পি=χ*এস*100এন

পিχএনএস

অনুরোধ হিসাবে সম্পূর্ণ হয়েছে:

এই সমীকরণটি গণনা করাতে একটি সম্পূর্ণ হিস্টোগ্রাম থেকে পার্থক্যের শতাংশ থাকতে পারে। উভয় হিস্টোগ্রামের জন্য এটি গণনা করা এবং তারপরে একে অপরের থেকে বিয়োগ করা, শতাংশের পার্থক্য থাকতে পারে।


2
এটি যে কোনও প্রশ্নের উত্তর কীভাবে তা দেখতে আমার বেশ কষ্ট হয়েছে। তুমি কি বিস্তারিত বলতে পারো?
ল্যাকোনিক

এটি দেবে (অনুরোধ হিসাবে শতাংশে) একটি সম্পূর্ণ হিস্টোগ্রাম থেকে পৃথক একটি হিস্টোগ্রাম কীভাবে তা দেয়। আপনি যদি উভয় হিস্টোগ্রাম থেকে এই সমীকরণটি গণনা করেন তবে আমরা একে অন্যের মধ্যে পার্থক্যটি জানতে পারব কারণ এটি ত্রিকোণের জন্য ব্যবহৃত হয়েছিল।
কার্লোস বারসেলোস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.