সপ্তাহের দিনগুলিতে কোনও বিতরণের অভিন্নতা পরিমাপ করুন


11

এখানে জিজ্ঞাসিত প্রশ্নটির সাথে আমারও একই সমস্যা রয়েছে:

কীভাবে কেউ একটি বন্টনের অ-অভিন্নতা পরিমাপ করে?

আমি সপ্তাহের দিনগুলিতে সম্ভাব্যতা বিতরণের একটি সেট রেখেছি। আমি প্রতিটি বিতরণ (1 / 7,1 / 7, ..., 1/7) এর কতটা নিকটবর্তী তা পরিমাপ করতে চাই।

এই মুহুর্তে আমি উপরের প্রশ্নের উত্তরটি ব্যবহার করছি; একটি এল 2-নরম, যখন বিতরণের কোনও এক দিনের জন্য ভর 1 থাকে এবং এর মান 1 হয় (1 / 7,1 / 7, ..., 1/7)। আমি এটিকে রৈখিকভাবে স্কেলিং করছি তাই এটি 0 এবং 1 এর মধ্যে থাকে তবে 0 টি উল্টানো মানে 0 পুরোপুরি অ-ইউনিফর্ম এবং 1 এর অর্থ পুরোপুরি ইউনিফর্ম।

এটি বেশ ভালভাবে কাজ করে, তবে এটির সাথে আমার একটি সমস্যা আছে; এটি প্রতি সপ্তাহের দিনটিকে 7-ডিম স্পেসে মাত্রা হিসাবে সমানভাবে আচরণ করে, তাই এটি দিনের সান্নিধ্যের জন্য অ্যাকাউন্ট করে না; অন্য কথায়, এটি (1 / 2,1 / 2,0,0,0,0,0) এবং (1 / 2,0,0,1 / 2,0,0,0) এমনকি একই স্কোর দেয় যদিও কিছু দিক থেকে উত্তরটি আরও "ছড়িয়ে পড়ে" এবং অভিন্ন, এবং আদর্শভাবে এটি একটি উচ্চতর স্কোর পাওয়া উচিত। স্পষ্টতই যুক্ত হওয়া জটিলতা রয়েছে যে দিনগুলির ক্রমটি বিজ্ঞপ্তিযুক্ত।

কয়েক দিনের কাছাকাছি হওয়ার জন্য আমি কীভাবে এই তাত্পর্যকে পরিবর্তন করতে পারি?


1
আপনার উদাহরণ (1 / 2,1 / 2,0,0,0,0,0) এবং (1 / 2,0,0,1 / 2,0,0,0) একই ভাবে অ-ইউনিফর্ম , সুতরাং যদি আপনি কেবল অ-অভিন্নতার জন্য পরীক্ষা করতে আগ্রহী হন তবে এটি গুরুত্বপূর্ণ নয়। সুতরাং সম্ভবত আপনি আরও কিছু পরীক্ষা করতে চান যা আপনার প্রশ্নে স্পষ্টভাবে বর্ণিত হয়নি? বিটিডব্লিউ, এন্ট্রপি একত্বের পরিমাপ।
টিম

ধন্যবাদ টিম, আমি এন্ট্রপি ব্যবহার করার চেষ্টা করেছি তবে আমি উল্লিখিত উপাসনাবাদী আমার উদ্দেশ্যগুলির জন্য আরও ভালভাবে কাজ করেছে। আমি নিশ্চিত নই যে আমি আগ্রহী সপ্তাহের দিনগুলিতে সম্ভাব্যতা বিতরণের সম্পত্তিটিকে কী বলব, ব্যতীত এটি সপ্তাহে সম্ভাবনার "স্প্রেড আউট-নেস" আবশ্যক।
EBartrum

উত্তর:


15

পৃথিবী প্রস্তাবক দূরত্ব , এছাড়াও Wasserstein মেট্রিক, পরিমাপ দুই histograms মধ্যে দূরত্ব হিসাবে পরিচিত। মূলত, এটি একটি হিস্টোগ্রামকে বিভিন্ন স্তরের ময়লা হিসাবে বিবেচনা করে এবং তারপরে মূল্যায়ন করে যে একজনকে কতটা ময়লা চলাচল করতে হবে এবং এই হিস্টোগ্রামকে অন্যটিতে রূপান্তর করতে কতদূর (!) করা যেতে পারে। আপনি সপ্তাহের দিনগুলিতে আপনার বিতরণ এবং অভিন্নের মধ্যে দূরত্ব পরিমাপ করবেন।

এটি অবশ্যই দিনের সান্নিধ্যের জন্য অ্যাকাউন্ট করে - সোমবার থেকে বৃহস্পতিবারের তুলনায় সোমবার থেকে মঙ্গলবার থেকে "ময়লা" সরানো আরও সহজ, সুতরাং (1 / 2,0,0,1 / 2,0,0,0) এর একটি থাকবে সোমো ও মঙ্গলবার ঘনীভূত কোনও হিস্টোগ্রামের তুলনায় ইউনিফর্ম বিতরণ থেকে পৃথিবীর মুভরের দূরত্ব কম করুন।

এটি যা করে না তা হ'ল "বিজ্ঞপ্তি" হিসাবে বিবেচনা করা, অর্থাৎ শনি ও রবিবার যতটা কাছাকাছি রবিবার এবং সোমবারের সাথে একত্রে রয়েছে। তার জন্য, আপনাকে বিজ্ঞপ্তিযুক্ত সম্ভাবনা ভর বিতরণে সংজ্ঞায়িত আর্থ মুভার দূরত্বের সন্ধান করতে হবে । এটি একটি উপযুক্ত অপ্টিমাইজেশন পদ্ধতির সাহায্যে করণীয় হওয়া উচিত।


সম্পাদনা: আর-তে, emdপ্যাকেজটি হিস্টোগ্রামগুলির মধ্যে আর্থ মুভার দূরত্ব গণনা করে।

আপনি "বৃত্তাকারতা" সমস্যাটি মোটামুটি সহজ (যদিও অ্যাড-হক) উপায়ে সম্বোধন করতে পারেন।

  • d1
  • d2
  • d3
  • ...
  • d1,,d7

এটি বেশ কয়েকটি অতিরিক্ত গণনা ব্যয় করে বিজ্ঞপ্তিটির যত্ন নেয়।

di

যাইহোক, আমি কমপক্ষে কোনও উপায়ে বিজ্ঞপ্তি বিবেচনা করার জন্য এটি একটি সম্ভাব্য উপকারী উপায় বিবেচনা করব - রবিবার থেকে শনিবার বা অন্য কোনও নির্বিচারে পদ্ধতিতে সপ্তাহের সংজ্ঞা দেওয়ার চেয়ে সপ্তাহে সংজ্ঞায়নের চেয়ে অবশ্যই ভাল better প্লাস, উপরের কিছু লিঙ্কগুলি বিজ্ঞপ্তিযুক্ত পৃথিবী মুভার দূরত্বের জন্য বাস্তবায়ন ঘটাচ্ছে, আমি আর এর জন্য একটির বিষয়ে অবগত নই, সম্ভবত এটি সম্ভবত এখানে সর্বাধিক ব্যবহৃত ভাষা।


3
d1,,d7di

@ জাইক: ভালো পয়েন্ট এবং আমি গতকাল সংযোগটি হারিয়ে যাওয়ার পরে আমার কাছে এটি ঘটেছে one আমি জবাব দেওয়ার জন্য আমার উত্তরটি পরিষ্কার করে দিয়েছিলাম যে এটি হ্যাক এবং বাস্তব বৃত্তাকার পৃথিবী মুভার দূরত্ব নয়।
স্টিফান কোলাছা

1
অনেক ধন্যবাদ, আসলে আমি আমার নিজের দূরত্বের ফাংশনটি সংজ্ঞায়নের মাধ্যমে এমডি প্যাকেজ এবং এমডি 2 ডি ফাংশন দিয়ে আর একটি বৃত্তাকার আর্থ মুভার দূরত্বটি বাস্তবায়িত করার ব্যবস্থা করেছি, সুতরাং আপনি যে হ্যাকটি উল্লেখ করেছেন তা ব্যবহার করার দরকার নেই। আমি ঠিক এটিই খুঁজছিলাম! আরেকটি তুচ্ছ বিষয়: আমি এটাকে কী বলব? টিম উপরে যেমন বলেছে, আমার এই ইউনিফর্মটি বলা উচিত নয়। এই হিউরিস্টিকের উপযুক্ত নাম কী হবে?
ইবার্ট্রাম

1
L2
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.