এর সাবসেটগুলিতে বিতরণ


9

যদি সেখানে পূর্ণসংখ্যার সাব-সেট নির্বাচন উপর মান ডিস্ট্রিবিউশন কোন প্রকারের হয় আমি ভাবছি করছি । সমানভাবে, আমরা বাইনারি ফলাফলগুলির দৈর্ঘ্যের ভেক্টরের একটি বিতরণ হিসাবে এটি প্রকাশ করতে পারি , উদাহরণস্বরূপ যদি তবে the ভেক্টরের সাথে মিল রয়েছে ।{1,2,...,J}JJ=5{1,3,5}(1,0,1,0,1)

মূলত কি আমি খুঁজছি কিছু বন্টন হয় , একটি পরিবার একটি নির্দিষ্ট মাত্রিক পরামিতি দ্বারা সূচীবদ্ধ থেকে আসছে , যে যেমন একটি উপায় দুই বাইনারি ভেক্টর তার ভর বিতরণ করবে এবং অনুরূপ থাকবে যদি তারা একসাথে "কাছাকাছি" থাকে, তবে এবং একই সম্ভাবনা থাকে similar সত্যিই, আমি আশা করছি না লক্ষ্য রাখি কি, রাখা হয় একটি পূর্বে যেমন যে যদি আমি জানি মোটামুটি বড় তাহলে সম্ভবত ভেক্টর বড় আপেক্ষিক কাছ থেকে অনেক দূরে হয় ।νθ()θr1r2r1=(0,0,1,0,1)r2=(0,0,1,1,1)θνθ(r1)νθ(r2)r1

একটি কৌশলে যে মনে আসে একটি মেট্রিক অথবা বিচ্ছুরণ কিছু অন্যান্য পরিমাপ করা হবে উপর এবং তারপর নিতে , বা অনুরূপ কিছু। একটি সুস্পষ্ট উদাহরণ distribution the সাধারণ বিতরণের সাথে উপমা। এটি ঠিক আছে, তবে আমি আশা করছি যে বায়সীয় বিশ্লেষণে মানক এবং অনুকূল কিছু আছে; এটি দিয়ে আমি স্বাভাবিককরণের ধ্রুবকটি লিখতে পারি না।dθ{0,1}Jνθ(r)exp(dθ(r,μ))exp{rμ2/(2σ2)}


একটি সাবসেট নমুনা জরিপ পদ্ধতিতে একটি প্রাথমিক সমস্যা।
স্টাফেন লরেন্ট

@ স্টাফেন নিশ্চিত, তবে আমার সমস্যাটি থেকে আমার আলাদা কিছু পছন্দসই কাঠামো রয়েছে যা আমার বিতরণটি প্রতিফলিত করতে চাইবে বলে মনে করি তার চেয়ে আলাদা। আমার কাছে দূরত্বের অস্পষ্ট ধারণাটি আমার জন্য কাজ করার কারণে সম্ভবত সাবসেটগুলির ক্ষেত্রে প্রশ্নটি বানানো একটি খারাপ ধারণা ছিল।
লোক

আপনার লেখার অর্থ কি "... তারপরে সম্ভবত ছোট ..."? যতদূর স্বাভাবিককরণের ধ্রুবকটি চলে যায়, মেট্রিকের জন্য হামিং দূরত্বটি ব্যবহার করার কথা বিবেচনা করুন : বিতরণের লোকেশন-স্কেল পরিবারগুলির জন্য, আপনি এই ধ্রুবকে কেবল পদগুলির যোগফল হিসাবে গণনা করতে পারেন । তদুপরি, এই জাতীয় সমস্ত পরিবার যা আপনার মানদণ্ডগুলি পূরণ করে কেবল ডি ডিস্রিট প্যারামিটার (অবস্থানের জন্য) এবং অবিচ্ছিন্ন পরামিতি দ্বারা বর্ণিত হতে পারে । vθ(r2)J+1JJ
শুক্রবার

@ যেহেতু না, আমি বোঝাতে চেয়েছি আমি চাই একসাথে থাকা পয়েন্টগুলির চারপাশে বিতরণ করতে। কোনও হাইপারকিউবের উল্লম্ব অংশে বিতরণ স্থাপন হিসাবে এই প্রশ্নের বাক্যটি উচ্চারণ করা সম্ভবত সম্ভবত আরও বেশি হত। আমি দূরত্ব বিবেচনা করেছি (যা আমার অনুমান হিসাবে আমার ক্ষেত্রে এর সমান ); আমি সম্ভবত এটি, এবং আমার ধারণা, এ জাতীয় বিতরণ থেকে নমুনা নেওয়ার জন্য সম্ভবত কিছু এমসিএমসি করতে হবে। νθ()L1|riμiσi|
লোক

ওহ, আমি এখন দেখতে। তবে আপনি মূলত যা বলেছিলেন তা নয়। উদাহরণস্বরূপ, আপনার বৈশিষ্ট্য অনুসারে, যদি বড় হয়, এবং থেকে "অনেক দূরে" ভেক্টরগুলির সেট হয় , এবং কোনও ভেক্টর তবে অবশ্যই "সম্ভবত" বড় হতে তবে "খুব বেশি দূরে নয়" এবং "ক্লোজ" অর্থ হুবহু একই জিনিস নয়। আপনি নিজের মন্তব্যে যেমনটি করেছিলেন তেমন শর্তটি পুনঃব্যবহার করা সহজ - এবং আরও অভ্যন্তরীণভাবে সামঞ্জস্যপূর্ণ। তবে না, হামিং দূরত্বের উপর ভিত্তি করে লোকেশন-স্কেল বিতরণগুলি থেকে নমুনা নেওয়ার জন্য আপনার MCMC দরকার নেই: আরও অনেক কার্যকর উপায় রয়েছে। ν(r1)Rr1r2Rν(r2)
হোবার

উত্তর:


6

আপনি হ্যামিং দূরত্বের উপর ভিত্তি করে অবস্থানের পরিবারগুলির পক্ষে তাদের nessশ্বর্য, নমনীয়তা এবং গণনামূলক ট্র্যাকটেবিলিটির পক্ষে পক্ষে থাকতে পারেন


স্বরলিপি এবং সংজ্ঞা

স্মরণ করুন যে ভিত্তিতে সহ একটি নিখরচায় সীমাবদ্ধ মডিউল , দুটি ভেক্টরের মধ্যে হামিং দূরত্ব এবং হয় যেখানে সংখ্যা ।V(e1,e2,,eJ) δHv=v1e1++vJeJw=w1e1++wJeJiviwi

কোনও উত্স , হামিং দূরত্বের পার্টিশন কে গোলক , , যেখানে । যখন মাটিতে রিং আছে উপাদান, হয়েছে উপাদান এবং হয়েছে উপাদান। (এটি উপাদানগুলি ঠিক জায়গাগুলিতে from এর থেকে পৃথক হয়ে পর্যবেক্ষণ করার সাথে সাথে অনুসরণ করে - যার মধ্যে are রয়েছেv0VVSi(v0)i=0,1,,JSi(v0)={wV | δH(w,v0)=i}nVnJSi(v)(Ji)(n1)iSi(v)vi(Ji)সম্ভাবনা - এবং স্বতন্ত্রভাবে, প্রতিটি জায়গার জন্য মানগুলির পছন্দ রয়েছে)n1

তে সংযুক্ত অনুবাদ লোকেশন পরিবারগুলিকে দেওয়ার জন্য বিতরণে স্বাভাবিকভাবে কাজ করে। বিশেষ করে, যখন কোন বন্টন হয় (যার মানে সামান্য বেশি , সবার জন্য , এবং ) এবং কোন উপাদান , তারপর একটি বিতরণ হয় কোথায়VfVf:V[0,1]f(v)0vVvVf(v)=1wVf(w)

f(w)(v)=f(vw)

সমস্ত for এর জন্য । একটি অবস্থান পরিবার utions বিতরণের এই ক্রিয়াকলাপের অধীনে অবিচ্ছিন্ন: সমস্ত জন্য বোঝায় ।vV ΩfΩf(v)ΩvV

নির্মাণ

এটি আমাদের বিতরণের সম্ভাব্য আকর্ষণীয় এবং দরকারী পরিবারগুলির একটি নির্দিষ্ট ভেক্টর at এ তাদের আকার নির্দিষ্ট করে সংজ্ঞা দিতে সক্ষম করে , যা সুবিধার জন্য আমি আর এই "উৎপাদিত ডিস্ট্রিবিউশন" এর কর্ম অধীনে অনুবাদ সপরিবারে প্রাপ্ত । পছন্দসই সম্পত্তি অর্জনের জন্য নিকটস্থ পয়েন্টগুলিতে তুলনামূলক মান থাকতে হবে, কেবলমাত্র সমস্ত উত্পাদক বিতরণের সেই সম্পত্তি প্রয়োজন।v0=(0,0,,0)VΩf

এটি কীভাবে কাজ করে তা দেখতে, আসুন ক্রমবর্ধমান দূরত্বের সাথে হ্রাস হওয়া সমস্ত বিতরণের লোকেশন পরিবারটি তৈরি করুন। কারণ শুধুমাত্র Hamming দূরত্বের সম্ভব, অ নেতিবাচক বাস্তব সংখ্যার কোনো কমে ক্রম বিবেচনা = । সেটJ+1a0a0a1aJ0

A=i=0J(n1)i(Ji)ai

এবং দ্বারা ফাংশনটি সংজ্ঞায়িত করুনfa:V[0,1]

fa(v)=aδH(0,v)A.

তারপরে, যাচাই করা সহজবোধ্য হিসাবে, উপর বিতরণ । তদ্ব্যতীত, যদি এবং কেবল যদি of (ভেক্টর হিসাবে ।)। সুতরাং, আমরা যদি পছন্দ করি তবে আমরা কে করতে ।faVfa=faaaRJ+1aa0=1

তদনুসারে, এই নির্মাণটি হ্যামিং দূরত্বের সাথে হ্রাস পাচ্ছে এমন সমস্ত অবস্থান-আক্রমণকারী বিতরণগুলির একটি সুস্পষ্ট প্যারামিটারাইজেশন দেয়: এ জাতীয় কোনও বিতরণ আকারে কিছু ক্রমের জন্য রয়েছে এবং কিছু ভেক্টর ।fa(v)a=1a1a2aJ0vV

এই একখান গতকাল দেশের সর্বোচ্চ তাপমাত্রা এর সুবিধাজনক স্পেসিফিকেশন জন্য অনুমতি দিতে পারে: তাদের অবস্থানের উপর একটি পূর্বে মধ্যে ফ্যাক্টর এবং আকৃতি উপর একটি পূর্বে । (অবশ্যই কেউ কেউ বৃহত্তর প্রিয়ার বিবেচনা করতে পারে যেখানে অবস্থান এবং আকৃতি এবং স্বতন্ত্র নয়, তবে এটি আরও জটিল উদ্যোগ গ্রহণ করবে))va

এলোমেলো মান উত্পন্ন হচ্ছে

from থেকে নমুনা নেওয়ার একটি উপায় পর্যায়ক্রমে একে গোলকের রেডির উপর একটি বিতরণ এবং প্রতিটি ক্ষেত্রের শর্তসাপেক্ষে অন্য একটি বিতরণ হিসাবে চিহ্নিত করা হয়:fa(v)

  1. একটি সূচক আঁকুন উপর বিযুক্ত বন্টন থেকে সম্ভাব্যতা কর্তৃক প্রদত্ত , যেখানে সামনে হিসাবে সংজ্ঞায়িত করা হয় ।i{0,1,,J}(Ji)(n1)iai/AA

  2. সূচক থেকে ভিন্ন ভেক্টর সেট অনুরূপ ঠিক মধ্যে স্থান। অতএব, প্রত্যেকটি সমান সম্ভাবনা প্রদান করে, সম্ভাব্য সাবসেটের বাইরে স্থানগুলি তা নির্বাচন করুন । (এই মাত্র একটি নমুনা হল বাইরে সাবস্ক্রিপ্টগুলোর ছাড়া প্রতিস্থাপন।) এর এই উপসেট যাক স্থান লেখা যেতে ।ivii(Ji)iJ iI

  3. সমস্ত জন্য সমান নয় সেট থেকে স্বতন্ত্রভাবে একটি মান নির্বাচন করে একটি উপাদান আঁকুন এবং অন্যথায় সেট করুন । সমানভাবে, যখন when এবং অন্যথায় সেট করে ননজারো থেকে এলোমেলোভাবে নির্বাচন করে একটি ভেক্টর create তৈরি করুন । সেট ।wwjvjjIwj=vjuujjIuj=0w=v+u

বাইনারি ক্ষেত্রে পদক্ষেপ 3 অপ্রয়োজনীয়।


উদাহরণ

Rচিত্রিত করার জন্য এখানে একটি বাস্তবায়ন দেওয়া হল ।

rHamming <- function(N=1, a=c(1,1,1), n=2, origin) {
  # Draw N random values from the distribution f_a^v where the ground ring
  # is {0,1,...,n-1} mod n and the vector space has dimension j = length(a)-1.
  j <- length(a) - 1
  if(missing(origin)) origin <- rep(0, j)

  # Draw radii `i` from the marginal distribution of the spherical radii.
  f <- sapply(0:j, function(i) (n-1)^i * choose(j,i) * a[i+1])
  i <- sample(0:j, N, replace=TRUE, prob=f)

  # Helper function: select nonzero elements of 1:(n-1) in exactly i places.
  h <- function(i) {
    x <- c(sample(1:(n-1), i, replace=TRUE), rep(0, j-i))
    sample(x, j, replace=FALSE)
  }

  # Draw elements from the conditional distribution over the spheres
  # and translate them by the origin.
  (sapply(i, h) + origin) %% n
}

এর ব্যবহারের উদাহরণ হিসাবে:

test <- rHamming(10^4, 2^(11:1), origin=rep(1,10))
hist(apply(test, 2, function(x) sum(x != 0)))

যেখানে , (বাইনারি কেস), বিতরণ থেকে আইআইডি উপাদানগুলি আঁকতে এটি সেকেন্ড সময় নিয়েছে , এবং তাত্পর্যপূর্ণভাবে হ্রাস পাচ্ছে।0.2104fa(v)J=10n=2v=(1,1,,1)a=(211,210,,21)

(এই অ্যালগরিদমটির প্রয়োজন নেই যে হ্রাস পাচ্ছে; সুতরাং এটি কেবল অ ইউনিমডাল নয়, কোনও অবস্থানের পরিবার থেকে এলোমেলো পরিবর্তন আনবে ))a


এর জন্য ধন্যবাদ! এই ক্ষেত্রে হামিং দূরত্ব কেবল মধ্যে সীমাবদ্ধ কেবলমাত্র L_1; সেই প্রসঙ্গে, হামিং দূরত্বটি আইসোট্রপিকভাবে অভিনয় করছে। এ থেকে দূরে সরে যাওয়া আমার ধারণা এই বিষয়গুলিকে আরও জটিল করে তোলে কারণ আমার দূরত্ব পরিমাপের জন্য আমার কাছে চেয়েও বেশি মূল্য আছে? এ সম্পর্কে কোন সাধারণ মন্তব্য? L1RJJ
লোক

হ্যাঁ: দূরত্বের ক্রিয়াকলাপগুলির একটি পছন্দ in এর মানগুলি উপস্থাপন করে তার উপর নির্ভর করবে । যেহেতু প্রশ্নটি বিমূর্তভাবে তৈরি করা হয়েছে, কী কী ভাল পছন্দ হবে তা সম্পর্কে আমাদের মতামত গঠনের পক্ষে আমাদের কিছুই করার নেই। Hamming দূরত্ব জন্য উপযুক্ত হবে নামমাত্র ও মূল্যবোধ সম্ভবত অন্যান্য ক্ষেত্রে, খুব, কিন্তু অন্যান্য দূরত্বের ভাল কাজ করতে পারে যখন সেট দূরত্ব একটি সহজাত জ্ঞান । বাইনারি ক্ষেত্রে , হামিং দূরত্বকে সাধারণীকরণ করা শক্ত: তারা ইতিমধ্যে সাধারণ। {1,2,,n}{1,2,,n}n=2
whuber

1

কে-ডিস্ট্যান্টাল পয়েন্ট প্রক্রিয়া থেকে প্রাপ্ত একটি নমুনা উপজাতগুলির উপর এমন একটি বিতরণকে মডেল করে যা বৈচিত্রকে উত্সাহ দেয়, যেমন অনুরূপ আইটেমগুলিতে নমুনায় একসাথে হওয়ার সম্ভাবনা কম থাকে। অ্যালেক্স কলেসা, বেন তাস্কার দ্বারা কে-ডিস্ট্যান্টাল পয়েন্ট প্রক্রিয়া নমুনা দেখুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.