এলো রেটিং সিস্টেমটি কেন ভুল আপডেটের নিয়ম ব্যবহার করে?


10

এলো রেটিং সিস্টেমটি জোড় করা তুলনাগুলির ফলাফলের প্রত্যাশিত এবং পর্যবেক্ষণের সম্ভাবনার মধ্যে ক্রস-এনট্রপি ক্ষতি ফাংশনের গ্রেডিয়েন্ট বংশোদ্ভূত মিনিমাইজেশন অ্যালগরিদম ব্যবহার করে। আমরা সাধারণ ক্ষতির কাজগুলি যেমন লিখতে পারি

E=n,ipiLog(qi)

যেখানে যোগফল সমস্ত ফলাফলের উপর সঞ্চালিত হয় এবং সমস্ত বিরোধী । হ'ল ইভেন্ট এবং এর প্রত্যাশিত ফ্রিকোয়েন্সি observedn p i i q iinpiiqi

কেবলমাত্র দুটি সম্ভাব্য ফলাফল (জয় বা আলগা) এবং একটি প্রতিপক্ষের ক্ষেত্রে

E=pLog(q)(1p)Log(1q)

তাহলে প্লেয়ারের র্যাঙ্কিং করা হয় এবং প্লেয়ারের র্যাঙ্কিং হয় আমরা যত প্রত্যাশিত সম্ভাব্যতা নির্মিত পারেন তারপরে গ্রেডিয়েন্ট বংশোদ্ভূত আপডেটের নিয়ম ব্যবহার বলুন i π j j q i = e π iπiiπjj qj=e π j

qi=eπieπi+eπj
qj=eπjeπi+eπj

πi=πiη(qipi)

πj=πjη(qjpj)

যেখানে এবং প্লেয়ারের জয় প্রত্যাশিত এবং পর্যবেক্ষিত সম্ভাব্যতা হয় খেলোয়াড় বিরুদ্ধে । এটি আপডেটের নিয়ম।p i i jqipiijtwo outcomes

অঙ্কনের উপস্থিতিতে আমরা উপরোক্ত মডেলটি সহ সাধারণীকরণ করতে পারি এবং সম্ভাব্যতার সাথে তৃতীয় ফলাফলও পাই

কুইi(ডাব্লু)=πi

q(d)=νeπi+πj2eπi+eπj+νeπi+πj2
কুই(W)=π
qi(w)=eπieπi+eπj+νeπi+πj2
qj(w)=eπjeπi+eπj+νeπi+πj2

এবং আমরা হিসাবে লস ফাংশন তৈরি করতে পারেন

E=p(w)Log(q(w))(1p(w)p(d))Log(q(l))p(d)Log(q(d))

যেখানে যথাক্রমে পর্যবেক্ষিত সম্ভাবনা আছে , এবং এবং প্রত্যাশিত সম্ভাবনা , এবং । পরবর্তী ক্ষেত্রে আপডেটের নিয়ম হবেp(w),p(l),p(d)winloosedrawq(w),q(l),q(d)winloosedraw

πi=πiη(qi(w)+qi(d)2pi(w)pi(d)2)

πj=πjη(qj(w)+qj(d)2pj(w)pj(d)2)

যেখানে এবং খেলোয়াড় প্রত্যাশিত সম্ভাবনা আছে জয় করতে এবং প্লেয়ার বিরুদ্ধে আঁকা । আর যেখানে এবং প্লেয়ারের পর্যবেক্ষিত সম্ভাব্যতা হয় জয় করতে এবং প্লেয়ার বিরুদ্ধে আঁকা । এটি আপডেটের নিয়ম।qj(w)qj(d)ijpi(w)pi(d)ijthree outcome

প্রশ্নটি হল, এলো রেটিং সিস্টেম two outcomesড্রয়ের উপস্থিতিতেও আপডেটের নিয়মগুলি কেন ব্যবহার করবে ?

উত্তর:


3

সিদ্ধান্ত নেওয়ার বিপরীতে অঙ্কনের সম্ভাবনাটি ইলো সিস্টেমে নির্দিষ্ট করা হয়নি । পরিবর্তে একটি ড্র বিবেচনা করা হয় - প্রত্যাশিত পারফরম্যান্সে এবং ম্যাচের ফলাফল উভয়ই - অর্ধেক জয় এবং অর্ধেক পরাজয়।

উইকিপিডিয়ায় এলো পৃষ্ঠা থেকে একটি উদাহরণ : "একজন খেলোয়াড়ের প্রত্যাশিত স্কোর হ'ল তার জয় অঙ্কনের সম্ভাবনা এবং অঙ্কনের সম্ভাবনা অর্ধেক অঙ্কনটি। অন্য চূড়ান্ত দিক থেকে এটি জয়ের 50% সুযোগ, হারার 0% সম্ভাবনা এবং অঙ্কনের 50% সুযোগকে উপস্থাপন করতে পারে।

অঙ্কনটির সম্ভাবনা, যেমনটি আমি বলেছি, তা নির্দিষ্ট করা হয়নি এবং এটি একটি সাধারণ two outcomeআপডেটের নিয়ম, , যাতে , সুতরাং, একক ম্যাচের পরে, (জয়), বা (ড্র, অর্ধ জয় হিসাবে), বা (ক্ষতি)।এস = 1 ( এন ডাব্লু + 0.5 এন ডি ) + 0 ( 0.5 এন ডি + এন এল ) এস = 1 এস = 0.5 এস = 0RA=RA+K(SAEA)SA=1(nw+0.5nd)+0(0.5nd+nl)SA=1SA=0.5SA=0

এলোর মতো, গ্লিকো সিস্টেমটি মডেল আঁকেনি তবে এটি একটি জয়ের গড় এবং হারের (প্রতি খেলোয়াড়ের) গড় হিসাবে আপডেট করে। পরিবর্তে, ট্রুস্কিল র‌্যাঙ্কিং ব্যবস্থায়, "একটি নির্দিষ্ট খেলায় পারফরম্যান্সের পার্থক্য খুব কম বলে ধরে নিয়ে আঁকানো মডেল করা হয় Hence সুতরাং, অঙ্কনের সুযোগটি কেবলমাত্র দুই খেলোয়াড়ের খেলার শক্তির পার্থক্যের উপর নির্ভর করে However তবে, খেলায় গবেষণামূলক অনুসন্ধানগুলি দাবা অনুষ্ঠানের মাধ্যমে দেখা যায় যে পেশাদার খেলোয়াড়দের মধ্যে খেলোয়াড়দের মধ্যে ড্রয়ের সম্ভাবনা খুব কম থাকে Hence তাই, অঙ্কনের সম্ভাবনাও দক্ষতার স্তরের উপর নির্ভর করে বলে মনে হয়।

এই পদ্ধতির প্রতিটি গেমের জন্য আলাদা আলাদা সুনির্দিষ্ট মডেলিং প্রয়োজন (এবং ট্রুস্কিলটি কয়েকটি মাইক্রোসফ্ট এক্সবক্স গেমের জন্য প্রয়োগ করা হয়), সুতরাং এটি ইলো এবং গ্লিকোতে উপযুক্ত (কেবল দাবার জন্য ডিজাইন করা), এবং এটি র‌্যাঙ্কেডের জন্য নয় , আমাদের বহুমুখী র‌্যাঙ্কিং সিস্টেম।


'একজন খেলোয়াড়ের প্রত্যাশিত স্কোর তার জয়ের সম্ভাবনা এবং অঙ্কনের সম্ভাবনার অর্ধেকতা।' আমি ঠিক উপরের সূত্রে খুঁজে পেয়েছি কি। যাইহোক ইলো আপডেট সূত্রে অঙ্কিত হওয়ার সম্ভাবনার অর্ধেকটি নির্দিষ্ট করা হয়নি কারণ আপনি নির্দেশ করছেন। প্রশ্নটি রয়ে গেল, এলো র‌্যাঙ্কিং সিস্টেমে কেন আমরা ড্রয়ের বিষয়ে যত্ন নিই না?
emanuele

1
জয়ের সম্ভাবনা এবং হেরে যাওয়ার সম্ভাবনা হিসাবে আপনি সর্বদা প্রত্যাশিত স্কোর প্রকাশ করতে পারেন (এবং অঙ্কনের শূন্য সম্ভাবনা - উইকিপিডিয়া থেকে প্রথম উদাহরণ দেখুন)। এই ক্ষেত্রে, 'একজন খেলোয়াড়ের প্রত্যাশিত স্কোর হ'ল তার জয়ের সম্ভাবনা' (এবং আরও কিছু, কারণ অঙ্কনের অর্ধেক সম্ভাবনা শূন্য)। একক ম্যাচের পরে ফলাফলটি একটি জয়, বা হেরে যাওয়া বা অর্ধেক জয়। এমনকি আপনার যদি এমন কোনও গেম থাকে যেখানে ড্রয়ের অনুমতি রয়েছে তবে আপনি জয় ও পরাজয়ের মাত্র একটি সংমিশ্রণ ব্যবহার করে ইলো স্কোরটি আপডেট করতে পারেন, যেন ড্রয়ের কোনও সুযোগ নেই।
তোমাসো নেড়ি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.