লজিস্টিক রিগ্রেশন এবং ডেটাসেট স্ট্রাকচার


17

আমি আশা করছি যে আমি এই প্রশ্নটি সঠিকভাবে জিজ্ঞাসা করতে পারি। আমার প্লে-বাই-প্লে ডেটাতে অ্যাক্সেস রয়েছে, সুতরাং এটি সর্বোত্তম পদ্ধতির এবং ডেটা সঠিকভাবে তৈরির সাথে সম্পর্কিত একটি সমস্যা।

আমি যা করতে চাই তা হ'ল নিয়মকানুনে স্কোর এবং সময় বাকি রেখে কোনও এনএইচএল গেম জয়ের সম্ভাবনা গণনা করা। আমি অনুমান করি যে আমি একটি লজিস্টিক রিগ্রেশন ব্যবহার করতে পারি, তবে ডেটাসেটটি কেমন হওয়া উচিত তা আমি নিশ্চিত নই। আমি প্রতি খেলায় একাধিক পর্যবেক্ষণ এবং সময় প্রতি টুকরো আগ্রহী? আমি কি প্রতি খেলায় প্রতি পর্যবেক্ষণ করতে পারি এবং প্রতি স্লাইস পৃথক মডেলগুলি ফিট করতে পারি? লজিজিটিক রিগ্রেশন কি এমনকি সঠিক পথে যেতে পারে?

আপনি যে কোনও সহায়তা সরবরাহ করতে পারেন তা খুব প্রশংসা হবে!

শুভেচ্ছান্তে.


কঠিন প্রশ্ন! : আমার অনুমান এটি আরো জানতে চেয়ে আমি কাউন্টিং প্রসেস সম্পর্কে কি (এবং অধিক উইকিপিডিয়া করে সাহায্য করবে en.wikipedia.org/wiki/Counting_process )
onestop

আপনার কি এএসএ জার্নাল চান্স অ্যাক্সেস আছে? আমার কাছে মনে হয় গত বছর বা তার আগে হকি বা অন্য কোনও খেলা সম্পর্কে একটি প্রাসঙ্গিক নিবন্ধ উপস্থিত হয়েছিল।
রোল্যান্ডো

আমি সমস্যাটি সংশোধন করার চেষ্টা করি (আলোচনায় উদ্দীপিত করার জন্য?): আসুন আমরা বলি যে আমাদের একটি গেমের (যেমন টিক-ট্যাক-টো) আলাদা আলাদা রাষ্ট্র রয়েছে। ফলাফলটি পূর্বাভাস দেওয়ার জন্য এখন প্রতি রাজ্যে একটি মডেল তৈরি করা যুক্তিসঙ্গত (সম্ভবত লজিস্টিক রিগ্রেশন ব্যবহার করে)। এখন আমাদের এখানে একটি গেম রয়েছে তবে অবিচ্ছিন্ন রাজ্যগুলির সাথে (অর্থাত গেমের সময়)। ওপি-র এখন প্রশ্নটি হল: কীভাবে ক) সীমাবদ্ধ সেট স্টেটগুলিতে সময়কে বিচক্ষণ করে বা খ) বর্তমান গেম-টাইমের উপর নির্ভর করে (!) যার পরামিতিগুলির পরিবর্তিত কোনও মডেল কীভাবে তৈরি করা যায়? এমন একজন অবশ্যই আছে যিনি ইতিমধ্যে এই "জেনারেল" সমস্যাটি সমাধান করেছেন।
স্টেফেন

উত্তর:


9

"প্লে টাইম" এবং "গোল (হোম দল) - গোল (দল থেকে দূরে)" সহ একটি লজিস্টিক রিগ্রেশন করুন। আপনার এই শর্তগুলির একটি ইন্টারঅ্যাকশন ইফেক্টের প্রয়োজন হবে যেহেতু অর্ধবার সময়ে 2 গোলের সীসা কেবলমাত্র 1 মিনিট বাকি রেখে 2 গোলের লিডের চেয়ে অনেক ছোট প্রভাব ফেলবে। আপনার প্রতিক্রিয়া হ'ল "বিজয় (হোম দল)"।

যেমন আর আপনি ব্যবহার করতে পারে - শুধু এই জন্য রৈখিকতা ধরে নিই না, "গোল (দূরে টিম) গোলস (স্বাগতিক দলকে)" প্রভাব জন্য সহজে নানারকম সহগ মডেল মাপসই mgcvএর gamমত একটি মডেল সূত্র সঙ্গে ফাংশন win_home ~ s(time_remaining, by=lead_home)lead_homeএকটি ফ্যাক্টর তৈরি করুন , যাতে আপনি time_remainingপ্রতিটি মানের জন্য আলাদা প্রভাব পান lead_home

আমি প্রতি খেলায় একাধিক পর্যবেক্ষণ তৈরি করব, আপনার আগ্রহী প্রতিটি সময়ের জন্য একটি।


গ্রেট! সাহায্যের জন্য ধন্যবাদ. আমি আর ব্যবহার করতে যাচ্ছিলাম, এবং আপনার পরামর্শ মত, মিথস্ক্রিয়া প্রতিক্রিয়া এবং সমস্ত মত ডেটা সেটআপ করতে যাচ্ছি। আমি সঠিক পথে ছিলাম দেখে খুশী হয়েছি এবং আমি আপনার সময়টিকে সত্যই প্রকাশ করি।
বিটিবার্ট

1
একাধিক সময়-স্লাইস যুক্ত করে উত্পন্ন অ-স্বাধীনতার সাথে সতর্ক থাকুন। একটি এলোমেলো প্রভাব (মাল্টি-লেভেল) মডেল সহায়তা করতে পারে।
এডুয়ার্ডো লিওনি

1
@ এডুয়ার্ডো: আমি স্বীকার করি যে নির্ভরতা মডেল করা হয়নি এবং এটি কিছুটা সমস্যাযুক্ত, এটি দেখানোর জন্য ধন্যবাদ। আমি নিশ্চিত না যে এলোমেলো প্রভাবগুলি কীভাবে সহায়তা করবে - যেহেতু বাইনারি ফলাফলগুলি win_homeগ্রুপিংয়ের স্তরে স্থির থাকে (যেমন যে কোনও ম্যাচের জন্য সর্বকালের টুকরো এটি 0 বা 1 হয়) সহ, যেমন ম্যাচগুলির জন্য একটি এলোমেলো ইন্টারসেপ্ট সহ এই প্রসঙ্গে পৃথকীকরণের সাথে কেবল বিশাল সমস্যার ফল হবে।
কল্পনা

আপনি সর্বোচ্চ গোলের পরামিতি সহ বিবেচনা করতেও পারেন, কারণ উচ্চ স্কোরিং গেমগুলিতে আরও সহজেই সরিয়ে দেওয়া হয়।
জেমস

6

আমি খেলনা মডেল থেকে ডেটা অনুকরণ শুরু করব। কিছুটা এইরকম:

n.games <- 1000
n.slices <- 90

score.away <- score.home <- matrix(0, ncol=n.slices, nrow=n.games)

for (j in 2:n.slices) {
  score.home[ ,j] <- score.home[ , j-1] + (runif(n.games)>.97)
  score.away[ ,j] <- score.away[ , j-1] + (runif(n.games)>.98)
}

এখন আমাদের কিছু খেলতে হবে। আপনি কাঁচা ডেটাও ব্যবহার করতে পারেন তবে আমি তথ্যগুলি অনুকরণ করে জিনিসগুলি ভাবতে খুব সহায়ক বলে মনে করি।

এরপরে আমি কেবল ডেটা প্লট করতাম, এটি হ'ল গেমের প্লট সময় বনাম সীসা বাড়ির সাথে, রঙ স্কেল জয়ের সম্ভাব্যতার সাথে মিল রেখে।

score.dif <- score.home-score.away

windf <- data.frame(game=1:n.games, win=score.home[ , n.slices] > score.away[, n.slices])

library(reshape)
library(ggplot2)

dnow <- melt(score.dif)
names(dnow) <- c('game', 'time', 'dif')
dnow <- merge(dnow, windf)

res <- ddply(dnow, c('time', 'dif'), function(x) c(pwin=sum(x$win)/nrow(x)))

qplot(time, dif, fill=pwin, data=res, geom='tile') + scale_color_gradient2() 

এটি আপনাকে আপনার ডেটার সমর্থন সন্ধান করতে সহায়তা করবে এবং সম্ভাব্যতাগুলি কেমন দেখাচ্ছে তার একটি কাঁচা ধারণা দেবে।

পটভূমি


1

এ পরিসংখ্যান একরোখা প্রযুক্তিবিদের পরীক্ষা করে দেখুন ফুটবল বাইরের সেইসাথে বই Mathletics কিছু অনুপ্রেরণার জন্য।

ফুটবলের বাইরের লোকেরা ফুটবলের প্রতিটি খেলার উপর ভিত্তি করে গেমের পূর্বাভাস দেয় ।

ম্যাথলেটিক্সের উইনস্টন গতিশীল প্রোগ্রামিংয়ের মতো কিছু কৌশল ব্যবহার করে।

আপনি অন্যান্য অ্যালগরিদম যেমন এসভিএম বিবেচনা করতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.