সম্পাদনা: এই পোস্টটি তৈরি করার পর থেকে আমি এখানে একটি অতিরিক্ত পোস্ট দিয়েছি ।
নীচের পাঠ্যের সংক্ষিপ্তসার: আমি একটি মডেলটিতে কাজ করছি এবং লিনিয়ার রিগ্রেশন, বক্স কক্স ট্রান্সফর্মেশন এবং জিএএম চেষ্টা করেছি তবে খুব বেশি অগ্রগতি হয়নি
ব্যবহার করে R
, বর্তমানে আমি লিগের বড় লিগ (এমএলবি) পর্যায়ে নাবালিকা লীগ বেসবল খেলোয়াড়দের সাফল্যের পূর্বাভাস দেওয়ার জন্য একটি মডেল নিয়ে কাজ করছি। নির্ভরশীল পরিবর্তনশীল, আপত্তিকর কেরিয়ারটি প্রতিস্থাপনের উপরে (ওওআর) জয় করে, এটি এমএলবি পর্যায়ে সাফল্যের একটি প্রক্সি এবং পরিমাপ করা হয় যে খেলোয়াড় তার ক্যারিয়ারের সময়কালে জড়িত প্রতিটি নাটকের জন্য আক্রমণাত্মক অবদানের যোগফল (বিশদ এখানে - http) : //www.fangraphs.com/library/misc/war/)। স্বতন্ত্র ভেরিয়েবলগুলি পরিসংখ্যানগুলির জন্য জেড-স্কোর মাইনাল লিগের আক্রমণাত্মক ভেরিয়েবলগুলি যা বয়স সহ প্রধান লিগ পর্যায়ে সাফল্যের গুরুত্বপূর্ণ ভবিষ্যদ্বাণী বলে মনে করা হয় (কম বয়সে বেশি সাফল্যের সাথে খেলোয়াড়রা ভাল সম্ভাবনা থাকে), স্ট্রাইক আউট রেট [এসওপেক্ট) ], ওয়াক রেট [বিবিরেট] এবং সমন্বিত উত্পাদন (আক্রমণাত্মক উত্পাদনের একটি বিশ্বব্যাপী পরিমাপ) অতিরিক্ত হিসাবে, যেহেতু ছোটখাটো লিগের একাধিক স্তর রয়েছে, তাই আমি খেলায় নাবাল লিগ স্তরের জন্য ডামি ভেরিয়েবলগুলি অন্তর্ভুক্ত করেছি (ট্রিপল এ সহ ডাবল এ, হাই এ, লো এ, রুকি এবং শর্ট সিজন [প্রধান লিগগুলির আগে সর্বোচ্চ স্তর] হিসাবে রেফারেন্স ভেরিয়েবল])। দ্রষ্টব্য: আমি 0 থেকে 1 পর্যন্ত চলে আসা একটি ভেরিয়েবল হতে WAR কে আবার স্কেল করেছি।
পরিবর্তনশীল স্ক্রেটারপ্লট নিম্নরূপ:
রেফারেন্সের জন্য, নির্ভরশীল ভেরিয়েবল, ওওয়ারের নিম্নলিখিত প্লট রয়েছে:
আমি একটি লিনিয়ার রিগ্রেশন দিয়ে শুরু করেছি oWAR = B1zAge + B2zSOPct + B3zBBPct + B4zAdjProd + B5DoubleA + B6HighA + B7LowA + B8Rookie + B9ShortSeason
এবং নিম্নলিখিত ডায়াগোনস্টিক প্লটগুলি পেয়েছি :
অবশিষ্টাংশের পক্ষপাতহীনতার অভাব এবং এলোমেলো পরিবর্তনের অভাবের সাথে স্পষ্ট সমস্যা রয়েছে। অতিরিক্তভাবে, অবশিষ্টাংশগুলি স্বাভাবিক নয়। নিগ্রহের ফলাফলগুলি নীচে দেখানো হয়েছে:
আগের থ্রেডে পরামর্শ অনুসরণ করে , আমি কোনও সাফল্য ছাড়াই একটি বক্স-কক্স রূপান্তর চেষ্টা করেছি। এর পরে, আমি লগ লিঙ্ক সহ একটি জিএএম চেষ্টা করেছি এবং এই প্লটগুলি পেয়েছি:
মূল
নতুন ডায়াগনস্টিক প্লট
দেখে মনে হচ্ছে স্প্লাইজগুলি ডেটা ফিট করতে সহায়তা করেছে তবে ডায়াগনস্টিক প্লটগুলি এখনও খুব কম ফিট দেখাচ্ছে। সম্পাদনা: আমি ভেবেছিলাম যে আমি মূলত লাগানো মানগুলির বেনিফিটগুলি খুঁজছি কিন্তু আমি ভুল ছিলাম। যে প্লটটি মূলত প্রদর্শিত হয়েছিল তা মূল (উপরে) হিসাবে চিহ্নিত হয়েছে এবং পরে যে প্লটটি আপলোড করেছি তা নতুন ডায়াগনস্টিক প্লট হিসাবে চিহ্নিত হয়েছে (উপরেও)
মডেলের বৃদ্ধি পেয়েছে
কমান্ড দ্বারা উত্পাদিত ফলাফল gam.check(myregression, k.rep = 1000)
আশাব্যঞ্জক নয়।
কেউ কি এই মডেলটির জন্য পরবর্তী পদক্ষেপের পরামর্শ দিতে পারেন? আমি অন্য যে কোনও তথ্য সরবরাহ করতে পেরে খুশি হলাম যা আপনি মনে করেন যে আমি এতদূর এগিয়ে যাওয়া অগ্রগতি বোঝার জন্য দরকারী হতে পারে। যেকোন ধরনের সাহায্যের জন্য তোমাকে ধন্যবাদ।