আমি কিছুটা সময় মেশিন লার্নিং শেখার জন্য ব্যয় করছি (পুনরাবৃত্তির জন্য দুঃখিত :) এবং মাল্টিভারিয়েট লিনিয়ার রিগ্রেশন ক্ষেত্রে গণনীয় রিগ্রেশন সহগগুলির জন্য সরাসরি সমীকরণ সমাধানের চেয়ে গ্রেডিয়েন্ট বংশোদ্ভূত বাছাইয়ের নিয়মের দ্বারা আগ্রহী হতে পারি না ।
থাম্বের বিধি: যদি বৈশিষ্ট্যগুলির সংখ্যা (পড়ুন সহগ / স্বতন্ত্র ভেরিয়েবলগুলি) বা এক মিলিয়নেরও বেশি হয়, গ্রেডিয়েন্ট বংশোদ্ভূত সঙ্গে যান, অন্যথায় ম্যাট্রিক্স বিপরীতমুখী গণনা কমার্শিয়াল হার্ডওয়্যারে মোটামুটি পরিচালনাযোগ্য এবং এইভাবে সহগের গণনা সরাসরি যথেষ্ট ভাল সম্পাদন করা উচিত ।
গুণগতভাবে বলতে গেলে, আমি ট্রেড অফ / সীমাবদ্ধতা পাই। তবে একটি পরিসংখ্যানগত দৃষ্টিকোণ থেকে আমরা সত্যিই কখনও এতগুলি সহগের সাথে মডেলগুলি গণনা করি? যদি আমি গ্রেড স্কুলে আমার মাল্টিভারিয়েট লিনিয়ার রিগ্রেশন ক্লাসগুলি মনে করি তবে আমাদের অনেক বেশি স্বাধীন ভেরিয়েবল ব্যবহার করা সম্পর্কে সতর্ক করা হয়েছিল যেহেতু তাদের উপর নির্ভরশীল ভেরিয়েবলের উপর খুব নগণ্য প্রভাব থাকতে পারে বা তাদের বিতরণগুলি আমরা ডেটা সম্পর্কে যে অনুমানগুলি অনুসরণ করি তা মানবে না। "বহু আইভি" ভাবার জন্য যদি আমি আমার মনকে প্রসারিত না করি তবে আমি এখনও কয়েক মিলিয়ন লোকের মধ্যে ভাবিনি ।
প্রশ্ন (গুলি):
- এটি কি সত্যিই ঘটে বা এটি একটি তাত্ত্বিক সমস্যা?
- দশ লক্ষ আইভি বিশ্লেষণ করার মূল বিষয় কী? এটি কি আমাদের সত্যই তা উপেক্ষা করার বিরোধিতা হিসাবে অর্জিত তথ্যের মূল্যের এত বৃদ্ধি করে?
- বা এটি কারণ, প্রাথমিকভাবে আমাদের কী দরকারী তা ধারণা নেই, তাই আমরা কী দরকারী তা দেখতে কেবল অভিশাপ চালাই এবং সেখান থেকে যাই এবং সম্ভবত আইভিগুলির সেট ছাঁটাই করি?
আমি এখনও বিশ্বাস করি কারণ আমরা "সবকিছু" বিশ্লেষণ করতে পারি তার অর্থ এই নয় যে আমাদের এটিকে একটি দ্রাবকের মধ্যে ফেলে দেওয়া উচিত (বা এটি করে) এবং আমার কিছু অতীত প্রশ্ন একই ধরণের পিওভিগুলি প্রতিফলিত করে।
আমি এখনও কোর্সটি শেষ করতে পারছি না এবং আমি খুব শীঘ্রই প্রশ্নটি জিজ্ঞাসা করতে পারি, তবে আমি কেবল এই "কেন" আমার মাথা থেকে চিন্তা করতে পারি না এবং এটি আমার সক্ষমতার সেরাটি বোঝার চেষ্টা করছি।