অফলাইনে বনাম অনলাইন লার্নিংয়ে মডেল নির্বাচন


11

আমি ইদানীং অনলাইনে শেখার বিষয়ে আরও জানার চেষ্টা করছি (এটি একেবারে আকর্ষণীয়!) এবং একটি থিম যা আমি ভালভাবে বুঝতে পারি না তা হ'ল অনলাইন প্রসঙ্গে বনাম অফলাইনে মডেল নির্বাচন সম্পর্কে কীভাবে চিন্তা করা যায়। বিশেষত, ধরা যাক আমরা কিছু নির্দিষ্ট ডেটা সেট উপর ভিত্তি করে কোনও শ্রেণিবদ্ধ অফলাইনে প্রশিক্ষণ দিই । আমরা ক্রস-বৈধকরণের মাধ্যমে এর পারফরম্যান্সের বৈশিষ্ট্যগুলি অনুমান করি, বলি এবং আমরা এইভাবে সেরা শ্রেণিবদ্ধকে নির্বাচন করি।এসডি

এটিই আমি এই সম্পর্কে ভাবছিলাম: তাহলে কীভাবে আমরা একটি অনলাইন সেটিংয়ে প্রয়োগ করতে পারি ? আমরা কি ধরে নিতে পারি যে অফলাইনে পাওয়া সেরা একটি অনলাইন শ্রেণিবদ্ধের পাশাপাশি আরও ভাল পারফর্ম করবে? প্রশিক্ষণ দেওয়ার জন্য কিছু ডেটা সংগ্রহ করা , তারপরে সেই একই শ্রেণিবদ্ধ এবং তে পাওয়া একই পরামিতিগুলির সাথে একটি অনলাইন সেটিংয়ে এটি "অপারেশনালাইজ" করা কি বুদ্ধিমান ? এই ক্ষেত্রে সাবধানতা কি? এখানে মূল ফলাফলগুলি কি? এবং তাই এগিয়ে।এসএসএসএসডি

যাইহোক, এখন এটি বাইরে আছে, আমি অনুমান করি যে আমি যা খুঁজছি তা হল এমন কিছু তথ্যসূত্র বা সংস্থান যা আমাকে সাহায্য করবে (এবং আশা করি অন্যরা, যারা এই ধরনের বিষয় সম্পর্কে ভাবছেন!) কেবলমাত্র অফলাইন পদে চিন্তাভাবনা থেকে রূপান্তর করতে পারে এবং মডেল নির্বাচনের বিষয়টি এবং এই প্রশ্নগুলিকে আরও সুসংগতভাবে আমার পড়ার অগ্রগতির সাথে চিন্তা করার জন্য মানসিক কাঠামো তৈরি করুন।


আপনার কোন দরকারী সীসা আছে, বা এখনই দেওয়ার জন্য আপনার কোনও পরামর্শ আছে? ধন্যবাদ!
ব্যবহারকারী 1953384

আমি আপনাকে ফরাসীসকো " arxiv.org/pdf/1406.3816v1.pdf " এর কাগজটি দেখার পরামর্শ দিচ্ছি যাতে তিনি যৌথভাবে একটি শটে মডেল নির্বাচন এবং অপ্টিমাইজেশন করেন।
চ্যানড্রেশ

আপনি যদি পে- ওয়ালটি বাইপাস করতে পারেন তবে এটি খুব ভাল রেফারেন্স হতে পারে: cognet.mit.edu/jorter/10.1162/089976601750265045 ?
শিষ্য

উত্তর:


1

স্পষ্টতই, একটি স্ট্রিমিং প্রসঙ্গে আপনি ক্রস-বৈধকরণ সম্পাদনের জন্য আপনার ডেটা ট্রেন এবং পরীক্ষা সেটগুলিতে বিভক্ত করতে পারবেন না। প্রাথমিক ট্রেন সেটটিতে গণনা করা কেবলমাত্র মেট্রিক ব্যবহার করা আরও খারাপ শোনায়, আপনি যেমন ধরে নিয়েছেন যে আপনার ডেটা পরিবর্তন হয় এবং আপনার মডেল পরিবর্তনের সাথে খাপ খাইয়ে নেয় - এজন্য আপনি প্রথম স্থানে অনলাইনে শেখার মোডটি ব্যবহার করছেন।

আপনি যা করতে পারেন তা হ'ল টাইম-সিরিজে যে ধরণের ক্রস-বৈধতা ব্যবহার করা হয় তা ব্যবহার করুন ( হিন্ডম্যান এবং অ্যাথানসোপ্লোস, 2018 দেখুন )। সময়-সিরিজের মডেলগুলির যথার্থতা নির্ধারণের জন্য, আপনি একটি অনুক্রমিক পদ্ধতি ব্যবহার করতে পারেন, যেখানে মডেলটি "ভবিষ্যতের" টাইমপয়েন্টে পূর্বাভাস দেওয়ার জন্য পর্যবেক্ষণে প্রশিক্ষণপ্রাপ্ত । এটি একবারে বা ব্যাচগুলিতে এক পয়েন্ট প্রয়োগ করা যেতে পারে এবং আপনি আপনার সমস্ত ডেটা অতিক্রম না করা পর্যন্ত প্রক্রিয়াটি পুনরাবৃত্তি করা হয় ( হ্যান্ডম্যান এবং অ্যাথানসোপ্লোস, 2018 থেকে নেওয়া নীচের চিত্রটি দেখুন )।+ +1

শেষে, আপনি মোটামুটি যথাযথতা নির্ধারণের জন্য ত্রুটি মেট্রিকগুলিতে গড়পড়তা গড় (সাধারণত পাটিগণিত গড়, তবে আপনি ঘন ঘন স্মুথিংয়ের মতো কিছু ব্যবহার করতে পারেন)।

এখানে চিত্র বর্ণনা লিখুন

একটি অনলাইন দৃশ্যের অর্থ দাঁড়ায় যে আপনি টাইমপয়েন্ট ১ এ শুরু করবেন এবং টাইমপয়েন্ট ২ তে পরীক্ষা করুন, পরবর্তী সময়পয়েন্ট ২ তে পুনরায় ট্রেন, টাইমপয়েন্ট ৩ এ পরীক্ষা করার জন্য ইত্যাদি etc.

লক্ষ্য করুন যে এই জাতীয় ক্রস-বৈধকরণ পদ্ধতি আপনাকে আপনার মডেলগুলির পারফরম্যান্সের পরিবর্তিত প্রকৃতির জন্য অ্যাকাউন্ট করতে দেয়। স্পষ্টতই, আপনার মডেলটি যেমন ডেটাগুলিতে অভিযোজিত হয় এবং ডেটা পরিবর্তিত হতে পারে, আপনাকে নিয়মিত ত্রুটি মেট্রিকগুলি নিরীক্ষণ করতে হবে: অন্যথায় এটি স্থির-আকারের ট্রেন এবং পরীক্ষার সেটগুলি ব্যবহার করার চেয়ে আলাদা হবে না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.