"সেরা ফিট" এবং ক্রস বৈধতা শব্দটি ব্যবহৃত হিসাবে "সেরা" এর সংজ্ঞা কী?


16

আপনি যদি বিন্দুগুলির সেটগুলিতে একটি লিনিয়ার ফাংশন ফিট করে থাকেন (ধরে নিবেন যে প্রতিটি অ্যাবসিসার জন্য কেবল একটি আদেশ রয়েছে) ফলাফলটি হতে পারে:

  1. ছোট অবশিষ্টাংশ সহ একটি খুব জটিল ফাংশন
  2. বড় অবশিষ্টাংশ সহ একটি খুব সাধারণ ফাংশন

ক্রস বৈধকরণ সাধারণত এই দুটি চরমের মধ্যে "সেরা" সমঝোতা খুঁজে পেতে ব্যবহৃত হয়। তবে "সেরা" অর্থ কী? এটা কি "খুব সম্ভবত"? আপনি কীভাবে সর্বাধিক সম্ভবত সমাধানটি প্রমাণ করতে শুরু করবেন?

আমার অভ্যন্তরীণ ভয়েস আমাকে বলছে যে সিভি ন্যূনতম শক্তি সমাধানের এক ধরণের সন্ধান করছে। এটি আমাকে এন্ট্রপির কথা ভাবতে বাধ্য করে, যা আমি অস্পষ্টভাবে জানি যে পরিসংখ্যান এবং পদার্থবিজ্ঞান উভয় ক্ষেত্রেই ঘটে।

আমার কাছে মনে হচ্ছে জটিলতা এবং ত্রুটির কার্যকারিতার যোগফলকে হ্রাস করে "সেরা" ফিট তৈরি করা হয়েছে

minimising m where m = c(Complexity) + e(Error)

এটা কি কোন চেতনা তৈরী করে? সি এবং ই এর ফাংশনগুলি কী হবে?

অনুগ্রহ করে আপনি অ গাণিতিক ভাষা ব্যবহার করে ব্যাখ্যা করতে পারেন, কারণ আমি বেশি গণিত বুঝতে পারি না।


1
সর্বনিম্ন ভবিষ্যতের ত্রুটি সহ মডেল সেরা এবং ক্রস-বৈধতা আপনাকে সেই অনুমান দেয়। সি (জটিলতা) + ই (ত্রুটি) সূত্রগুলির কারণ হ'ল আপনি ভবিষ্যতের ত্রুটির অনুমান হিসাবে প্রশিক্ষণ ডেটাতে ত্রুটি ব্যবহার করতে পারতেন, তবে এটি অত্যধিক আশাবাদী, সুতরাং আপনি এই অনুমানটিকে নিরপেক্ষ করতে একটি পদ যুক্ত করেন যা সাধারণত কিছু কাজ করে মডেল জটিলতা
ইয়ারোস্লাভ বুলাটোভ

অন্যদিকে রানেজ ঘটনার আলোকে যুক্তি (আবার পদার্থবিজ্ঞানের অনুপ্রেরণা) এই সিদ্ধান্তে পৌঁছেছে যে ভবিষ্যতের ত্রুটি জটিলতা / ট্রেন_ইরর সম্পর্কিত কিছু।

ম্যাট ক্রাউস এখানে একটি অনুরূপ প্রশ্নের একটি দুর্দান্ত উত্তর দিয়েছেন : stats.stackexchange.com/a/21925/14640 তার উত্তর থেকে অনুচ্ছেদে : মডেলটির ব্যাখ্যামূলক শক্তির সাথে মডেল জটিলতার ভারসাম্য অর্জন করা লক্ষ্য এবং তাই পার্সিমনি ধারণাটি আরও ভাল কোনও মডেলের যথাযথতার পরিমাপ করা ত্রুটি থেকে সেরা ফিটের ধারণা। এটি কারণ একটি অত্যন্ত জটিল মডেল নতুন ফলাফলের পূর্বাভাস বা ব্যাখ্যা করতে সক্ষম না হয়ে ডেটাটিকে বেশি সাব্যস্ত করতে পারে।
আসাদ ইব্রাহিম

উত্তর:


6

আমি মনে করি এটি একটি দুর্দান্ত প্রশ্ন। আমি এটি সঠিকভাবে পেয়েছি তা নিশ্চিত হতে আমি এটি প্যারাফেজ করতে যাচ্ছি:

কিন্তু সেখানে কোন উপায়ে নির্বাচন করতে জটিলতা শাস্তি ফাংশন প্রচুর আছে যে মনে হবে এবং ত্রুটি শাস্তি ফাংশন । কোন পছন্দটি 'সেরা'। সর্বোত্তম এমনকি মানে কি করা উচিত ?ce

আমি মনে করি উত্তর (যদি সেখানে থাকে তবে) আপনাকে কেবল ক্রস-বৈধকরণের বাইরে নিয়ে যাবে। আমি পছন্দ করি কীভাবে এই প্রশ্নটি (এবং সাধারণভাবে বিষয়টি) ওকামের রেজার এবং পার্সিমনি সাধারণ ধারণার সাথে কীভাবে বিজ্ঞানের মৌলিক is আমি কোনওভাবেই এই অঞ্চলে বিশেষজ্ঞ নই তবে আমি এই প্রশ্নটিকে অত্যন্ত আকর্ষণীয় মনে করি। এই ধরণের প্রশ্নের মধ্যে আমি যে সেরা পাঠটি জানি তা হ'ল মার্কাস হুটারের ইউনিভার্সাল কৃত্রিম বুদ্ধিমত্তা (আমাকে এ সম্পর্কে কোনও প্রশ্ন জিজ্ঞাসা করবেন না, যদিও আমি এর বেশিরভাগটি পড়িনি)। আমি কয়েক বছর আগে হুটার এবং একটি বক্তৃতায় গিয়েছিলাম এবং খুব মুগ্ধ হয়েছিলাম।

আপনি এই ভেবে ঠিকই বলেছেন যে কোনও জায়গায় ন্যূনতম এনট্রপি যুক্তি রয়েছে (কিছুটা জটিলতার জন্য পেনাল্টি ফাংশন এর জন্য ব্যবহৃত হয়েছে)। হটার এন্ট্রপির পরিবর্তে কলমোগোরভ জটিলতার ব্যবহারের পক্ষে ছিলেন। এছাড়াও, হুটারের 'সেরা' (যতদূর আমি মনে করি) এর সংজ্ঞাটি (অনানুষ্ঠানিকভাবে) এমন মডেল যা ভবিষ্যতের সর্বাপেক্ষা ভবিষ্যদ্বাণী করে (যেমন ভবিষ্যতে পর্যবেক্ষণ করা হবে এমন ডেটা সম্পর্কে সেরা ভবিষ্যদ্বাণী করে)। তিনি কীভাবে এই ধারণাটি আনুষ্ঠানিক করেন তা আমি মনে করতে পারি না।c


আপনি প্রশ্নটি বুঝতে পারেন। আমি লিঙ্কগুলি অনুসরণ করব।
বার্ট

আপনার জানা উচিত যে এই লিঙ্কগুলি আপনাকে কোথাও 'ব্যবহারিক' নেওয়ার সম্ভাবনা নেই। যদি আপনি ক্রস বৈধকরণ (বা কোনও মডেল নির্বাচনের কোনও অন্য ধরণের) ব্যবহার করে কিছু তৈরির চেষ্টা করছেন তবে বাস্তবে এটি সর্বদা বোধগম্য কিছুটা এবং কিছুটা অ্যাড-হকের দিকে নেমে আসার সম্ভাবনা রয়েছে (যদিও আমি সম্মত হই যে এটি অসন্তুষ্ট নয়)।
রবি ম্যাককিলিয়াম

এখন আমরা কোথাও পাচ্ছি। en.wikedia.org/wiki/Minimum_message_ দৈর্ঘ্য মনে হচ্ছে আমি যা ভাবছিলাম। ধন্যবাদ!
বার্ট

কোন চিন্তা করো না. এটি কেবল প্রতিচ্ছবি, ব্যবহারিক নয়।
বার্ট

9

যতক্ষণ না কারোর দ্বারা আরও ভাল উত্তর দেওয়া হয় ততক্ষণ আমি একটি সংক্ষিপ্ত স্বজ্ঞাত উত্তর (মোটামুটি বিমূর্ত স্তরে) সরবরাহ করব:

প্রথমে নোট করুন যে জটিল ফাংশন / মডেলগুলি আরও ভাল ফিট করে (যেমন, কম অবশিষ্টাংশ রয়েছে) কারণ তারা বিশ্বজুড়ে উপস্থিত না থাকা ডেটাসেটের কিছু স্থানীয় বৈশিষ্ট্য (চিন্তাধারাই ভাবুন) ব্যবহার করে (পদ্ধতিগত নিদর্শনগুলি ভাবেন)।

দ্বিতীয়ত, ক্রস বৈধকরণ সম্পাদন করার সময় আমরা ডেটাটিকে দুটি সেটে বিভক্ত করি: প্রশিক্ষণ সেট এবং বৈধতা সেট।

সুতরাং, যখন আমরা ক্রস বৈধকরণ সম্পাদন করি তখন একটি জটিল মডেল খুব ভাল ভবিষ্যদ্বাণী করতে পারে না কারণ সংজ্ঞা অনুসারে একটি জটিল মডেল প্রশিক্ষণ সংস্থার স্থানীয় বৈশিষ্ট্যগুলিকে কাজে লাগাবে। তবে, প্রশিক্ষণের সেটটির স্থানীয় বৈশিষ্ট্যগুলি ভ্যালিডেশন সেটের স্থানীয় বৈশিষ্ট্যগুলির তুলনায় খুব আলাদা হতে পারে যার ফলশ্রুতি খারাপ হয়নি। অতএব, আমাদের এমন মডেল বাছাই করার প্রবণতা রয়েছে যা প্রশিক্ষণের গ্লোবাল বৈশিষ্ট্য এবং বৈধতা ডেটাসেটকে ক্যাপচার করে।

সংক্ষেপে, ক্রস বৈধকরণ ডেটাসেটের বৈশ্বিক নিদর্শনগুলিকে ক্যাপচার করে এমন মডেল নির্বাচন করে এবং কোনও ডেটাসেটের কিছু স্থানীয় বৈশিষ্ট্য শোষণ করে এমন মডেলগুলি এড়িয়ে চূড়ান্তভাবে সুরক্ষা দেয়।


@ শ্রীকান্ত আমি এই সমস্ত জানি। সিভি "সেরা" সন্ধানের একটি মাধ্যম means "সেরা" এর সংজ্ঞা কী?
বার্ট

@ বার্ট 'সেরা মডেল' = এমন একটি মডেল যা 'সেরা' একটি ডেটার স্থানীয় বৈশিষ্ট্যগুলি এড়িয়ে গিয়ে বৈশ্বিক নিদর্শনগুলিকে ধারণ করে। অ-গণিত সম্পর্কিত বিবরণের জন্য এটিই আমি সেরা। সম্ভবত, অন্য কেউ আরও কিছুটা বিস্তারিত ব্যাখ্যা করতে পারেন বা আরও সুনির্দিষ্ট হতে পারেন।

@ বার্ট: "সেরা" বলতে সেই ফাংশনটি বোঝায় যা প্রশিক্ষণের ডেটা সবচেয়ে ভাল ফিট করে এবং যা বৈধতা / অদেখা-পরীক্ষা সেট ডেটার সাথে "জেনারালাইজেশন" করে। আমি মনে করি শ্রীকান্তের উত্তর থেকে এটি বেশ পরিষ্কার। একটি ভাল সাধারণীকরণ আচরণ আনুষ্ঠানিকভাবে সংজ্ঞায়িত করার জন্য অনেকগুলি উপায় রয়েছে। অপ্রাতিষ্ঠানিক অর্থে, আপনি এটিকে এমন কোনও ফাংশন সন্ধানের হিসাবে ভাবতে পারেন যা "মসৃণ" এবং খুব ঝাঁকুনিপূর্ণ নয়। প্রশিক্ষণের ডেটাতে পুরোপুরি ফিট করার চেষ্টা করায় উইগ্রি লুকিং ফাংশন হতে পারে যদিও মসৃণতা সাধারণত নিশ্চিত করে যে ফাংশনটি প্রশিক্ষণ এবং বৈধতা / পরীক্ষার ডেটা উভয় ক্ষেত্রেই যথাযথভাবে কার্যকর করবে।
ebony1

@ ইবনি: আপনি পয়েন্টটি মিস করছেন। আমি
আশাবাদটি

5

একটি সাধারণ মেশিন-লার্নিং ভিউতে উত্তরটি মোটামুটি সহজ: আমরা এমন মডেল তৈরি করতে চাই যা নতুন ডেটা (প্রশিক্ষণের সময় অদেখা) পূর্বাভাস দেওয়ার সময় সর্বোচ্চ নির্ভুলতা অর্জন করতে পারে। কারণ আমরা সরাসরি এটি পরীক্ষা করতে পারি না (ভবিষ্যতের কোনও তথ্য আমাদের নেই) আমরা মন্টে কার্লো সিমুলেশন করি এই জাতীয় পরীক্ষার - এবং এটি মূলত ক্রস বৈধতার নীচে ধারণা।

যথার্থতা সম্পর্কে কিছু সমস্যা থাকতে পারে (উদাহরণস্বরূপ কোনও ব্যবসায়িক ক্লায়েন্ট বলতে পারে যে ইউনিট প্রতি 5 € ও ইউনিট প্রতি 0.01 unders আন্ডারশুট করতে পারে, তাই কম নির্ভুল তবে আরও আন্ডারহুটিং মডেল তৈরি করা ভাল) তবে সাধারণভাবে এটি শ্রেণিবদ্ধকরণে সত্য উত্তরগুলির মোটামুটি স্বজ্ঞাত শতাংশ এবং রিগ্রেশনে বিস্তৃতভাবে ব্যাখ্যা করা বিভিন্নরূপে ব্যবহৃত হয়।


3

প্রচুর মানুষের চমৎকার উত্তর রয়েছে, এখানে আমার 0.02 ডলার।

"সেরা মডেল", বা "মডেল নির্বাচন", স্ট্যাটিস্টিকালি বলার জন্য দুটি উপায় রয়েছে:

1 একটি ব্যাখ্যা যা যথাসম্ভব সহজ, তবে সহজ নয় (অ্যাট্রিবি। আইনস্টাইন)

- This is also called Occam's Razor, as explanation applies here.
- Have a concept of True model or a model which approximates the truth
- Explanation is like doing scientific research


2 ভবিষ্যদ্বাণী ইঞ্জিনিয়ারিং বিকাশের অনুরূপ আগ্রহ।

- Prediction is the aim, and all that matters is that the model works
- Model choice should be based on quality of predictions
- Cf: Ein-Dor, P. & Feldmesser, J. (1987) Attributes of the performance of central processing units: a relative performance prediction model. Communications of the ACM 30, 308–317.

বিস্তৃত ধারণা (ভুল) ধারণা:

মডেল চয়েজ সেরা মডেল চয়ন করার সমতুল্য

ব্যাখ্যার জন্য আমাদের বেশ কয়েকটি (মোটামুটি) সমানভাবে ভাল ব্যাখ্যামূলক মডেল হওয়ার সম্ভাবনা হতে সচেতন হওয়া উচিত। সরলতা মডেলটিতে অন্তর্ভূক্ত ধারণাগুলি যোগাযোগ করার ক্ষেত্রে এবং মনোবিজ্ঞানীরা যাকে সাধারণীকরণ বলে অভিহিত করেছেন, যে পরিস্থিতিতে মডেলটি অধ্যয়ন করা হয়েছিল তার থেকে দৃশ্যে 'কাজ' করার ক্ষমতা উভয়কেই সহায়তা করে। তাই কয়েকটি মডেলের একটি প্রিমিয়াম রয়েছে।

পূর্বাভাসের জন্য: (ডাঃ রিপলির) বিশেষজ্ঞের মতামতের মধ্যে পছন্দ করা ভাল উপমা: আপনার যদি বিশেষজ্ঞদের একটি বিশাল প্যানেলে অ্যাক্সেস থাকে তবে আপনি কীভাবে তাদের মতামতটি ব্যবহার করবেন?

ক্রস বৈধকরণ পূর্বাভাস দিকটি যত্ন করে। সিভি সম্পর্কে বিশদ জানতে দয়া করে মডেল নির্বাচনের বিষয়ে ড । বিডি রিপলির ড। ব্রায়ান ডি রিপলির উপস্থাপনাটি দেখুন

উদ্ধৃতি: দয়া করে নোট করুন যে এই উত্তরের সমস্ত কিছু উপরে বর্ণিত উপস্থাপনা থেকে। আমি এই উপস্থাপনাটির একটি বড় ভক্ত এবং আমি এটি পছন্দ করি like অন্যান্য মতামত পৃথক হতে পারে। উপস্থাপনার শিরোনামটি হ'ল: "মডেলসের বৃহত্তর শ্রেণীর মধ্যে নির্বাচন করা" এবং ডাঃ ব্রায়ান ডি রিপ্লে লিখেছিলেন, জন নেল্ডারের ৮০ তম জন্মদিন, ইম্পেরিয়াল কলেজের অনার সম্মানসূচক সিম্পোজিয়ামে দেওয়া হয়েছিল।


3

এখানে দুর্দান্ত আলোচনা, তবে আমি এখন পর্যন্ত উত্তরগুলি থেকে আলাদাভাবে ক্রস-বৈধকরণের কথা ভাবি (এমবিকিউ এবং আমি একই পৃষ্ঠায় রয়েছি বলে মনে করি)। সুতরাং, আমি জলের জলাবদ্ধতার ঝুঁকিতে আমার দুটি সেন্ট স্থাপন করব ...

মডেলটির ডেটা ফিট করার এবং পূর্বাভাস দেওয়ার ক্ষমতাতে স্যাম্পলিংয়ের ত্রুটির কারণে পরিবর্তনশীলতা এবং পক্ষপাত নির্ধারণের জন্য ক্রস-বৈধকরণ একটি পরিসংখ্যান কৌশল। সুতরাং, "সেরা" হ'ল মডেল যা সর্বনিম্ন সাধারণীকরণ ত্রুটি সরবরাহ করে, যা পরিবর্তনশীলতা এবং পক্ষপাতের ইউনিটে থাকবে। ক্রম বৈধতা প্রয়াসের ফলাফলের উপর ভিত্তি করে বায়সিয়ান এবং বুটস্ট্র্যাপ মডেল অ্যাভারেজিংয়ের মতো প্রযুক্তিগুলি অ্যালগোরিদমিক পদ্ধতিতে কোনও মডেল আপডেট করতে ব্যবহার করা যেতে পারে।

এই মতামতটি আমার মতামতকে কী জানিয়েছে তার আরও প্রসঙ্গের জন্য ভাল তথ্য সরবরাহ করে।


1

ত্রুটি ফাংশন প্রশিক্ষণ ডেটাতে আপনার মডেল (ফাংশন) এর ত্রুটি। জটিলতাটি আপনি যে ফাংশনটি শিখার চেষ্টা করছেন তার কিছু আদর্শ (যেমন স্কোয়ার্ড এল 2 আদর্শ)। জটিলতা শব্দটি হ্রাস করা মূলত মসৃণ ফাংশনগুলির পক্ষে, যা কেবল প্রশিক্ষণের ডেটাতেই নয় পরীক্ষার ডেটাতেও ভাল করে তোলে। আপনি যদি সহগের একটি সেট দ্বারা আপনার ফাংশন উপস্থাপন করেন (বলুন, আপনি লিনিয়ার রিগ্রেশন করছেন যদি), স্কোয়ার নিয়ম দ্বারা জটিলতা দণ্ডিত করা আপনার ফাংশনে ক্ষুদ্র সহগ মানগুলিতে নিয়ে যায় (অন্যান্য নিয়মকে শাস্তি দেওয়ার ফলে জটিলতা নিয়ন্ত্রণের বিভিন্ন ধারণার দিকে পরিচালিত হয়)।


1

(p,q)1,λ>0

(1)Argmin.β|λ,x,y||ym(x,β)||p+λ||β||q

সমতুল্য

(2)Argmin.β|λ,x,y||ym(x,β)||p

s.t. ||β||qλ

||β||qλq=1,2β^β^

λλ=(x,y)(1)(2)λβ^|λ

e()=||ym(x,β)||pp=1p=2m()


1
λ

@ রবি:> ধন্যবাদ প্যারামিটার এবং হাইপারপ্যারামিটারের মধ্যে পার্থক্য পরিষ্কার করার জন্য আমি টেক্সটটি সামান্য সংযোজন করেছি।
ব্যবহারকারীর 603

@ কেওয়াওয়াক: আমি দুঃখের সাথে বলতে চাই যে এর অর্থ কী আমার কাছে কোনও ধারণা নেই। পি, কিউ, ল্যাম্বদা, এক্স, ওয়াই, এম এবং বিটা চিহ্নগুলি কী বোঝায়?
বার্ট

@ বার্ট:> আমার উত্তরটি মূলত শ্রীকান্তের মতই। যেখানে তিনি একটি স্বজ্ঞাত ব্যাখ্যা দিলেন, আমি ভবিষ্যতের দর্শকদের সুবিধার জন্য আরও কঠোর একটি যুক্ত করতে চেয়েছিলাম যা আপনার মত একই প্রশ্ন থাকতে পারে, তবে আনুষ্ঠানিক ভাষার চেয়ে গণিতের সাথে বেশি ফ্যামিলিয়ার। আপনি যে সমস্ত চিহ্নগুলি উল্লেখ করেছেন তা আমার উত্তরে সংজ্ঞায়িত করা হয়েছে (আবারো, এটি আনুষ্ঠানিকভাবে করা হয়েছে)।
ব্যবহারকারী 60

@ কেওয়াওয়াক: উদাহরণস্বরূপ, কোথায় p সংজ্ঞায়িত করা হয়েছে?
বার্ট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.