আমি বর্তমানে রিগ্রেশন -এর জন্য সর্বনিম্ন-স্কোয়ার (এবং অন্যান্য) অনুমানগুলি সম্পর্কে শিখছি , এবং যা থেকে আমি কিছু অভিযোজিত অ্যালগরিদম সাহিত্যেও পড়ছি, প্রায়শই "... এবং ত্রুটির পৃষ্ঠটি উত্তল ..." শব্দটি বারবার প্রকাশিত হয় এবং কেন এটি উত্সাহিত হয় তা নিয়ে কোনও গভীরতা কোথায় পাওয়া যাবে তা নয়।
... সুতরাং এটি ঠিক উত্তল করে তোলে ?
আমি এই পুনরাবৃত্তি বাদ দেওয়া হালকা বিরক্তিকর বলে মনে করি কারণ আমি আমার নিজের ব্যয় ক্রিয়াকলাপগুলির সাথে আমার নিজের অভিযোজিত অ্যালগরিদমগুলি ডিজাইন করতে সক্ষম হতে চাই, তবে যদি আমার ব্যয়টি ফাংশনটি উত্তল ত্রুটির পৃষ্ঠের উত্পন্ন করে বা না জানায় তবে আমি সক্ষম হব না গ্রেডিয়েন্ট বংশোদ্ভূত জাতীয় কিছু প্রয়োগে খুব বেশি দূরে যান কারণ সেখানে বিশ্বব্যাপী সর্বনিম্ন থাকতে হবে না। সম্ভবত আমি সৃজনশীল হতে চাই - সম্ভবত আমি আমার ত্রুটির মানদণ্ড হিসাবে উদাহরণস্বরূপ ন্যূনতম স্কোয়ারগুলি ব্যবহার করতে চাই না।
গভীর খনন করার পরে, (এবং আমার প্রশ্নগুলি এখানেই শুরু হবে), আমি দেখতে পেয়েছি যে আপনার উত্তল ত্রুটির পৃষ্ঠ রয়েছে কিনা তা বলতে সক্ষম হওয়ার জন্য আপনাকে অবশ্যই নিশ্চিত করতে হবে যে আপনার হেসিয়ান ম্যাট্রিক্স ইতিবাচক অর্ধ-নির্দিষ্ট। প্রতিসম ম্যাট্রিকগুলির জন্য, এই পরীক্ষাটি সহজ - কেবল নিশ্চিত করুন যে হেসিয়ান ম্যাট্রিক্সের সমস্ত ইগোনালুগুলি নেতিবাচক নয়। (আপনার ম্যাট্রিক্স যদি প্রতিসম নয়, তবে আপনি গ্র্যামিয়ানের কারণে এটি নিজস্ব ট্রান্সপোজে যুক্ত করে একই ইগেনভ্যালু পরীক্ষা করে এটি প্রতিসম তৈরি করতে পারেন , তবে এখানে গুরুত্বপূর্ণ নয়)।
হেসিয়ান ম্যাট্রিক্স কী? হেসিয়ান ম্যাট্রিক্স আপনার ব্যয় ফাংশনের পার্টিয়ালের সমস্ত সম্ভাব্য সংমিশ্রণকে কোড করে। কত পার্টিয়াল আছে? আপনার বৈশিষ্ট্য ভেক্টরের বৈশিষ্ট্যগুলির সংখ্যা। পার্টিয়ালগুলি কীভাবে গণনা করা যায়? আসল ব্যয় কার্যকারিতা থেকে 'হাত দ্বারা' আংশিক ডেরাইভেটিভস নিন।
সুতরাং এটি আমি ঠিক তাই করেছি: আমি ধরে নিলাম যে আমাদের কাছে একটি x ডেটা ম্যাট্রিক্স রয়েছে, যা ম্যাট্রিক্স দ্বারা বোঝানো হয়েছে , যেখানে, উদাহরণগুলির সংখ্যাকে বোঝায়, এবং উদাহরণস্বরূপ বৈশিষ্ট্যের সংখ্যাকে চিহ্নিত করে। (যা পার্টিয়ালের সংখ্যাও হবে)। আমি মনে করি আমরা বলতে পারি যে আমাদের কাছে সময় নমুনা এবং সেন্সরগুলির থেকে স্থানিক নমুনা রয়েছে তবে এখানে শারীরিক প্রয়োগ খুব গুরুত্বপূর্ণ নয় isএন এক্স এম এন এম এন
উপরন্তু, আমরা একটি ভেক্টর আছে আকারের x । (এটি আপনার 'লেবেল' ভেক্টর বা প্রতিটি সারির সাথে সম্পর্কিত আপনার 'উত্তর' )। সরলতার জন্য, আমি এই নির্দিষ্ট উদাহরণের জন্য ধরে নিয়েছি । সুতরাং 2 'উদাহরণ' এবং 2 'বৈশিষ্ট্য'।m 1 X m = n = 2
সুতরাং এখন ধরুন যে আপনি এখানে 'লাইন' বা সর্বোপরি সর্বোপরি বহুবচনটি নির্ধারণ করতে চান। এটি হ'ল, আপনি আপনার ইনপুট ডেটা বৈশিষ্ট্যগুলি আপনার বহুপদী সহ-দক্ষ ভেক্টর against এর বিরুদ্ধে প্রজেক্ট করেন যেমন আপনার ব্যয় কার্যকারিতাটি:
এখন, আসুন আমরা প্রথম আংশিক ডেরিভেটিভ নিতে পারি , (বৈশিষ্ট্য 0) এভাবে:
এখন, আসুন আমরা সমস্ত দ্বিতীয় পার্টিয়াল গণনা করি, সুতরাং:
আমরা জানি যে হেসিয়ান কিছুই নয়:
এখন, আমি কীভাবে ডেটা ম্যাট্রিক্স তৈরি করেছি তার ভিত্তিতে ((আমার 'বৈশিষ্ট্যগুলি' কলামগুলি দিয়ে যায় এবং আমার উদাহরণগুলি সারি দিয়ে যায়)), হেসিয়ান বলে মনে হয়:
... যা নমুনা কোভেরিয়েন্স ম্যাট্রিক্স ছাড়া আর কিছুই নয় !
সুতরাং আমি কীভাবে ব্যাখ্যা করব তা সম্পর্কে আমি নিশ্চিত নই - বা আমার বলা উচিত, আমার এখানে কীভাবে সাধারণীকরণ করা উচিত তা আমি নিশ্চিত নই। তবে আমি মনে করি আমি এটি বলতে পারি:
সবসময় সত্য:
- হেসিয়ান ম্যাট্রিক্স সর্বদা আপনার ত্রুটি / ব্যয় পৃষ্ঠের উত্তল কিনা তা নিয়ন্ত্রণ করে।
- যদি আপনি হেসিয়ান ম্যাট্রিক্স পোস্ট-সেমি-ডিফ হয় তবে আপনি উত্তেজক (এবং আনন্দের সাথে অনুকূল সমাধানে রূপান্তর করতে গ্রেডিয়েন্ট বংশদ্ভুতের মতো অ্যালগরিদম ব্যবহার করতে পারেন)।
শুধুমাত্র এলএসইর জন্য সত্য:
- এলএসই ব্যয়ের মানদণ্ডের জন্য হেসিয়ান ম্যাট্রিক্স মূল কোভারিয়েন্স ম্যাট্রিক্স ছাড়া কিছুই নয়। (!)।
- আমার কাছে এর অর্থ এই যে, আমি যদি এলএসই মাপদণ্ড ব্যবহার করি তবে ডেটা নিজেই নির্ধারণ করে যে আমার উত্তল পৃষ্ঠ আছে কিনা? ... তারপরে কোনটির অর্থ হবে যে আমার কোভেরিয়েন্স ম্যাট্রিক্সের আইজেনভেেক্টররা কোনওভাবে ব্যয় পৃষ্ঠকে 'আকার দেওয়ার' ক্ষমতা রাখে? এটা কি সবসময় সত্য? অথবা এটি কেবল এলএসই মানদণ্ডের জন্য কার্যকর হয়েছিল? এটি ঠিক আমার সাথে বসে না যে কোনও ত্রুটির পৃষ্ঠের উত্তেজকতা ডেটার উপর নির্ভর করে।
সুতরাং এটি মূল প্রশ্নের প্রসঙ্গে ফিরিয়ে দেওয়া, কীভাবে একজন নির্ধারণ করে যে কোনও ত্রুটি সার্ফ্যান্স (আপনার নির্বাচিত কিছু ব্যয় ফাংশনের উপর ভিত্তি করে) উত্তল কিনা? এই সংকল্পটি কি ডেটা, বা হেসিয়ান ভিত্তিক?
ধন্যবাদ
টিএলডিআর: আমার ব্যয়-ফাংশন এবং / অথবা ডেটা-সেটটি উত্তল বা নন-উত্তল ত্রুটির পৃষ্ঠের ফলন দেয় কিনা তা নির্ধারণের জন্য আমি কীভাবে, ঠিক এবং কার্যতভাবে যেতে পারি?