মীন-স্কোয়ার ত্রুটিটি কি সর্বদা নিউরাল নেটওয়ার্কগুলির প্রসঙ্গে উত্তল হয়?


9

একাধিক সংস্থান আমি উল্লেখ করেছি যে এমএসই দুর্দান্ত কারণ এটি উত্তেজক। তবে আমি কীভাবে পাই না, বিশেষত নিউরাল নেটওয়ার্কগুলির প্রসঙ্গে।

ধরা যাক আমাদের নিম্নলিখিত রয়েছে:

  • X: প্রশিক্ষণ ডেটাসেট
  • Y: লক্ষ্য
  • Θ: মডেলের পরামিতিগুলির সেট fΘ (অ-লিনিয়ারিটি সহ একটি নিউরাল নেটওয়ার্ক মডেল)

তারপর:

MSE(Θ)=(fΘ(X)Y)2

কেন এই ক্ষতির ফাংশন সর্বদা উত্তল থাকবে? এটি কি নির্ভর করে?fΘ(X)?

উত্তর:


1

সংক্ষেপে উত্তর: এমএসই হ'ল নিজের ইনপুট এবং পরামিতিগুলিতে উত্তল। তবে একটি স্বেচ্ছাসেবক নিউরাল নেটওয়ার্কে এটি অ্যাক্টিভেশন ফাংশনগুলির আকারে অ-রৈখিকতার উপস্থিতির কারণে সর্বদা উত্তল হয় না। আমার উত্তরের উত্স এখানে


1

ন্যুব্জতা

একটি অনুষ্ঠান f(x) with সহ উত্তল, যদি, কোনও , এবং যে কোনও , xΧx1Χx2Χ0λ1

f(λx1+(1λ)x2)λf(x1)+(1λ)f(x2).

এটি প্রমাণিত হতে পারে যে এই জাতীয় উত্তল এর একটি বৈশ্বিক ন্যূনতম রয়েছে। একটি অনন্য গ্লোবাল ন্যূনতম সর্বনিম্ন মিনিমায় তৈরি ট্র্যাপগুলিকে সরিয়ে দেয় যা অ্যালগরিদমে ঘটতে পারে যা বিশ্ব সর্বনিম্নে রূপান্তর অর্জনের চেষ্টা করে, যেমন একটি ত্রুটি ফাংশন হ্রাসকরণ।f(x)

যদিও ত্রুটি ফাংশনটি সমস্ত ধারাবাহিক, লিনিয়ার প্রসঙ্গ এবং অনেক অ-রৈখিক প্রেক্ষাপটে 100% নির্ভরযোগ্য হতে পারে তবে এর অর্থ এই নয় যে সমস্ত সম্ভাব্য অ-রৈখিক প্রসঙ্গের জন্য বিশ্ব সর্বনিম্নে রূপান্তর ঘটবে।

বর্গক্ষেত্রের ত্রুটি

আদর্শ সিস্টেম আচরণ এবং সিস্টেমের মডেল বর্ণনা করে এমন একটি ফাংশন দেওয়া হয়েছে (যেখানে প্যারামিটার ভেক্টর, ম্যাট্রিক্স, কিউব, বা হাইপারকিউব এবং ), যুক্তিযুক্তভাবে বা অভিব্যক্তির মাধ্যমে তৈরি (যেমন নিউরাল নেট প্রশিক্ষণ হিসাবে), গড় স্কোয়ার ত্রুটি (এমএসই) ফাংশনটি নীচে হিসাবে উপস্থাপিত হতে পারে।s(x)a(x,p)p1nN

e(β):=N1n[a(xn)s(xn)]2

উপাদান আপনি পড়া হয় সম্ভবত দাবি নয় যে অথবা সম্মান সঙ্গে উত্তল হয় , কিন্তু যে থেকে সম্মান সঙ্গে উত্তল হয় এবং তারা যাই হোক না কেন। এই পরবর্তী বিবৃতিটি কোনও অবিচ্ছিন্ন এবং জন্য প্রমাণিত হতে পারে । a(x,p)s(x)xe(β)a(x,p)s(x)a(x,p)s(x)

কনভার্জেন্স অ্যালগরিদমকে বিভ্রান্ত করছে

প্রশ্ন হচ্ছে একটি নির্দিষ্ট হয়, তাহলে এবং অর্জনের পদ্ধতি যে পরিমাপক একটি যুক্তিসঙ্গত MSE অভিসৃতি মার্জিন মধ্যে কিংকর্তব্যবিমূঢ় করা যেতে পারে, উত্তর হল, "হ্যাঁ।" এজন্য এমএসই একমাত্র ত্রুটির মডেল নয়।a(x,p)s(x)a(x,p)

সারসংক্ষেপ

সর্বোপরি সংক্ষিপ্তসারটি হ'ল নীচের জ্ঞানের উপর ভিত্তি করে স্টক উত্তল ত্রুটি মডেলগুলির একটি সেট থেকে সংজ্ঞায়িত বা চয়ন করা উচিত।e(β)

  • সিস্টেম জ্ঞাত বৈশিষ্ট্যs(x)
  • আনুমানিক মডেলa(x,p)
  • টেনসর পরের অবস্থাটি অভিজাত ক্রমের মধ্যে উত্পন্ন করতে ব্যবহৃত হত

স্টক উত্তল ত্রুটি মডেলগুলির সেটটিতে এমএসই মডেলটি অবশ্যই এর সরলতা এবং কম্পিউটিং বিকাশের কারণে অন্তর্ভুক্ত করেছে।


সুতরাং সংক্ষিপ্ত উত্তরটি হ'ল এমএসই আর্ট থেটা সর্বদা উত্তল। যদিও ফিডফোরার্ড (এক্স, থেটা) কোনটি উত্তল হতে পারে?
ব্যবহারকারী 74211

ঠিক আছে, @ user74211, সেই মন্তব্যটি আসলে প্রশ্নের উত্তর দিচ্ছে না। বিশেষভাবে HOW জিজ্ঞাসা করা প্রশ্নটির অর্থ বর্গ ত্রুটিটি সর্বদা উত্তেজক হতে পারে যদি এটি প্রয়োগ করা ফাংশনটি না হয়। আপনার মন্তব্যটি চাওয়া ব্যাখ্যা ছাড়াই প্রশ্নের বিবৃতিগুলির একটি উপসেট।
ফৌসিস্টিয়ান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.