সঙ্কুচিততা কী?


13

সংকুচিত শব্দটি নির্দিষ্ট চেনাশোনাগুলিতে প্রচুর পরিমাণে ছড়িয়ে পড়ে। তবে সংকোচনের বিষয়টি কী, এর স্পষ্ট সংজ্ঞা বলে মনে হয় না। আমার যদি কোনও টাইম সিরিজ থাকে (বা কোনও প্রক্রিয়া পর্যবেক্ষণের কোনও সংগ্রহ) আমি বিভিন্ন ধরণের কীভাবে সিরিজের কিছু প্রকারের অভিজ্ঞতাগত সংকোচনের পরিমাপ করতে পারি? আমি বিভিন্ন ধরণের তাত্ত্বিক সংকোচনের কথা বলতে পারি? সংকোচন কীভাবে ভবিষ্যদ্বাণীতে সহায়তা করতে পারে? লোকেরা কি কিছু ভাল অন্তর্দৃষ্টি বা রেফারেন্স সরবরাহ করতে পারে?


1
স্টিয়ারগার্গ: লজিস্টিক রিগ্রেশন বিশ্লেষণে সঙ্কুচিত কৌশলগুলির প্রয়োগ: একটি কেস স্টাডি এবং সঙ্কুচিত এবং শাস্তিযুক্ত সম্ভাবনা হিসাবে ভবিষ্যদ্বাণীমূলক নির্ভুলতার উন্নতি করার পদ্ধতিগুলি শুরু করার ভাল জায়গা। উভয়ই মুক্ত উত্স নয় (আমি মনে করি) তবে গুগল মূল নিবন্ধগুলি সন্ধান করবে।
চার্লস

3
কোনও অনুমানকারীকে নিয়মিতকরণের যে কোনও ধরণের যা অনুমানকে (সঙ্কুচিত করে) চালায় (সাধারণত 0 বা অন্য কোনও 'নাল' / পরিচিত মানের দিকে); প্রকৃতপক্ষে, নিয়মিতকরণ যা একে অপরের দিকে অনুমানের সংগ্রহ সঞ্চার করে তাও এক ধরণের সঙ্কুচিত (এটি তাদের পার্থক্যগুলিকে 0 এর দিকে প্রতিনিধিত্ব করে) সরিয়ে দেয়। আপনি যদি ইতিমধ্যে এটি না দেখে থাকেন তবে উইকিপিডিয়া নিবন্ধটি সহায়ক হতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা

অনুভূতি সঙ্কুচিত সম্পর্কে কি। ধরুন আমার একটি টাইম সিরিজ আছে আমি এটিতে একটি মডেল ফিট করছি। আমি কি নমুনা ফিট এবং নমুনা কর্মক্ষেত্রের বাইরে কিছু সংকোচনের কথা বলতে পারি?
শীতকালীন

উত্তর:


2

1961 সালে জেমস এবং স্টেইন "Quadratic লোকসানের সাথে অনুমান" নামে একটি নিবন্ধ প্রকাশ করেছেন https://projecteuclid.org/download/pdf_1/euclid.bsmsp/1200512173 । যদিও এটি সংকোচনের শব্দটি নির্দিষ্টভাবে মুদ্রণ করে না, তারা উচ্চতর মাত্রার (এমনকি একটি 3 প্যারামিটার অবস্থানের জন্যও) পরিসংখ্যানগুলিতে আলোচনা করেন যা সাধারণ এমএলএর চেয়ে কম ঝুঁকি (প্রত্যাশিত ক্ষতি) থাকে (প্রতিটি উপাদান নমুনা গড়) সাধারণ ডেটার জন্য । ব্র্যাডলি এফ্রন তাদের সন্ধানকে "যুদ্ধোত্তর গণিতের পরিসংখ্যানের সবচেয়ে আকর্ষণীয় উপপাদ্য" বলে অভিহিত করেছেন। এই নিবন্ধটি 3,310 বার উদ্ধৃত হয়েছে।

1983-এ কোপাস প্রথম সংবন্ধটি লিখেছিলেন "সঙ্কুচিত" শব্দটি মুদ্রণের জন্য প্রথম নিবন্ধ, অনুমান এবং সঙ্কোচন। এটি বিমূর্তে স্পষ্টভাবে সংজ্ঞায়িত করা হয়েছে:

নতুন ডেটাতে কোনও রিগ্রেশন প্রেডিক্টরের ফিট মূল ডেটার তুলনায় প্রায় সর্বদা খারাপ। এই সংকোচনের প্রত্যাশার ফলে স্টেইন টাইপ প্রেডিক্টর বাড়ে যা নির্দিষ্ট অনুমানের অধীনে, সমানভাবে নিম্নতর ভবিষ্যদ্বাণীকে ন্যূনতম স্কোয়ারের চেয়ে স্কোয়ার ত্রুটি বলে।

এবং ক্রমাগত সমস্ত গবেষণায়, দেখে মনে হচ্ছে সংকোচনটি গ্রহণযোগ্য এবং / অথবা মিনিম্যাক্স অনুমানকারীগুলির সন্ধানের প্রেক্ষিতে ভবিষ্যদ্বাণী এবং অনুমানের বহিরাগত নমুনার বৈধতার জন্য অপারেটিং বৈশিষ্ট্যগুলি (এবং এর প্রাক্কলন) বোঝায়।


2

এটি নিয়মিতকরণের বিষয়ে। মনে করুন আপনি একটি বাঁকানো ফিট করতে চান এবং আপনি একটি বর্গক্ষেত্র ক্ষতি ফাংশন ব্যবহার করেন (আপনি আলাদা চয়ন করতে পারেন)। দ্বারাfitআপনি সেই প্যারামিটারগুলি পুনরুদ্ধার করতে চান যা এই বাঁকটি তৈরি করে এমন প্রক্রিয়া পরিচালনা করে। এখন কল্পনা করুন যে আপনি 100 তম বহুবর্ষ (কেবল উদাহরণস্বরূপ) ব্যবহার করে এই বক্ররেখাকে ফিট করতে চান। আপনি সম্ভবত সম্ভবত বাঁকটির প্রতিটি কুঁচক এবং আওয়াজকে উপভোগ করতে বা ক্যাপচার করতে চলেছেন। তদতিরিক্ত, প্রদত্ত প্রশিক্ষণ ডেটার বিরতির বাইরে আপনার ভবিষ্যদ্বাণী ক্ষমতা সম্ভবত খুব দুর্বল হবে। সুতরাং, নিয়মিতকরণের পদটি নিয়মিতকরণের ফ্যাক্টর - l_1, l_2 বা কাস্টম দ্বারা গুণিত কিছু ওজন সহ উদ্দেশ্যমূলক ফাংশনে যুক্ত করা হয়। L_2 এর ক্ষেত্রে, যা বোঝার পক্ষে তাত্পর্যপূর্ণভাবে সহজ, এটির প্রভাব রয়েছে যে বৃহত প্যারামিটার মানগুলি ওরফে সঙ্কুচিত হ্রাস করতে বাধ্য হবে। আপনার অ্যালগরিদমকে এমন কোনও সমাধানে চালিত করা হিসাবে আপনি নিয়মিতকরণ বা সংকোচনের কথা ভাবতে পারেন যা আরও ভাল সমাধান হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.