যদি ভেরিয়েবল কার্নেলের প্রস্থগুলি প্রায়শই কার্নেল রিগ্রেশনের জন্য ভাল হয় তবে কেন তারা সাধারণত কার্নেলের ঘনত্বের অনুমানের জন্য ভাল হয় না?


17

এই প্রশ্নটি অন্য কোথাও আলোচনার মাধ্যমে উত্সাহিত করা হবে

পরিবর্তনশীল কার্নেলগুলি প্রায়শই স্থানীয় প্রতিরোধে ব্যবহৃত হয়। উদাহরণস্বরূপ, লোস ব্যাপকভাবে ব্যবহৃত হয় এবং একটি রিগ্রেশন স্মুথ হিসাবে ভাল হিসাবে কাজ করে এবং ভেরিয়েবল প্রস্থের কার্নেলের উপর ভিত্তি করে যা ডেটা স্পারসিটির সাথে খাপ খায়।

অন্যদিকে, পরিবর্তনশীল কার্নেলগুলি সাধারণত কার্নেল ঘনত্বের অনুমানের ক্ষেত্রে খারাপ অনুমানকারী হিসাবে নিয়ে যায় বলে মনে করা হয় ( টেরেল এবং স্কট, 1992 দেখুন )।

ঘনত্বের অনুমানের জন্য নয় তবে তারা আবেগের জন্য ভালভাবে কাজ করবে কেন এমন কোনও স্বজ্ঞাত কারণ আছে?


2
আপনি লিখেছেন "অন্যদিকে, পরিবর্তনশীল কার্নেলগুলি সাধারণত কার্নেলের ঘনত্বের অনুমানের ক্ষেত্রে খারাপ অনুমানকারীকে নিয়ে যায় বলে মনে করা হয়", আপনি যে কাগজের উল্লেখ করেছেন তাতে কোন অংশটি আপনাকে বিশ্বাস করে? আমার অন্যান্য প্রচলিত রেফারেন্সগুলিতে প্রচুর উল্লেখ রয়েছে, উদাহরণস্বরূপ এই গবেষণাপত্রে উল্লিখিত রেফারেন্সগুলি দেখুন: arxiv.org/PS_cache/arxiv/pdf/1009/1009.1016v1.pdf
রবিন জিরাড

1
টেরেল এবং স্কটের বিমূর্ততাটি এটিকে সুন্দরভাবে সংক্ষেপে বলেছে: "সমস্ত সংস্করণে নিকটতম প্রতিবেশী অনুমানকারীরা এক এবং দুটি মাত্রায় খারাপ অভিনয় করে"। তারা কেবল মাল্টিভারিয়েট ঘনত্বের অনুমানের ক্ষেত্রে অনেক বেশি সুবিধা পেয়েছে বলে মনে হয়।
রব হ্যান্ডম্যান

3
"নিকটতম প্রতিবেশী" কেবলমাত্র পরিবর্তনশীল কার্নেল নয়। আমি যে কাগজপত্রগুলির উল্লেখ করেছি সেগুলিতে লেপস্কিইয়ের অ্যালগরিদমের মতো অন্যান্য সরঞ্জাম ব্যবহার করা হয়। আমি এওএস পেপারটি পড়ব তবে নিকটবর্তী প্রতিবেশীর পারফরমেন্সগুলি মাত্রার সাথে হ্রাস হওয়া উচিত বলে আমি অবাক হয়েছি যে মাত্রা বাড়ানো একটি "খুব অ-প্যারাম্যাট্রিক" অনুমানকারীকে সুবিধা দেয় (যদি আমরা স্বীকার করি যে স্থির ব্যান্ডউইথের তুলনায় কম প্যারাম্যাট্রিক কম ব্যান্ডউইথ পৃথক)। এই ধরণের পরিস্থিতিতে, মূল্যায়নের ক্ষেত্রে প্রায়শই ব্যবহৃত হয় ফলাফলগুলি নির্ধারণ করে ...
রবিন গিরার্ড

@ রবিন গিরার্ড:> * এটি অদ্ভুত বলে মনে হয়েছে যে মাত্রা বাড়ানো একটি "খুব অ-প্যারাম্যাট্রিক" অনুমানকারীকে সুবিধা দেয় (যদি আমরা স্বীকার করি যে ধ্রুব ব্যান্ডউইথ পৃথক ব্যান্ডউইথের তুলনায় আরও নন প্যারাম্যাট্রিক) * এই বাক্যে কি টাইপো আছে? অন্যথায় আপনি লেখকদের সাথে একমত হবেন বলে মনে হচ্ছে, কমপক্ষে স্বজ্ঞাত স্তরে। নিশ্চিত / সঠিক করার জন্য ধন্যবাদ।
ইউজার 603

@ কেওয়াক যে লক্ষ্য করে ধন্যবাদ! এটি একটি টাইপো: আমি বলতে চেয়েছিলাম ধ্রুবক ব্যান্ডউইথটি কম এনপি ... আমি আমার মন্তব্যটি সংশোধন করতে পারি না :( এ সম্পর্কে দুঃখিত)
রবিন গিরার্ড

উত্তর:


2

এখানে দুটি পৃথক প্রশ্ন রয়েছে বলে মনে হচ্ছে, যা আমি বিভক্ত করার চেষ্টা করব:

1) কেএস, কার্নেল স্মুথিং, কেডিএর থেকে আলাদা, কার্নেলের ঘনত্বের অনুমান কীভাবে? ঠিক আছে, বলুন আমার কাছে একটি অনুমানকারী / স্মুথ / ইন্টারপোলটার রয়েছে

est( xi, fi -> gridj, estj )

এবং XI এ "বাস্তব" ঘনত্ব () জেনেও যেতে পারি। তারপরে চলছে est( x, densityf ) অবশ্যই ঘনত্বের একটি অনুমান দিতে হবে (): একটি কেডি। এটি ভালভাবে হতে পারে যে কেএস এবং কে-ডি-ই আলাদাভাবে মূল্যায়ন করা হয় - বিভিন্ন স্বাচ্ছন্দ্যের মানদণ্ড, বিভিন্ন রীতি - তবে আমি কোনও মৌলিক পার্থক্য দেখি না। আমি কী মিস করছি?

2) কীভাবে মাত্রা অনুমান বা স্মুথিংকে স্বতঃস্ফূর্তভাবে প্রভাবিত করে ? এখানে একটি খেলনার উদাহরণ দেওয়া হয়েছে, কেবল অন্তর্দৃষ্টি সাহায্য করার জন্য। ইউনিফর্ম গ্রিডে N = 10000 পয়েন্টের একটি বাক্স এবং এর মধ্যে ডাব্লু = 64 পয়েন্টের একটি উইন্ডো, একটি লাইন বা বর্গক্ষেত্র বা কিউব বিবেচনা করুন:

                1d          2d          3d          4d
---------------------------------------------------------------
data            10000       100x100     22x22x22    10x10x10x10
side            10000       100         22          10
window          64          8x8         4x4x4       2.8^4
side ratio      .64 %       8 %         19 %        28 %
dist to win     5000        47          13          7

এখানে "সাইড রেশিও" উইন্ডো সাইড / বক্স সাইড, এবং "ডিস্ট টু উইন" বাক্সের এলোমেলো পয়েন্টের এলোমেলোভাবে স্থাপন করা উইন্ডোটির গড় দূরত্বের মোটামুটি অনুমান।

এটি কি আদৌ কোনও ধারণা রাখে? (একটি ছবি বা অ্যাপলেট সত্যিই সাহায্য করবে: যে কেউ?)

ধারণাটি হ'ল স্থির-আকারের বাক্সের মধ্যে একটি স্থির আকারের উইন্ডোটির বাক্সের বাকী অংশের সাথে 1 ডি 2 ডি 3 ডি 4 ডি-তে খুব আলাদা সান্নিধ্য থাকে। এটি অভিন্ন গ্রিডের জন্য; মাত্রার উপর দৃ depend় নির্ভরতা অন্যান্য বিতরণে বহন করে, সম্ভবত না। যাইহোক, এটি একটি শক্তিশালী সাধারণ প্রভাব, মাত্রিকতার অভিশাপের একটি দিকের মতো দেখাচ্ছে।


0

কার্নেলের ঘনত্বের অনুমানের অর্থ সংহতকরণ একটি স্থানীয় (ফাজি) উইন্ডোতে এবং কার্নেল স্মুথিংয়ের অর্থ স্থানীয় (ফাজি) উইন্ডোতে গড় গড়ে

কার্নেল স্মুথিং: Y~(এক্স)α1ρ(এক্স)Σকে(||এক্স-এক্সআমি||)Yআমি

কার্নেলের ঘনত্বের অনুমান: ρ(এক্স)αΣকে(||এক্স-এক্সআমি||)

এগুলি কেমন?

বুলিয়ান-মূল্যবান ক্রিয়াকলাপের নমুনাগুলি বিবেচনা করুন, অর্থাত্ "সত্য নমুনা" (প্রতিটি ইউনিটের মান সহ) এবং "মিথ্যা নমুনা" (প্রতিটি শূন্য মানের সাথে) সমন্বিত একটি সেট সামগ্রিক নমুনার ঘনত্ব ধরে নিলে ধ্রুবক (গ্রিডের মতো), এই ফাংশনের স্থানীয় গড় গড়টি একই রকম সত্য মূল্যবান উপসেট স্থানীয় (partial-) ঘনত্ব সমানুপাতিক। (মিথ্যা নমুনাগুলি আমাদের মসৃণ সমীকরণের ডিনোমিনেটরকে ক্রমাগত উপেক্ষা করার অনুমতি দেয়, যদিও যোগফলকে শূন্যের শর্তাদি যোগ করা হয়, যাতে এটি ঘনত্বের অনুমানের সমীকরণকে সহজতর করে))

একইভাবে যদি আপনার নমুনাগুলি বুলিয়ান রাস্টারগুলিতে বিরল উপাদান হিসাবে উপস্থাপিত হয় তবে আপনি রাস্টারগুলিতে ঝাপসা ফিল্টার প্রয়োগ করে তাদের ঘনত্বের অনুমান করতে পারেন।

এগুলি কীভাবে আলাদা?

স্বজ্ঞাতভাবে, আপনি নমুনা পরিমাপের মধ্যে উল্লেখযোগ্য পরিমাপের ত্রুটি রয়েছে কিনা তার উপর নির্ভর করে স্মুথিং অ্যালগরিদমের পছন্দটি আশা করতে পারেন।

এক চূড়ান্ত (কোন শব্দ নেই) আপনার কেবলমাত্র নমুনার অবস্থানগুলিতে সঠিক জ্ঞাত মানগুলির মধ্যে বিভক্ত হওয়া দরকার। বলুন, ডেলাউন ট্রায়াঙ্গুলেশনের মাধ্যমে (বিলাইনার টুকরোজ সংক্ষেপে)

ঘনত্বের অনুমানটি বিপরীত চরমের সাথে সাদৃশ্যপূর্ণ, এটি সম্পূর্ণ শব্দ, কারণ বিচ্ছিন্নতার নমুনাটি সেই সময়ে ঘনত্বের মান পরিমাপের সাথে আসে না। (সুতরাং কেবল বিভক্ত করার মতো কিছুই নেই You আপনি ভোরোনাই চিত্রের কক্ষ অঞ্চলগুলি পরিমাপ করার বিষয়টি বিবেচনা করতে পারেন তবে মসৃণকরণ / নিন্দিতকরণ এখনও গুরুত্বপূর্ণ হবে ..)

মুল বক্তব্যটি হ'ল সাদৃশ্য থাকা সত্ত্বেও এগুলি মূলত বিভিন্ন সমস্যা, তাই বিভিন্ন পদ্ধতির অনুকূল হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.