অনিশ্চয়তা সংহত করে কার্নেল ঘনত্বের অনুমান


12

এক-মাত্রিক ডেটা ভিজ্যুয়াল করার সময়, সঠিকভাবে নির্বাচিত বিন প্রস্থের জন্য অ্যাকাউন্ট হিসাবে কার্নেল ঘনত্ব অনুমানের কৌশলটি ব্যবহার করা সাধারণ।

যখন আমার এক-মাত্রিক ডেটাসেটের পরিমাপের অনিশ্চয়তা রয়েছে, তখন কি এই তথ্যটি অন্তর্ভুক্ত করার কোনও মানক উপায় আছে?

উদাহরণস্বরূপ (এবং যদি আমার বোঝাপড়াটি নির্বোধ হয় তবে আমাকে ক্ষমা করুন) কেডিপি পর্যবেক্ষণের ডেল্টা ফাংশনগুলির সাথে কোনও গাউসিয়ান প্রোফাইল কনভলভ করে। এই গাউসিয়ান কার্নেলটি প্রতিটি অবস্থানের মধ্যে ভাগ করা হয়, তবে পরিমাপের অনিশ্চয়তার সাথে মেলে গাউসিয়ান প্যারামিটারটি ভিন্ন হতে পারে। এটি করার কোনও মানক উপায় আছে কি? আমি প্রশস্ত কার্নেলগুলি সহ অনিশ্চিত মানগুলি প্রতিফলিত করার প্রত্যাশা করছি।σ

আমি এটি পাইথনে কেবল প্রয়োগ করেছি, তবে এটি সম্পাদন করার জন্য আমি কোনও মানক পদ্ধতি বা ফাংশন জানি না। এই কৌশলটিতে কোনও সমস্যা আছে? আমি নোট করি যে এটি কিছু অদ্ভুত চেহারা গ্রাফ দেয়! উদাহরণ স্বরূপ

কেডিএ তুলনা

এই ক্ষেত্রে নিম্ন মানগুলির বৃহত্তর অনিশ্চয়তা রয়েছে তাই বিস্তৃত সমতল কার্নেল সরবরাহ করার ঝোঁক রয়েছে, অন্যদিকে কে-ডি-ই নিম্নতর (এবং অনিশ্চিত) মানকে ওজন করে।


আপনি কি বলছেন যে লাল বক্ররেখাগুলি পরিবর্তনশীল-প্রস্থের গাউসিয়ান এবং সবুজ বক্ররেখা তাদের যোগফল? (এটি এই গ্রাফগুলি থেকে প্রশংসনীয় বলে মনে হচ্ছে না))
হুবুহু

আপনি কি জানেন যে প্রতিটি পর্যবেক্ষণের জন্য পরিমাপের ত্রুটিটি কী?
আকসকল

@ তবে লাল রেখাচিত্রগুলি পরিবর্তনশীল প্রস্থের গাউসিয়ান এবং নীল বক্ররেখা তাদের যোগফল। সবুজ বক্ররেখা একটি ধ্রুবক প্রস্থ সহ কে.ডি.এ, বিভ্রান্তির জন্য দুঃখিত
সাইমন ওয়াকার

@ আকসাকাল হ্যাঁ, প্রতিটি পরিমাপের আলাদা অনিশ্চয়তা রয়েছে
সাইমন ওয়াকার

পার্শ্ব-ইস্যু, তবে আপনি গাউসীয় কার্নেলগুলি ব্যবহার করেন এমন কার্নেল ঘনত্ব অনুমানের কোনও সংজ্ঞা নয়। আপনি যে কোনো, 1 থেকে একীভূত মত কার্নেলের যদিও কিছু কার্নেলের আরো যুক্তিসম্মত বা অন্যদের তুলনায় উপযোগী .... ব্যবহার করতে পারেন
নিক কক্সবাজার

উত্তর:


6

এটি প্রস্থকে পরিবর্তিত করে তোলে তা বোঝায়, তবে কার্নেলের প্রস্থটিকে অনিশ্চয়তার সাথে মেলে না।

ব্যান্ডউইথের উদ্দেশ্যটি বিবেচনা করুন যখন র্যান্ডম ভেরিয়েবলগুলি নিয়ে কাজ করার জন্য পর্যবেক্ষণগুলি মূলত কোনও অনিশ্চয়তা থাকে না (যেমন যেখানে আপনি এগুলি একেবারে কাছাকাছি পর্যবেক্ষণ করতে পারেন) - তবুও, কেডি শূন্য ব্যান্ডউইথ ব্যবহার করবে না, কারণ ব্যান্ডউইথের সাথে সম্পর্কিত পর্যবেক্ষণের অনিশ্চয়তার চেয়ে বিতরণে পরিবর্তনশীলতা (অর্থাত্ 'পর্যবেক্ষণের মধ্যে' প্রকরণ, 'পর্যবেক্ষণের মধ্যে' অনিশ্চয়তা নয়)।

আপনার কাছে যা আছে তা হ'ল আলাদা আলাদা আলাদা উত্সের উত্স ('কোনও পর্যবেক্ষণ-অনিশ্চয়তা নয়') যা প্রতিটি পর্যবেক্ষণের জন্য আলাদা।

সুতরাং প্রথম পদক্ষেপ হিসাবে, আমি বলব "যদি ডেটার 0 অনিশ্চয়তা থাকে তবে আমি সবচেয়ে ছোট ব্যান্ডউইথটি কী ব্যবহার করব?" এবং তারপরে একটি নতুন ব্যান্ডউইথ তৈরি করুন যা সেই ব্যান্ডউইথের স্কোয়ারের যোগফলের বর্গমূল এবং the আপনি পর্যবেক্ষণের অনিশ্চয়তার জন্য ব্যবহার করেছেন।σi

সমস্যাটি দেখার বিকল্প উপায় হ'ল প্রতিটি পর্যবেক্ষণকে সামান্য কার্নেল হিসাবে দেখানো হবে (যেমনটি আপনি করেছেন, যেখানে পর্যবেক্ষণটি হতে পারে সেখানে উপস্থাপন করবেন), তবে সাধারণ (কেডি-) কার্নেলটি (সাধারণত স্থির-প্রস্থ, তবে) মিশ্রিত করুন পর্যবেক্ষণ-অনিশ্চয়তা কার্নেলের সাথে থাকতে হবে না) এবং তারপরে একটি সম্মিলিত ঘনত্বের প্রাক্কলন করুন। (আমি বিশ্বাস করি যে এটি আমি উপরে প্রস্তাবিত মত একই ফলাফল।)


2

আমি পরিবর্তনশীল ব্যান্ডউইথ কার্নেল ঘনত্ব অনুমানকারী প্রয়োগ করবো, উদাহরণস্বরূপ, ডিকনভোলিউশন কার্নেল ঘনত্ব অনুমানের কাগজগুলির জন্য স্থানীয় ব্যান্ডউইথ নির্বাচনকারীরা যখন পরিমাপের ত্রুটি বিতরণ জানা যায় তখন অভিযোজিত উইন্ডো কে। আপনি বলেছিলেন যে আপনি ত্রুটির বৈকল্পিকতা জানেন তাই আপনার ক্ষেত্রে এই পদ্ধতির প্রয়োগ হওয়া উচিত। দূষিত নমুনার সাথে অনুরূপ পদ্ধতির জন্য এখানে আরও একটি কাগজ রয়েছে: একটি নিয়মিত নমুনা থেকে কার্নেল ঘনত্বের প্রতিষ্ঠানে বুটস্ট্র্যাপ ব্যান্ডউইথ নির্বাচন


আপনার প্রথম লিঙ্কটি আমাকে ms.unimelb.edu.au এ নিয়ে যায় , এটি কাগজটি নয়। আমি মনে করি আপনি লিঙ্ক.স্প্রিংগার.com
আদি রো

এই সমাধানগুলি দুর্দান্ত দেখায়! আপনি কি একটি কোড প্রয়োগ করে জানেন?
আদি রো

@ অ্যাডিরো, আমি ভাঙা লিঙ্কটি ঠিক করেছি fixed আমার কোড নেই
আকসকল

0

1992 সালে উইলির ডেভিড ডাব্লু স্কট দ্বারা "মাল্টিভারিয়েট ডেনসিটি অনুমান: তত্ত্ব, অনুশীলন এবং ভিজ্যুয়ালাইজেশন" বিভাগে আপনি 6 নং অধ্যায়ের পরামর্শ নিতে পারেন।

অবিচ্ছিন্ন মামলার জন্য (পিপি 130-131), তিনি ব্যান্ডউইথ নির্বাচনের জন্য সাধারণ রেফারেন্স নিয়মটি গ্রহণ করেন: যেখানে হ'ল আপনার মাত্রা সহ ভিন্নতা, হ'ল ডেটার পরিমাণ এবং ব্যান্ডউইথ (আপনি আপনার প্রশ্নে ব্যবহার করেছেন , তাই এটি আমার স্বীকৃতিতে বিভ্রান্ত করবেন না)।σ এন এইচ σ

h=(4/3)1/5σn1/5(6.17)
σnhσ

তিনি যে সাধারণ কেডিএ সূচনাটি ব্যবহার করেন তা হ'ল: যেখানে কার্নেল ফাংশন।কে()

f^(x)=1nhi=1nK(xxih)
K()

0

প্রকৃতপক্ষে, আমি মনে করি আপনি যে পদ্ধতিটি প্রস্তাব করেছেন তাকে সম্ভাব্যতা ঘনত্ব প্লট (পিডিপি) বলা হয় ভূ-বিজ্ঞানে ব্যাপকভাবে ব্যবহৃত হিসাবে, এখানে একটি কাগজ দেখুন: https://www.sciencedirect.com/s ज्ञान/article/pii/S0009254112001878

তবে উপরের কাগজে যেমন উল্লেখ রয়েছে ত্রুটি রয়েছে। যেমন যদি পরিমাপ করা ত্রুটিগুলি ছোট হয় তবে আপনি পিডিএফটিতে স্পাইক পাবেন the তবে কে-ডি-ই-এর মতো পিডিপিকেও মসৃণ করতে পারে, ঠিক যেমন @ গ্লেন_ বি। উল্লেখ করেছেন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.