আজ "নিকটতম নিকটবর্তী" অর্থবহ, কখন?


19

1999 সালে, বায়ার এট আল। জিজ্ঞাসা করা হয়েছে, "নিকটতম নিকটবর্তী" কখন অর্থবহ?

1999 সাল থেকে এনএন অনুসন্ধানে দূরত্বের সমতলতার প্রভাব বিশ্লেষণ ও চাক্ষুষ করার আরও ভাল উপায় আছে?

[প্রদত্ত] ডেটা সেটটি কী 1-এনএন সমস্যার সদর্থক উত্তর সরবরাহ করে? 10-এনএন সমস্যা? 100-এনএন সমস্যা?

আপনি কীভাবে বিশেষজ্ঞরা আজ এই প্রশ্নের কাছে যাবেন?


সোমবার 24 জানুয়ারী সম্পাদনা:

"ক্রমবর্ধমান মাত্রার সাথে দূরত্বের সমতলতা" এর একটি সংক্ষিপ্ত নাম হিসাবে "দূরত্ব হোয়াইটআউট" কীভাবে?

"দূরত্ব হোয়াইটআউট" দেখার সহজ উপায় হ'ল 2-এনএন চালানো এবং নিকটবর্তী প্রতিবেশী এবং দ্বিতীয়-নিকটবর্তী প্রতিবেশীদের কাছে দূরত্বের প্লট করা। নীচের প্লটটি মন্টি কার্লো দ্বারা নির্মিত বিভিন্ন এনক্লাস্টার এবং মাত্রার জন্য ডিস্ট 1 এবং ডিস্ট 2 দেখায় । এই উদাহরণটি পরিমাপকৃত নিরঙ্কুশ পার্থক্যের জন্য বেশ ভাল দূরত্বের বিপরীতে দেখায় | দ্বি 2 - ডিস্ট 1 | (আপেক্ষিক পার্থক্য | দ্বি 2 / ডিস্ট 1 | → 1 মাত্রা হিসাবে → ∞, তাই অকেজো হয়ে যান))

নিখুঁত ত্রুটি বা আপেক্ষিক ত্রুটি কোনও নির্দিষ্ট প্রসঙ্গে ব্যবহার করা উচিত কিনা তা অবশ্যই "আসল" শব্দটির উপর নির্ভর করে: কঠিন।

পরামর্শ: সর্বদা 2-NN চালান; 2 প্রতিবেশী যখন তাদের কাছাকাছি থাকে তখন দরকারী এবং যখন না তখন দরকারী।

এখানে চিত্র বর্ণনা লিখুন


7
বায়ার ইত্যাদি। মনে হচ্ছে এনএন সমস্যার কিছুটা আলাদা দিক বিবেচনা করা হচ্ছে। তবে, (বাইনারি) শ্রেণিবিন্যাসের উদ্দেশ্যে, হালকা পরিস্থিতিতে, 1-এনএন শ্রেণিবিন্যাস সবচেয়ে খারাপ ক্ষেত্রে , বেয়েসের ত্রুটি হওয়ার সম্ভাবনার দ্বিগুণ (যেমন, অনুকূল) শ্রেণিবদ্ধকে অসম্পূর্ণভাবে দ্বিগুণ করেছে a অন্য কথায়, প্রথম নিকটবর্তী প্রতিবেশী সেরা শ্রেণিবদ্ধকারীর হিসাবে লক্ষ্যটির লেবেল সম্পর্কে "কমপক্ষে অর্ধেক তথ্য" থাকে। এই অর্থে, 1-এনএন বেশ প্রাসঙ্গিক বলে মনে হচ্ছে। (। কভার এবং আরো অনেক জন্য হার্ট (1967) দেখুন আমি বিস্মিত বেয়ার এট এটা উদ্ধৃত করা হয়নি।।)
অঙ্কবাচক

@ কার্ডিনাল, কভার-হার্টের আবদ্ধতা আদৌ মাত্রার উপর নির্ভর করে না বলে মনে হচ্ছে, আপনি অন্য দিকটি বলে?
ডেনিস

হ্যাঁ আমি বিশ্বাস করি এটি সত্য এবং এটি বেশিরভাগ ক্ষেত্রে এটি সামনে আনার ক্ষেত্রে আমার বক্তব্য। 1-এনএন সেই অর্থে যথেষ্ট প্রাসঙ্গিক বলে মনে হচ্ছে, অর্থাত্ এটি বৈশিষ্ট্যের জায়গার মাত্রায় একইভাবে (তাত্ত্বিকভাবে) কার্যকরভাবে কাজ করে (মনে হয়) মনে হয় এটি নিকটবর্তী এবং এর আচরণ নির্বিশেষে তার নিজস্ব অবস্থানে দাঁড়িয়ে থাকতে সহায়তা করে seems সবচেয়ে দূরবর্তী প্রতিবেশী একটি বৃহত মাত্রিক জায়গায়। এটি আমাকে বিস্মিত করে তোলে যে বায়ার এই (শাস্ত্রীয়) ফলাফলের সমস্ত বিষয়ে সচেতন ছিলেন কিনা।
কার্ডিনাল

@ কার্ডিনাল কভার এবং হার্টের 24 পৃষ্ঠার শীর্ষস্থানটি এমন এক জায়গার মতো দেখায় যেখানে সম্ভাব্যভাবে তাদের প্রুফের মধ্যে একটি সমস্যা দেখা দিতে পারে যেখানে কভার এবং হার্ট যুক্তি দেয় যে এক্স-এর প্রতিটি আরভি এক্স-এ সম্পত্তি রয়েছে যা এক্স সম্পর্কে প্রতিটি খোলা গোলক রয়েছে অ-শূন্য পরিমাপ যদি আমরা হাইপারস্ফিয়ারের জ্যামিতিটি বিবেচনা করি তবে আমরা দেখতে পাই যে হাইপারস্ফিয়ারের অভ্যন্তরের আয়তন ক্রমবর্ধমান মাত্রার সাথে সঙ্কুচিত হয় তাই সীমাতে, এক্স সম্পর্কে খোলা বলটি তার অভ্যন্তরে কেবলমাত্র x থাকে। বিকল্পভাবে, এসএলএলএন এর মাধ্যমে, মেট্রিক স্পেস এক্স-এর আইড আরভিএস এক্স সমস্ত সম্ভাব্যতা সহ হাইপারস্পিয়ারের পৃষ্ঠে থাকে।
বব ডুরান্ট

উত্তর:


10

এই প্রশ্নের পুরো উত্তর আমার কাছে নেই তবে আমি বিশ্লেষণাত্মক কিছু দিক নিয়ে আংশিক উত্তর দিতে পারি। সতর্কতা: আমি নীচের প্রথম কাগজ থেকে অন্যান্য সমস্যার জন্য কাজ করে যাচ্ছি, সুতরাং সেখানে খুব ভাল অন্যান্য জিনিস রয়েছে যা আমি অবগত নই it's

প্রথমে আমি মনে করি যে তাদের কাগজের শিরোনাম "কখন নিকটতম প্রতিবেশী" অর্থবহ আছে "সত্ত্বেও, বায়ার এট আল আসলে একটি আলাদা প্রশ্নের উত্তর দিয়েছিলেন, যখন এনএন অর্থবহ হয় না । নমুনার আকারের উপর কিছু অতিরিক্ত হালকা অনুমানের অধীনে আমরা যখন তাদের নিকটবর্তী নিকটবর্তী হ'ল অর্থবহ: একটি রূপান্তর উপপাদ্য এবং প্রভাবগুলি আমরা তাদের উপপাদকের সাথে কথোপকথনটি প্রমাণ করেছি । জটিলতার জার্নাল, 25 (4), আগস্ট 2009, পিপি 385-397।এবং দেখিয়েছেন যে এমন পরিস্থিতি রয়েছে যখন (তত্ত্ব অনুসারে) দূরত্বের ঘনত্ব উত্থিত হবে না (আমরা উদাহরণ দিই, তবে সংক্ষেপে নন-নয়েজ বৈশিষ্ট্যের সংখ্যাটি মাত্রিকতার সাথে বাড়তে হবে যাতে অবশ্যই তারা অনুশীলনে খুব কমই দেখা দেয়)। আমাদের কাগজে উদ্ধৃত 1 এবং 7 উল্লেখগুলি অনুশীলনে দূরত্বের ঘনত্বকে হ্রাস করা যায় এমন কয়েকটি উপায়ের উদাহরণ দেয়।

আমার তত্ত্বাবধায়ক, আতা কাবনের একটি কাগজ অন ডিস্টেন্স কনসেন্ট্রেশন অ্যারনেস অফ নির্দিষ্ট ডেটা কমানোর কৌশলগুলিতে মাত্রিকতা হ্রাস কৌশলগুলি প্রয়োগ করেও এই দূরত্বের ঘনত্বের সমস্যাগুলি অবিচলিত আছে কিনা তা দেখে প্যাটার্ন স্বীকৃতি. ভোল। 44, ইস্যু 2, ফেব্রুয়ারী 2011, পিপি 265-65। । সেখানেও কিছু সুন্দর আলোচনা আছে।


ধন্যবাদ বব, +1 একটি সম্পর্কিত প্রশ্ন, ভগ্নাংশ-মেট্রিক কিউয়ের মান বাছাই করার জন্য আপনার কি থাম্বের নিয়ম থাকবে (অথবা আমি এটি আলাদা প্রশ্ন হিসাবে জিজ্ঞাসা করব)?
ডেনিস

কুই=1/পিপি>1পি0পি=11কুই=1/পিপি>1পি

Σ|একটি-|কুই1/কুই<কুই<

পি

3

আপনি পাশাপাশি গোল্ডবার্গার এট আল দ্বারা প্রতিবেশী উপাদানগুলির বিশ্লেষণে আগ্রহী হতে পারেন ।

এখানে, একটি লিনিয়ার ট্রান্সফর্মেশনটি স্টোকাস্টিক নিকটবর্তী প্রতিবেশ নির্বাচনের মাধ্যমে প্রত্যাশিত সঠিকভাবে শ্রেণিবদ্ধ পয়েন্টগুলি সর্বাধিক করতে শিখেছে।

পার্শ্ব প্রতিক্রিয়া হিসাবে প্রতিবেশীদের (প্রত্যাশিত) সংখ্যা ডেটা থেকে নির্ধারিত হয়।


ধন্যবাদ বায়ার দেখে মনে হচ্ছে "দূরত্বের মেট্রিক শেখার" গুরম্নত্ব পেয়েছে - ২০০৮ সাল থেকে শিক্ষাগত.গুতে 50 টি শিরোনাম রয়েছে But তবে কি বুম পেপার, নাকি আসল ব্যবহার? পাদটীকা, এনসিএর কোডটি "পুনরাবৃত্তি ... কমপক্ষে ভাল ফলাফলের জন্য কমপক্ষে 100000" বলেছে। পাদটীকা 2, দূরত্বের মেট্রিক শিক্ষার বেশিরভাগ কাজ মনে হয় একটি মহালানোবিসের দূরত্বকে মডেল করে; আপনি অন্যান্য দূরত্ব মডেল সম্পর্কে জানতে হবে?
ডেনিস

এনসিএর সাথে আমার বিভিন্ন অভিজ্ঞতা রয়েছে - এটি সাধারণত আমার জন্য বেশ তাত্ক্ষণিকভাবে রূপান্তরিত করে। চেকআউটটি "লেআকুনের দ্বারা ইনভেরিয়েন্ট ম্যাপিং শেখার মাধ্যমে মাত্রিকতা হ্রাস" এবং নরওজি দ্বারা "কমপ্যাক্ট বাইনারি কোডগুলির জন্য ন্যূনতম ক্ষতি হ্যাশিং" Check
বায়ারজ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.