কেউ কি এল 2 এর পরিবর্তে ক্লাস্টারিংয়ের জন্য বা এল .5 মেট্রিক ব্যবহার করেন ?
অগ্রগাল এট আল।,
উচ্চ মাত্রিক স্থানের দূরত্বের মেট্রিকগুলির বিস্ময়কর আচরণ সম্পর্কে
তিনি বলেছিলেন (2001 সালে) এটি
উচ্চতর মাত্রিক ডেটা মাইনিং অ্যাপ্লিকেশনগুলির জন্যইউক্লিডিয়ান দূরত্বের মেট্রিক এল 2 এরপরে L 1 ধারাবাহিকভাবে আরও বেশি পছন্দসই
এবং দাবি করেছে যে বা এল .1 আরও ভাল হতে পারে।
বা এল .5 ব্যবহারের কারণগুলি তাত্ত্বিক বা পরীক্ষামূলক হতে পারে, যেমন, বিদেশী / কাবনের কাগজপত্রের প্রতি সংবেদনশীলতা বা আসল বা সিন্থেটিক ডেটাতে চালিত প্রোগ্রামগুলি (পুনরুত্পাদনযোগ্য দয়া করে)। একটি উদাহরণ বা একটি ছবি আমার সাধারণ মানুষের অন্তর্দৃষ্টি সাহায্য করবে।
এই প্রশ্নটি বব ডুরান্টের জবাব -যখন-নিকট-নিকটবর্তী-প্রতিবেশী-অর্থবহ-আজকের উত্তর অনুসরণ করে । যেমনটি তিনি বলেছেন, পছন্দটি ডেটা এবং অ্যাপ্লিকেশন নির্ভর উভয়ই হবে; তবুও, বাস্তব অভিজ্ঞতার রিপোর্টগুলি কার্যকর হবে।
নোট যোগ হয়েছে মঙ্গলবার 7 জুন:
আমি "এল 1-আদর্শ এবং সম্পর্কিত পদ্ধতির উপর ভিত্তি করে পরিসংখ্যানগত ডেটা বিশ্লেষণ" জুড়ে হোঁচট খেয়েছি, ডজ এড।, 2002, 454 পি, আইএসবিএন 3764369205 - কয়েক ডজন সম্মেলনের কাগজপত্র।
আইড এক্সফেনশনাল বৈশিষ্ট্যগুলির জন্য কি কেউ দূরত্বের ঘনত্ব বিশ্লেষণ করতে পারে? ক্ষয়ক্ষতির একটি কারণ হ'ল ; আরেকটি (অ-বিশেষজ্ঞ) হ'ল এটি সর্বোচ্চ-এনট্রপি বিতরণ ≥ 0; তৃতীয়টি হ'ল কিছু আসল ডেটা সেট, বিশেষত এসআইএফটি-তে মোটামুটি ঘনিষ্ঠ হয়।