ক্লাস্টারিংয়ের জন্য


14

কেউ কি এল 2 এর পরিবর্তে ক্লাস্টারিংয়ের জন্য বা এল .5 মেট্রিক ব্যবহার করেন ? অগ্রগাল এট আল।, উচ্চ মাত্রিক স্থানের দূরত্বের মেট্রিকগুলির বিস্ময়কর আচরণ সম্পর্কে তিনি বলেছিলেন (2001 সালে) এটিL1L.5L2

উচ্চতর মাত্রিক ডেটা মাইনিং অ্যাপ্লিকেশনগুলির জন্যইউক্লিডিয়ান দূরত্বের মেট্রিক এল 2 এরপরে L 1 ধারাবাহিকভাবে আরও বেশি পছন্দসই L1L2

এবং দাবি করেছে যে বা এল .1 আরও ভাল হতে পারে।L.5L.1

বা এল .5 ব্যবহারের কারণগুলি তাত্ত্বিক বা পরীক্ষামূলক হতে পারে, যেমন, বিদেশী / কাবনের কাগজপত্রের প্রতি সংবেদনশীলতা বা আসল বা সিন্থেটিক ডেটাতে চালিত প্রোগ্রামগুলি (পুনরুত্পাদনযোগ্য দয়া করে)। একটি উদাহরণ বা একটি ছবি আমার সাধারণ মানুষের অন্তর্দৃষ্টি সাহায্য করবে।L1L.5

এই প্রশ্নটি বব ডুরান্টের জবাব -যখন-নিকট-নিকটবর্তী-প্রতিবেশী-অর্থবহ-আজকের উত্তর অনুসরণ করে । যেমনটি তিনি বলেছেন, পছন্দটি ডেটা এবং অ্যাপ্লিকেশন নির্ভর উভয়ই হবে; তবুও, বাস্তব অভিজ্ঞতার রিপোর্টগুলি কার্যকর হবে।p


নোট যোগ হয়েছে মঙ্গলবার 7 জুন:

আমি "এল 1-আদর্শ এবং সম্পর্কিত পদ্ধতির উপর ভিত্তি করে পরিসংখ্যানগত ডেটা বিশ্লেষণ" জুড়ে হোঁচট খেয়েছি, ডজ এড।, 2002, 454 পি, আইএসবিএন 3764369205 - কয়েক ডজন সম্মেলনের কাগজপত্র।

আইড এক্সফেনশনাল বৈশিষ্ট্যগুলির জন্য কি কেউ দূরত্বের ঘনত্ব বিশ্লেষণ করতে পারে? ক্ষয়ক্ষতির একটি কারণ হ'ল ; আরেকটি (অ-বিশেষজ্ঞ) হ'ল এটি সর্বোচ্চ-এনট্রপি বিতরণ 0; তৃতীয়টি হ'ল কিছু আসল ডেটা সেট, বিশেষত এসআইএফটি-তে মোটামুটি ঘনিষ্ঠ হয়।|expexp|exp


এটি উল্লেখ করা গুরুত্বপূর্ণ যে আগরওয়াল এট আল। সেই নির্দিষ্ট নিবন্ধে যেখানে ক্লাস্টারিং, নিকটতম প্রতিবেশী এবং সূচীকরণের মতো সমস্যায় আচরণের সন্ধান করা । Lp
Deps_stats

আপনি সম্ভবত ফাংশনগুলির জন্য এল পি এর চেয়ে অনুক্রমের জন্য মেট্রিকগুলি বোঝাতে চেয়েছিলেন ? আমার মতে, যদি কোনও অপ্টিমাইজেশন মানদণ্ড থাকে তবে সমস্যাটিকে এটি অনুকূলিতকরণের সমাধান করা যেতে পারে। থাম্বস এর নিয়ম সাধারণত এর সঠিক সমাধানের সাথে সম্পর্কিত হবে। যাইহোক, বোনা দ্রবণটির বৈশিষ্ট্যগুলি পছন্দ করা সম্পর্কে ভাবার চেষ্টা করুন। আমি নিবন্ধগুলি পড়ার পরে সম্ভবত এই বিষয়টিতে আরও কিছু বলতে পারে। lpLp
দিমিত্রিজ সেলভ

@ ডেপস_স্ট্যাটস, হ্যাঁ, ধন্যবাদ; শিরোনাম এবং প্রথম লাইন পরিবর্তন। @ দিমিত্রিজ, ১) হ্যাঁ লিটল-এল কঠোরভাবে সঠিকভাবে কথা বলছেন, তবে বড়-এল সাধারণ এবং বোধগম্য। 2) হ্যাঁ একটি প্রদত্ত সমস্যার জন্য একটি অনুকূল পি খুঁজে পেতে পারেন, তবে আপনার প্রথম পছন্দটি কী এবং কেন?
ডেনিস

উত্তর:


6

এখানে কীটি কাগজের উল্লেখগুলি "মাত্রিকতার অভিশাপ" বোঝা। উইকিপিডিয়া থেকে: যখন মাত্রার সংখ্যা খুব বড় হয়,

প্রায় সমস্ত উচ্চ-মাত্রিক স্থানটি কেন্দ্র থেকে "দূরে", বা, এটি অন্য উপায়ে বলতে গেলে উচ্চ মাত্রিক ইউনিটের স্থানটি প্রায় কোনওভাবেই হাইপারকিউবের "কোণগুলি" নিয়ে গঠিত বলে বলা যেতে পারে can "মধ্যম"

ফলস্বরূপ, কোন পয়েন্টগুলি কোন অন্যান্য পয়েন্টের নিকটে রয়েছে তা ভেবে চিন্তিত হতে শুরু করে, কারণ সেগুলি কমবেশি অনেক দূরে। আপনার প্রথম লিঙ্কে লিঙ্ক করা এই সমস্যা।

উচ্চ পি সহ সমস্যাটি এটি বৃহত্তর মানগুলিকে জোর দেয় - পাঁচটি স্কোয়ার এবং চার স্কোয়ার নয়টি ইউনিট আলাদা, তবে একটি স্কোয়ার এবং দুটি স্কোয়ার কেবল তিনটি ইউনিট পৃথক। সুতরাং বৃহত্তর মাত্রা (কোণগুলির জিনিসগুলি) সবকিছুতে আধিপত্য বিস্তার করে এবং আপনি তার বিপরীতে হারাতে পারেন। সুতরাং বড় দূরত্বের এই মুদ্রাস্ফীতিটি আপনি এড়াতে চান। একটি ভগ্নাংশ পি সহ, জোর ছোট মাত্রাগুলি - যে মাত্রাগুলির মধ্যে অন্তর্বর্তী মান রয়েছে - যা আপনাকে আরও বিপরীতে দেয় তার মধ্যে পার্থক্যের উপর জোর দেওয়া হয়।


(+1) সুতরাং @ ডেভিড, সাধারণভাবে কি এমন একটি মাপদণ্ড রয়েছে যা বিপরীতে মানের বর্ণনা করে?
দিমিত্রিজ সেলভ

দেখে মনে হচ্ছে আপনার প্রথম লিঙ্কটি লিঙ্ক করা সর্বাধিক দূরত্ব বিয়োগ সর্বনিম্ন দূরত্বের পরামর্শ দেয়। আরও ভাল উপায় থাকতে পারে, যদিও।
ডেভিড জে হ্যারিস

ভাল পরিষ্কার অন্তর্দৃষ্টি, +1 (যদিও কোণগুলি দূরত্ব বিতরণে রয়েছে তা পরিষ্কার নয়)। আপনি কি বাস্তব ডেটাতে বা এল .5 ব্যবহার করেছেন ? L1L.5
ডেনিস

1
@ ডেনিস ধন্যবাদ! আমি মনে করি যদি কোটা বিট সর্বাধিক বোধ করে তবে ডেটা সীমিত বা সমস্ত মাত্রা সীমিত থাকে। যাইহোক, আমি আশঙ্কা করছি আপনার কাছে আলাদা আলাদা মেট্রিক্স সম্পর্কে ভাল ধারণা পেতে আমার কাছে ক্লাস্টারিংয়ের পর্যাপ্ত অভিজ্ঞতা নেই। বিরক্তিকর হিসাবে, সর্বোত্তম পদ্ধতির হতে পারে কয়েক চেষ্টা করে দেখুন এবং কী ঘটে
ডেভিড জে হ্যারিস

1

1 এবং 5 এর মধ্যে পি সহ এলপি মেট্রিক ব্যবহার করে এমন একটি কাগজ রয়েছে যা আপনি একবার দেখতে চান:

আমোরিম, আরসি এবং মিরকিন, বি।, মিনকোভস্কি মেট্রিক, ফিচার ওয়েটিং এবং অ্যানোমালাস ক্লাস্টার ইনিশিয়েশন ইন কে-ম্যানস ক্লাস্টারিং, প্যাটার্ন রিকগনিশন, খণ্ড। 45 (3), পিপি 1061-1075, 2012

ডাউনলোড, https://www.researchgate.net/publication/232282003_ কর্তৃপক্ষের_পরিষদ_কোপি_মিনকোভস্কি_মেট্রিক_ফেটের_ওয়েটিং_অ্যান্ড_অ্যানোম্যালাস_ক্লাস্টার_নিটিয়ালাইজিং_ইন_কে-মানে_ক্লাস্টারিং / ফাইল / d912f508115a040b45.pdff


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.