ব্যবহারের জন্য সেরা দূরত্বের পরিমাপ


12

প্রসঙ্গ

আমার কাছে দুটি সেট ডেটা রয়েছে যা আমি তুলনা করতে চাই। উভয় সেটের প্রতিটি ডেটা উপাদান হ'ল একটি ভেক্টর যার মধ্যে 22 টি কোণ রয়েছে (সমস্ত এবং ) রয়েছে। কোণগুলি একটি প্রদত্ত মানব ভঙ্গি কনফিগারেশনের সাথে সম্পর্কিত, সুতরাং একটি পোজটি 22 টি যৌথ কোণ দ্বারা সংজ্ঞায়িত করা হয়।πππ

আমি শেষ পর্যন্ত যা করার চেষ্টা করছি তা হ'ল দুটি সেট ডেটার "ঘনিষ্ঠতা" নির্ধারণ করে। সুতরাং এক সেটে প্রতিটি পোজের জন্য (22 ডি ভেক্টর), আমি অন্য সেটটিতে এর নিকটতম প্রতিবেশীটি খুঁজতে এবং নিকটতম প্রতিটি জোড়ার জন্য একটি দূরত্বের প্লট তৈরি করতে চাই।

প্রশ্নাবলি

  • আমি কি কেবল ইউক্লিডিয়ান দূরত্ব ব্যবহার করতে পারি?
    • অর্থবহ হতে, আমি ধরে নিয়েছি যে দূরত্বের মেট্রিকটি এই হিসাবে সংজ্ঞায়িত করা দরকার: , যেখানেপরম মান এবং Mod হল মডুলো। তারপর ফলে 22 thetas ব্যবহার করে, আমি মান ইউক্লিডিয় দূরত্ব হিসাব সম্পাদন করতে পারবেন ।| | θ=|θ1θ2|modπ|...|t12+t22++t222
    • এটা কি সঠিক?
  • চি-স্কোয়ার বা ভট্টাচার্য, বা অন্য কোনও মেট্রিকের মতো আর কোনও দূরত্বের মেট্রিক আরও কার্যকর হবে? যদি তা হয় তবে কেন আপনি দয়া করে কিছু অন্তর্দৃষ্টি দিতে পারেন।

3
পার্শ্ব নোট হিসাবে: আমি মনে করি না আপনি বোঝাতে চাইছেন । মত বরং কিছু । |θ1θ2|modπmin{|θ1θ2|,2π|θ1θ2|}
এরিক পি।

4
কোণগুলির সাথে কাজ করার পরিবর্তে আমি প্রথমে ইউনিট-বৃত্তে (x, y) -রকমিনেটে রূপান্তর করার পরামর্শ দিই। তারপরে আপনি সাধারণত (দূরত্ব এবং এর মতো) গণনা করতে পারেন, এবং গড়গুলি কোণগুলির মতো সমস্যা নয় isn't
কারাকাল

2
@ জোশ এরিক পি এর পরামর্শটি ভাল। বিকল্পভাবে, প্রতিটি ইউনিট বৃত্তের একটি কোণকে করুন এবং স্বাভাবিক (পাইথাগোরিয়ান) সূত্র ব্যবহার করে তাদের মধ্যে ইউক্লিডিয়ান দূরত্বগুলি গণনা করুন। এই দূরত্ব এবং কৌণিক দূরত্বগুলির মধ্যে পার্থক্যটির বিষয়টি বিবেচনা করা উচিত নয়। (আমি মনে করেন যে এই কি হতে পারে Caracal প্রস্তাব, অত্যধিক।)θ(cos(θ),sin(θ))
whuber

2
@ জোশ এর গড়, উদাহরণস্বরূপ, এবং হল । । অনেক পরিস্থিতিতে, এটি বোঝা যায় না এবং পরিবর্তে এটি হওয়া উচিত । আপনার নির্দিষ্ট পরিস্থিতিতে, এটি কোনও সমস্যা হতে পারে না কারণ সম্ভবত মানুষের জয়েন্টগুলিতে গত গতি । এছাড়াও, আপনার ক্ষেত্রে, আপনি সম্ভবত পূর্বোক্ত গড় হতে চান যেহেতু যৌথ গতিবেগ এক-দিকনির্দেশক। @ হুইবারের পরামর্শটি হ'ল আমার অর্থ হ'ল। π/47π/4π0ππ
কারাকাল

3
আপনার সমস্যাটি সমাধান করা সম্ভবত খুব সহজ হয়ে যাবে যদি আপনি "এটি ভুল হয়ে যাওয়ার" এর পরিণতি নির্দিষ্ট করতে পারেন। সুতরাং আপনি যদি বলেন ডেটা সেটগুলি একই বা একই রকম, তবে বাস্তবে সেগুলি না হয় তবে আপনার কী হবে? এটি কি আপনার সিদ্ধান্ত "কত ভুল" উপর নির্ভর করবে? আপনি যদি ডেটা / পোজ আলাদা আলাদা ঘোষণা করেন তবে কী ঘটবে তবে সেগুলি আসলে একই বা একই রকম? কি হারিয়ে গেছে? এই প্রশ্নের উত্তরগুলি আপনাকে তুলনা করতে চান তা নির্ধারণ করতে সহায়তা করবে । এটি নিশ্চিত করে যে আপনি সঠিক প্রশ্নের উত্তর দিচ্ছেন।
সম্ভাব্যতাবিরোধী

উত্তর:


5

আপনি প্রতিটি সেটের জন্য কোভেরিয়েন্স ম্যাট্রিক্স গণনা করতে পারেন এবং তারপরে মহালানোবিস দূরত্ব ব্যবহার করে দুটি সেট এর মধ্যে হাউসডর্ফের দূরত্ব গণনা করতে পারেন।

মহালানোবিস দূরত্ব কোনও অচেনা নমুনার সাথে পরিচিত কোনওটির সাদৃশ্য নির্ধারণের একটি কার্যকর উপায়। এটি ইউক্লিডিয়ান দূরত্বের থেকে পৃথক যে এটি ডেটা সেটের পারস্পরিক সম্পর্ককে বিবেচনা করে এবং স্কেল-ইনগ্রেন্টেট is


3

আপনি নিকটতম প্রতিবেশী তথ্য দিয়ে কি করতে চেষ্টা করছেন?

আমি সেই প্রশ্নের উত্তর দেব এবং তারপরে বিভিন্ন দূরত্বের ব্যবস্থাগুলি তুলনা করব।

উদাহরণস্বরূপ, বলুন আপনি যৌথ কনফিগারেশনের উপর ভিত্তি করে পোজগুলিকে শ্রেণিবদ্ধ করার চেষ্টা করছেন এবং একই পোজের যৌথ ভেক্টরগুলি একসাথে থাকতে চান। বিভিন্ন দূরত্বের মেট্রিকগুলির উপযুক্ততার মূল্যায়ন করার একটি সহজ উপায় হ'ল এগুলির প্রত্যেককে কেএনএন শ্রেণিবদ্ধে ব্যবহার করা এবং ফলাফলগুলির প্রতিটি মডেলের আউট-অফ-স্যাম্পল যথার্থতার তুলনা করা।


2

এটি শোনাচ্ছে যে এটি তথ্য পুনরুদ্ধার (আইআর) এর একটি নির্দিষ্ট প্রয়োগের মতো। কয়েক বছর আগে আমি গেইট স্বীকৃতি সম্পর্কে এমন একটি আলাপে অংশ নিয়েছি যা আপনি যা করছেন তার মতোই লাগে। তথ্য পুনরুদ্ধারে, "নথিগুলি" (আপনার ক্ষেত্রে: কোনও ব্যক্তির অ্যাঙ্গেল ডেটা) কিছু প্রশ্নের সাথে তুলনা করা হয় (যা আপনার ক্ষেত্রে "" এমন কোনও ব্যক্তি রয়েছে যার মধ্যে কোণের ডেটা (.., ..) ") থাকে। তারপরে নথিগুলি একটির ক্রমে তালিকাভুক্ত করা হয় যা সবচেয়ে কমের সাথে মিলে যায় তার সাথে সবচেয়ে নিচের দিকে মেলে। এর পরিবর্তে, এর অর্থ হ'ল আইআর এর একটি কেন্দ্রীয় উপাদান কোনও প্রকার ভেক্টর স্পেসে কোনও দস্তাবেজ স্থাপন করছে (আপনার ক্ষেত্রে: কোণ স্থান) এবং এটি একটি নির্দিষ্ট ক্যোয়ারী বা উদাহরণ নথির সাথে তুলনা করে বা তাদের দূরত্ব পরিমাপ করছে। (নীচে দেখুন) আপনার যদি দুটি পৃথক ভেক্টরের মধ্যকার দূরত্বের শব্দ সংজ্ঞা থাকে, আপনাকে যা করতে হবে তা হ'ল দুটি ডেটা সেটের দূরত্বের জন্য একটি পরিমাপ করা হচ্ছে। (Iতিহ্যগতভাবে আইআর তে ভেক্টর স্পেস মডেলের দূরত্বটি কোসাইন পরিমাপ বা ইউক্লিডিয়ান দূরত্ব দ্বারা গণনা করা হয় তবে আমি মনে করি না তারা কীভাবে এ ক্ষেত্রে এটি করেছিল।) আইআর-তে "প্রাসঙ্গিকতা প্রতিক্রিয়া" নামক একটি প্রক্রিয়াও রয়েছে, ধারণাটি অনুসারে , দুটি সেট নথির দূরত্ব নিয়ে কাজ করে। সেই প্রক্রিয়াটি সাধারণত দূরত্বের একটি পরিমাপ ব্যবহার করে যা সমস্ত দস্তাবেজগুলির (বা আপনার ক্ষেত্রে: ব্যক্তি ভেক্টর) এর মধ্যে সমস্ত স্বতন্ত্র দূরত্বের যোগফলকে সামঞ্জস্য করে। সম্ভবত এটি আপনার কাজে আসবে।

নিম্নলিখিত পৃষ্ঠায় কিছু কাগজপত্র রয়েছে যা আপনার সমস্যার সাথে প্রাসঙ্গিক বলে মনে হচ্ছে: http://www.mpi-inf.mpg.de/~mmueller/index_publications.html বিশেষত এটি একটি http://www.mpi-inf.mpg.de/ ~ মিমুয়েলার / প্রকাশনা / 2006_ডেমুথরোয়েডর মিউলার ইবারহার্ড_মোক্যাপপ্রিটারিওয়ালি সিস্টেম_সিআইআর.পিডিএফ আকর্ষণীয় বলে মনে হচ্ছে। মুলারের যে আলোচনায় আমি অংশ নিয়েছি তাতে কোভার এবং গ্লাইচারের "পয়েন্ট ক্লাউড" নামে একটি মিল রয়েছে বলে উল্লেখ করা হয়েছে (দেখুন http://portal.acm.org/citation.cfm?id=1186562.1015760&coll=DL&dl=ACM ) এবং একটি "কোয়ার্টারিয়নস" নামে পরিচিত । আশা করি এটা সাহায্য করবে.


আপনি যদি এটি সন্ধান করতে সক্ষম হন তবে রেফারেন্সটি পাওয়া দরকারী হবে। ধন্যবাদ।
জোশ

2

এই সমস্যাটিকে বলা হয় দূরত্বের মেট্রিক লার্নিং। প্রতিটি দূরত্বের মেট্রিককে represented হিসাবে উপস্থাপন করা যেতে পারে যেখানে ইতিবাচক আধা-সুনির্দিষ্ট। এই উপ-অঞ্চলের অধীনে পদ্ধতিগুলি, আপনার ডেটার জন্য অনুকূল শিখুন । বস্তুত, যদি অনুকূল একটি পরিচয় ম্যাট্রিক্স হতে হবে, এটা ঠিক আছে ইউক্লিডিয় দুরুত্ব ব্যবহার করা হয়। যদি এটি বিপরীতমুখী সম্প্রদায় হয় তবে এটি মহালানোবিস দূরত্ব এবং আরও অনেক কিছু ব্যবহার করাই অনুকূল হবে। সুতরাং, সঠিক দূরত্বের মেট্রিক শিখতে অনুকূল শিখতে অবশ্যই একটি দূরত্বের মেট্রিক শেখার পদ্ধতি ব্যবহার করা উচিত । একটিএকটিএকটিএকটি(xy)tA(xy)AAAA


0

আকৃতির জন্য প্রক্সি হিসাবে কোণগুলি ব্যবহার করার একটি সমস্যা হ'ল কোণগুলিতে ক্ষুদ্র ক্ষুদ্রাকৃতির ফলে আকারে বৃহত্তর বিশৃঙ্খলা হতে পারে। আরও, বিভিন্ন কোণ কনফিগারেশনের ফলে একই (বা অনুরূপ) আকার হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.