ইউক্লিডিয়ান দূরত্বের স্কোর এবং মিল


13

আমি কেবল কালেক্টিভ ইন্টেলিজেন্স (টবি সেগারান দ্বারা) বইটি নিয়ে কাজ করছি এবং ইউক্লিডিয়ান দূরত্বের স্কোরটি পেরিয়ে এসেছি। বইটিতে লেখক দেখিয়েছেন যে কীভাবে দুটি প্রস্তাবনা অ্যারে (যেমন মধ্যে সাদৃশ্য গণনা করতে হয় ।person×moviescore)

তিনি হিসাব করে দুই ব্যক্তিদের জন্য ইউক্লিডিয় দূরত্ব এবং দ্বারা পি 2 ডি ( পি 1 , পি 2 ) = √ √p1p2

d(p1,p2)=i  item(sp1sp2)2

এটি আমার কাছে পুরোপুরি উপলব্ধি করে। আমি যা বুঝতে পারি না তা হ'ল তিনি কেন "দূরত্ব ভিত্তিক মিল" পাওয়ার জন্য নীচের শেষে গণনা করেন:

11+d(p1,p2)

সুতরাং, আমি একরকম পেতে পারি যে এটি অবশ্যই দূরত্ব থেকে কোনও মিলের (রূপ?) রূপান্তর হতে হবে। তবে সূত্রটি কেন এমন দেখাচ্ছে? কেউ কি তা ব্যাখ্যা করতে পারেন?


বৈসাদৃশ্য এবং সাদৃশ্যগুলিকে একে অপরের সাথে রূপান্তর করার জন্য অনেকগুলি উপায় থাকতে পারে - নির্দিষ্ট সূত্রটি আপনাকে কী বোঝায় এবং ভবিষ্যতের বিশ্লেষণের জন্য তার উপর নির্ভর করে। সেই পাঠ্যপুস্তকে লেখক কোনও কারণে আপনি যে সূত্রটি দেখিয়েছেন তা পছন্দ করেছেন; অন্যরকম পরিস্থিতিতে অন্য কেউ হয়ত অন্য সূত্রটি বেছে নিতে পারেন। ইউক্লিডিয়ান দূরত্বকে একটি সাদৃশ্য হিসাবে রূপান্তরিত করার জন্য সবচেয়ে জ্যামিতিক সঠিক পদ্ধতিটি উপাত্ত-কেন্দ্রিক অবস্থার অধীনে কোসাইন উপপাদ্য থেকে অনুসরণ করা হবে এবং এখানে সমানভাবে বর্ণনা করা হয়েছে । 1.
ttnphns

ঠিক আছে! তবে আমি যদি সঠিকভাবে বুঝতে পারি আপনি ইউক্লিডিয়ান দূরত্বকে সত্যই রূপান্তরিত করেন না তবে আপনি কেবল একটি ভিন্ন ফাংশন ব্যবহার করেন যা আপনাকে 0 এবং 1 এর মধ্যে মান দেয় (কোস্টিনের কারণে), তাই না? আমার অর্থ এটি সমস্ত দূরত্ব গণনা করা এবং তারপরে এগুলিকে একটি সাদৃশ্য হিসাবে রূপান্তরকরণের চেয়ে পৃথক বলে মনে হচ্ছে উদাহরণস্বরূপ সবচেয়ে ছোট এবং বৃহত্তম দূরত্বের মধ্যে বিভক্ত হয়ে। রাইট?
নেভিগ

আপনার যদি স্কোয়ারড ইউক্লিডিয়ান দূরত্বের বর্গ সমান্তরিত ম্যাট্রিক্স থাকে এবং আপনি এটিতে "ডাবল সেন্টারিং" অপারেশন করেন তবে আপনি স্কেলার পণ্যগুলির ম্যাট্রিক্স পাবেন যা আপনি যখন আপনার কনফিগারেশনের কেন্দ্রে মূল ইউক্যালিডিয়ান স্পেস রাখবেন তখন লক্ষ্য করা হবে অবজেক্ট। এই স্কালে পণ্য হয় কোণ-টাইপ মিল। এরা অনেকটা সমবায়ীদের মতো । এগুলি 0-1-এর সীমার মধ্যে আবদ্ধ নয়, তারা নেতিবাচক, ধনাত্মক হতে পারে এবং তির্যক উপাদানগুলি অগত্যা 1 নয় Still তবুও তারা সাদৃশ্য।
ttnphns

উত্তর:


12

বিপরীতটি হ'ল দূরত্ব থেকে মিলের দিকে পরিবর্তন।

ডিনোমিনেটরে থাকা 1 টি এটি তৈরি করতে হবে যাতে সর্বাধিক মান 1 হয় (যদি দূরত্ব 0 হয়)।

বর্গমূল - আমি নিশ্চিত নই। দূরত্ব সাধারণত 1 এর চেয়ে বেশি হলে, মূলটি বড় দূরত্বকে কম গুরুত্বপূর্ণ করে তোলে; দূরত্ব যদি 1 এর চেয়ে কম হয় তবে এটি বড় দূরত্বকে আরও গুরুত্বপূর্ণ করে তুলবে।


দুঃখিত! স্কোয়ার রুটটি ভুল ছিল। লেখক আসলে এটি দ্বিতীয় সূত্রে রেখেছিলেন তবে প্রথমে এটিকে রেখে গেছেন। সুতরাং এটি সেখানে থাকা উচিত নয়
নেভিগেস করুন

হ্যাঁ, তবে সর্বাধিক মান নির্ধারণের সাথে আপনার ইঙ্গিতটি বোঝায়! ধন্যবাদ!
নেভিগ

4

দূরত্ব এবং মিলটি (শব্দার্থক অর্থে) পরিমাপ করার জন্য প্রথমে যাচাই করা উচিত তা হল আপনি যদি ইউক্যালিডিয়ান স্থানটিতে যাচ্ছেন বা না থাকেন। এটি যাচাই করার একটি অভিজ্ঞতামূলক উপায় হ'ল এক জোড়া মানগুলির দূরত্ব অনুমান করা যার জন্য আপনি অর্থটি জানেন।


1

যেমন আপনি উল্লেখ করেছেন আপনি ইউক্লিডেন্স দূরত্বের গণনা জানেন তাই আমি দ্বিতীয় সূত্রটি ব্যাখ্যা করছি।

ইউক্লিডিয়ান সূত্রটি দূরত্ব গণনা করে, যা লোক বা আইটেমগুলির তুলনায় আরও কম হবে who তারা যদি একই হয় তবে দূরত্ব 0 এবং সম্পূর্ণ আলাদা তবে 0 এর চেয়ে বেশি।

তবে আমাদের এমন একটি ফাংশন প্রয়োজন যা এটির মতো একটি উচ্চতর মান দেয়। ফাংশনে 1 যোগ করে এটি করা যেতে পারে (যাতে আপনি বিভাগ দ্বারা শূন্য ত্রুটি পান না) এবং এটিকে উল্টিয়ে দিয়ে। যদি অক্ষমতা 0 এবং সাদৃশ্য স্কোর 1/1 = 1


আমি এই উত্তর বুঝতে পারি না।
মাইকেল আর চেরনিক

ঠিক আছে যাক আইটেম 1 এবং আইটেম 2 এর মধ্যে ইউক্লিডিয়ান দূরত্ব 4 এবং আইটেম 1 এবং আইটেম 3 এর মধ্যে 0 হয় (এর অর্থ তারা 100% সমান)। এটি ভার্চুয়াল স্পেসে আইটেমের দূরত্ব। দূরত্বের মানটি ছোট হওয়ার অর্থ তারা একে অপরের নিকটে থাকায় এর সাথে সম্ভবত মিল হওয়ার সম্ভাবনা বেশি। এখন আমরা এমন সংখ্যাসূচক মানটি চাই যা এটি যদি অনুরূপ হয় তবে এটি একটি উচ্চতর নম্বর দেয়। সুতরাং আমরা বিপরীত দূরত্ব মান করতে পারেন। তবে আমাদের যদি দূরত্ব থাকে তবে 0 হয় কেন আমরা ডিনোমিনেটরে 1 যুক্ত করি। সুতরাং আইটেম 1 এবং 2 এর জন্য মিলের স্কোর 1 / (1 + 4) = 0.2 এবং আইটেম 1 এবং আইটেম 3 এর জন্য 1 / (1 + 0) = 0
ব্যবহারকারী10009133

হতে পারে আপনি কোনও ধরণের দূরত্ব পরিমাপের কথা বলছেন তবে ইউক্লিডিয়ান দূরত্ব কোনও ভেক্টর স্পেস সম্পর্কিত একটি নির্দিষ্ট সূত্র অনুসরণ করে।
মাইকেল আর চেরনিক 8:38

"দূরত্ব ভিত্তিক মিল" পাওয়ার জন্য আমরা নীচের দিকে গণনা করি কেন তা ব্যাখ্যা করছি: 1/1 1/1+d(p1,p2)
ব্যবহারকারীর 10009133
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.