বুলিয়ান অনুসন্ধান ব্যাখ্যা করা হয়েছে


29

আমার মা প্রকারের গ্রন্থাগারিক হওয়ার জন্য কিছু অনলাইন কোর্স নিচ্ছেন, এই কোর্সে তারা বুলিয়ান অনুসন্ধানগুলি কভার করে, যাতে তারা দক্ষতার সাথে ডাটাবেসগুলি অনুসন্ধান করতে পারে তবে যাইহোক, তিনি এই জাতীয় কিছু শুনে একটি প্রশ্ন পেয়েছিলেন:

"X বা y" অনুসন্ধানের ফলে 105 000 হিট হবে, কেবলমাত্র এক্সের অনুসন্ধানের ফলে 80 000 হিট হবে এবং কেবল y এর অনুসন্ধানে 35 000 হিট পাওয়া যাবে। যখন সম্মিলিত পৃথক অনুসন্ধানগুলি 115 000 হিট দেয় তখন কেন "x বা y" অনুসন্ধানটি 105 000 হিট দেয়?

আমার কাছে এটি অদ্ভুত লাগছিল, তাই বেকন এবং স্যান্ডউইচ শব্দটি ব্যবহার করে আমি নিজেই এটি পরীক্ষা করেছি ।

  • শুধু বেকন পাওয়া 179 000 000 ফলাফল
  • শুধুমাত্র স্যান্ডউইচ 312 000 000 ফলাফল পেয়েছে
  • বেকন বা স্যান্ডউইচ দিয়েছেন 491 000 000 ফলাফল

তবে আমার জন্য এটি যুক্ত হয়েছে: 179 000 000 (বেকন) + 312 000 000 (স্যান্ডউইচ) = 491 000 000 (বেকন বা স্যান্ডউইচ)

কেন একটি ও কোয়েরির ফলাফল দুটি মিলিয়ে পৃথক প্রশ্নের তুলনায় কম হিট হতে পারে?


22
আপনার কাছে একটি নীল কুকুর, নীল বিড়াল এবং লাল বিড়াল। (ব্লু) এর সংখ্যা = 2, (ক্যাট) এর সংখ্যা = 2, তবে
সংখ্যাটি

11
আমি এটি চেষ্টা করেছিলাম, বেকনের জন্য 184 মিলিয়ন ফলাফল পেয়েছি। স্যান্ডউইচগুলি অনুসন্ধান করার জন্য এটি কখনও তৈরি করেনি, আমি তত্ক্ষণাত নিজেকে কিছু বেকন ভাজি রেখেছিলাম।
কর্সিকা

15
আমি মনে করি এখানে আসল সমস্যাটি হ'ল আপনার ডাটাবেসে কোনও বেকন স্যান্ডউইচ নেই।
মুজবয়েস 4:46

@ মুজবয়েস হ্যাঁ, এই কারণেই আমার সংখ্যা যুক্ত হতে হবে, যেহেতু তাদের উচিত নয়, তাই না?
sch

3
@ কেএলএসকেএল: আপনি যদি গুগল থেকে এই নম্বরগুলি পেয়ে থাকেন তবে মনে রাখবেন এই সংখ্যাগুলি খুব রুক্ষ অনুমান। এটি খুব ভাল ক্ষেত্রে হতে পারে যে, "বেকন ওআর স্যান্ডউইচ" এর অনুমান পাওয়ার জন্য তারা কেবল সংখ্যার যোগফল দেয়। এটি কেবলমাত্র কাজ করে কারণ প্রাক্কলনটিতে কোনও ধরণের নির্ভুলতা থাকা দরকার না।
ব্লুরাজা - ড্যানি পিফ্লুঘুফ্ট

উত্তর:


62

ইঙ্গিত: এক্স এবং y এর অনুসন্ধানের ফলে 10 000 হিট হবে।


হ্যাঁ, তবে এটিই বিন্দুর পাশে, শিক্ষকরা দাবি করেছেন যে তাদের এক্স বা ওয়াই অনুসন্ধানের জন্য এক্স আলাদাভাবে অনুসন্ধানের হিটগুলির সংমিশ্রণের চেয়ে কম হিট দেয়
sch

63
না, এটি বিন্দু পাশে নেই। বিপরীতে, এটি পয়েন্ট নিজেই।
যুবাল ফিল্মাস

আমি এই নতুন, বিস্তারিত যত্ন? আমি যা বুঝতে পেরেছি এবং সেগুলি উভয় শব্দের সাথে ফলাফল দেবে, সুতরাং স্বতন্ত্রভাবে প্রতিটিের চেয়ে কম ফলাফল, তবে ওআর এর সাথে কী করার আছে?
sch

2
যখন AND খালি থাকে বা ADD এর মতো কাজ করে, অন্যথায় এটি হয় না। @ Klskl এক্স এবং ওয়াইয়ের তথ্য অত্যন্ত গুরুত্বপূর্ণ।
খারাপ

@ ইউভাল ফিল্মাস আমি এখন দেখছি, এটিই মূল বিষয়! (আমি ছিলাম, হ্যামবার্গার এবং স্যান্ডউইচ 10 000 হিট দেয় না ...) আপনাকে ধন্যবাদ
sch

93

এখানে প্রযোজ্য গণনা নীতিটি অন্তর্ভুক্তি-বর্জন

|XY|=|X|+|Y||XY|

সংখ্যাগুলি কার্যকর করার জন্য,10000 হতে হবে।|XY|

ভেন চিত্রটি এমন কাউকে বেশি দৃinc়প্রত্যয়ী হতে পারে যাকে স্বরলিপি দ্বারা ভয় দেখানো যেতে পারে।

ভেন ডায়াগ্রাম


4
এটি সত্যিই ভাল, এটি আমার মাকে বোঝাতে ব্যবহার করবে, সত্যিই পরিষ্কার, ধন্যবাদ!
sch

3
আমি আপনার চিত্রটি কিছুটা প্রসারিত করব এবং কারণটিকারণউভয়েরই একটি অংশএবংইতিমধ্যে, সুতরাং আপনি যখন যোগ করুন, আপনি এটি দুটি বার গণনা করেছেন। তারপরে আপনি এটিকে বিয়োগ করুন যাতে এটি একবারে গণনা করা হয়। | এক্স ওয়াই | | এক্স | | ওয়াই | | এক্স | + | ওয়াই ||XY|=|X|+|Y||XY||XY||X||Y||X|+|Y|
ডিভসম্যান

গণিতটি কার্যকর হয় এবং এটি উপলব্ধি করে, তবে এটির ঠিক উপরে সেটটি বীজগণিতের সাথে মেলে না।
কেভিন ব্রাউন

আমার মনে আছে ভেন ডায়াগ্রামগুলি যখন আমি 4-5-এ ছিলাম। তারা সত্যিই আন্ডাররেটেড হয়। আপনাকে ধন্যবাদ জন ভেন
ফারাপ

1
@ ফারাপ প্রকৃতপক্ষে, এই জাতীয় চিত্রগুলি আমাদের ভেন-ইরাশন প্রাপ্য।
ম্যাসন হুইলার

13

নথি 1: বিড়ালটি টেবিলে রয়েছে
নথি 2: আমার বিড়াল কালো
নথি 3: কুকুরটি টেবিলের নিচে রয়েছে
নথি 4: আপনার বিড়ালের নাম কী?
নথি 5: এটি একটি কালো এবং সাদা ছবি

জন্য অনুসন্ধান করুন বিড়াল : ফিরে নথি 1,2,4 (3 নথি ফেরত) দ্বারা
জন্য অনুসন্ধান করুন কালো ফিরে দলিল নেই ...:
জন্য অনুসন্ধান করুন বিড়াল বা কালো : ফিরে দলিল নেই ...

:-D :-D


3

সহজ কথায়:

এক্স এর জন্য অনুসন্ধান আপনাকে উত্তর দেয়।
Y এর জন্য অনুসন্ধান আপনাকে উত্তর দেয়।
এক্স এবং ওয়াইয়ের জন্য অনুসন্ধান আপনাকে পি উত্তর দেয়।

এক্স বা ওয়াইয়ের সন্ধানে, এক্স বা ওয়াইন উভয়ই খুঁজে পাওয়ার সাথে সাথে অনুসন্ধানটি বন্ধ হয়ে যায় So সুতরাং কোনও জয়ের আগে যদি কোনও এক্স থাকে, তবে এক্স বা ওয়াই অনুসন্ধানে Y গণনা করা হবে না Therefore সুতরাং X বা Y এর জন্য আপনার অনুসন্ধানটি আপনাকে এন + মি - পি উত্তর দেবে।

এটি উল্লেখ করা গুরুত্বপূর্ণ যে ফলাফলগুলি একই রকম হবে আপনি 2 টি অনুসন্ধান করেন বা কেবল একটি করে। এটি কেবলমাত্র দুটি অনুসন্ধানের সংমিশ্রণে কিছু নথি দুটিবার গণনা করা হয়।


"এক্স বা ওয়াই যে কোনওটি খুঁজে পাওয়ার সাথে সাথে অনুসন্ধানটি বন্ধ হয়ে যায়" " এটি বাস্তবায়নের উপর নির্ভর করে না? একটি বাস্তবায়ন এক্স এর জন্য সমস্ত ফলাফল পেতে পারে, ওয়াইয়ের জন্য সমস্ত ফলাফল পেতে পারে এবং তারপরে ফলাফলগুলি এমনভাবে সংযুক্ত করতে পারে যা সদৃশগুলি মুছে দেয়।
jpmc26

@ অর্ণবদত্ত আমি যা বর্ণনা করেছি তা অবশ্যই কোনও এক্সওআর নয়। "সদৃশগুলি অপসারণ" এর অর্থ দ্বিতীয় কপিটি মুছে ফেলা, সেই উপাদানটির সমস্ত উদাহরণ নয়।
jpmc26

সত্য। আমি ভুল বুঝেছিলাম. আমার মন্তব্য সরানো হয়েছে।
অর্ণব দত্ত

3

ভাবুন আপনার কাছে কেবল একটি ডকুমেন্ট রয়েছে। এটি এর সাথে নথি # 1:

X Y

এখন ভাবুন আপনার একটি অনুসন্ধান ফাংশন রয়েছে যা আপনাকে একটি কীওয়ার্ডের ভিত্তিতে সমস্ত নথি দিতে পারে:

search("X") => 1
search("Y") => 1

লক্ষ্য করুন যে উভয় ক্ষেত্রে নথির সংখ্যা ১ টি। এখন আপনার যদি এমন কোনও অনুসন্ধান ফাংশন থাকে যা সরবরাহিত কীওয়ার্ডগুলির সাথে এক বা একাধিক সংখ্যক নথির সাথে মেলে এমন নথির সংখ্যা দেয়:

search("X", "Y") => 1

আপনি ধারণকারী নথি নম্বর যোগ যখন Xসমন্বিত দস্তাবেজগুলির সংখ্যা Y, তাহলে এটি আপনাকে একই দস্তাবেজে দুইবার গণনা ঘটায়। আপনার ক্ষেত্রে, 10000উপরে উল্লিখিত হিসাবে এটি ঘটেছে :)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.