একটি উল্টানো সূচক এবং সমতল পুরাতন সূচকের মধ্যে পার্থক্য কী?


100

সফ্টওয়্যার ইঞ্জিনিয়ারিংয়ে আমরা সারাক্ষণ সূচী তৈরি করি (যেমন, ডাটাবেসে) তবে আমি প্রচুর লোককে উল্টো সূচক সম্পর্কে কথা বলতে শুনি। দুজনের মধ্যে মৌলিকভাবে আলাদা কিছু আছে কি? তারা একই জিনিস মত শব্দ।



স্পষ্ট করতে, আপনি জিজ্ঞাসা করছেন: একটি সাধারণ সূচক ( en.wikedia.org/wiki/Index_%28database%29 ) সম্পর্কে কী আলাদা যা সেই টেবিলে ইতিমধ্যে বিদ্যমান তথ্যের উপর ভিত্তি করে একটি টেবিলটি ভেঙে দেয়? এটা কি ঠিক?
jwheron

4
@ গাইডোইজম প্রত্যেকে যা উল্লেখ করতে ব্যর্থ হয়েছিল (যদিও নরমালটি আংশিকভাবে উদাহরণ দ্বারা এটি বর্ণনা করে এবং প্রেমের বোতামে বেশ কিছুটা হয়) তা হ'ল উল্টানো সূচীগুলি "কার্যকারিতা" বেসিক ডেটাগুলিকে আরও দক্ষ করে তোলে (যেমন স্ব্যাপ কী / ডেটা বিভিন্ন দৃষ্টিকোণ থেকে অনুসন্ধান করতে বা দ্রুত অনুসন্ধানের অ্যালগোরিদমগুলিকে অনুমতি দেওয়ার জন্য বর্ণানুক্রমিকভাবে / সংখ্যাসূচকভাবে অর্ডার করা), যেখানে কোনও মানক সূচক ডেটা এটি খুঁজে পাওয়ার সাথে সাথে সঞ্চয় করে। "উল্টো" শব্দের "পশ্চাদপদ / ফরোয়ার্ড" রেফারেন্স এবং আক্ষরিক অর্থ এখানে প্রয়োগ হয় না, পরিবর্তে এটি হাতের কাজটির জন্য নির্দিষ্ট একটি দক্ষ বিন্যাস তৈরি করতে ডেটা উল্টানো বোঝায়।
TheManWithNoName নাম

উত্তর:


217

একটি সাধারণ ব্যবহার হ'ল দ্রুত ... সম্পূর্ণ পাঠ্য সন্ধানের অনুমতি দেওয়া "to

দুটি ধরণের দিকনির্দেশকে বোঝায় । একটি আপনাকে সূচকের মাধ্যমে এগিয়ে নিয়ে যায় এবং অন্যটি আপনাকে সূচকের মাধ্যমে পিছনে (বিপরীত) নিয়ে যায়। এটাই. এখানে উন্মোচন করার কোনও রহস্য নেই। তা না হলে দুই ধরনের অভিন্ন, এটা ঠিক কি তথ্য আপনার একটি প্রশ্ন আছে ফলে আপনি যে তথ্য করার চেষ্টা করছেন, এবং খুঁজে।

আপনার তদন্তের সমাধানের জন্য, আমি মনে করি না যে এটি ব্যবহারের কারণটি আজ কেন তা জানা আছে to কোনটি কোনটি forwardএবং এর অর্থটি কোনটি তা নির্ধারণ করা গুরুত্বপূর্ণ কারণ ।inverted হ'ল আমরা সকলেই তাদের সম্পর্কে কথোপকথন করতে পারি এবং সকলেই জানেন যে আমরা কোন দিকের বিষয়ে কথা বলছি। "বাম" এবং "ডান" পদগুলি সম্পর্কে চিন্তা করুন: তারা আপেক্ষিক। কোনটি কোন বিষয় নয়, তা বাদ দিয়ে প্রত্যেকেরই বোঝাতে হবে কোনটি "বাম" এবং কোনটি "ডান" শব্দের অর্থের জন্য। যদি, একটি সংস্কৃতি হিসাবে, আমরা বাম এবং ডানদিকে উল্টানোর সিদ্ধান্ত নিয়েছি, তবে আপনি যে "ডানদিকে" বনাম "বাম বাঁক" কী তা বোঝার পরে একই সমস্যাটি বোঝা গেল যেহেতু সম্মতি অনুসারে অর্থ পরিবর্তিত হয়েছিল। তবে নামকরণটি নির্বিচারে,

আপনার মন্তব্যে আপনি যেখানে জিজ্ঞাসা করেছেন, "দয়া করে কেবলমাত্র শর্তাদি সংজ্ঞায়িত করবেন না", আপনি বিন্দুটি অনুপস্থিত রয়েছেন এবং আমার মনে হয় আপনি যখন শব্দটির মধ্যে একেবারেই কোনও পার্থক্য না পেয়ে থাকেন তখনই আপনি স্তব্ধ হয়ে যাচ্ছেন।


ভবিষ্যতের পাঠকদের সুবিধার জন্য, আমি এখন বেশ কয়েকটি "ফরোয়ার্ড" এবং "উল্টানো" সূচী উদাহরণ সরবরাহ করব:

উদাহরণ 1: ওয়েব অনুসন্ধান

আপনি যদি ভাবছেন যে কোনও সূচকের বিপরীতটি গণিতের কোনও ক্রিয়াকলাপের বিপরীতের মতো কিছু , যেখানে বিপরীতটি একটি বিশেষ জিনিস যার আলাদা রূপ রয়েছে, তবে আপনি ভুল করছেন: এখানে ঘটনাটি এমন নয়।

একটি অনুসন্ধান ইঞ্জিনে আপনার দস্তাবেজের একটি তালিকা রয়েছে (ওয়েব সাইটের পৃষ্ঠাগুলি), যেখানে আপনি কয়েকটি কীওয়ার্ড প্রবেশ করেন এবং ফলাফলগুলি ফিরে পান।

একটি ফরোয়ার্ড সূচক (বা কেবল সূচক) হ'ল নথিগুলির তালিকা এবং এর মধ্যে কোন শব্দ উপস্থিত হয়। ওয়েব অনুসন্ধান উদাহরণে, প্রতিটি পৃষ্ঠায় কোন শব্দটি উপস্থিত হয় তা নির্ধারণ করে, ডকুমেন্টগুলির তালিকা তৈরি করে গুগল ওয়েব ক্রল করে।

উল্টানো সূচক হয় শব্দের তালিকা , এবং দস্তাবেজগুলি যা তারা প্রদর্শিত হবে। ওয়েব অনুসন্ধান উদাহরণে, আপনি শব্দের তালিকা সরবরাহ করেন (আপনার অনুসন্ধানের ক্যোয়ারী) এবং গুগল নথি তৈরি করে (অনুসন্ধান ফলাফলের লিঙ্কগুলি)।

এগুলি উভয় সূচক - আপনি কোন দিকে যাচ্ছেন এটি কেবল একটি প্রশ্ন। ফরোয়ার্ড হ'ল ডকুমেন্টস থেকে-> থেকে-> শব্দ থেকে, উল্টে থাকে শব্দ-> থেকে-> নথি থেকে documents

উদাহরণ 2: ডিএনএস

আরেকটি উদাহরণ হ'ল ডিএনএস লুকআপ (যা হোস্টের নাম নেয়, এবং একটি আইপি ঠিকানা দেয়) এবং একটি বিপরীত চেহারা (যা একটি আইপি ঠিকানা নেয় এবং আপনাকে হোস্টের নাম দেয়)।

উদাহরণ 3: একটি বই

কোনও বইয়ের পেছনের সূচকটি আসলে একটি উল্টানো সূচক , যা উপরের উদাহরণগুলি দ্বারা সংজ্ঞায়িত - শব্দের একটি তালিকা এবং বইটিতে সেগুলি কোথায় পাওয়া যায়। একটি বইতে বিষয়বস্তুর সারণিটি একটি ফরোয়ার্ড সূচকের মতো : এটি বইতে থাকা নথির একটি তালিকা (অধ্যায়), সেই বিভাগগুলিতে শব্দগুলি তালিকাভুক্ত না করে, বিষয়বস্তু সারণীতে কেবল একটি নাম / সাধারণ বিবরণ দেয় যা এই নথিতে (অধ্যায়) অন্তর্ভুক্ত।

উদাহরণ 4: আপনার সেল ফোন

এগিয়ে সূচক আপনার সেল ফোনে আপনার পরিচিতির তালিকা, এবং যা ফোন নম্বর (সেল, বাড়ি, কর্মস্থল) ঐ পরিচিতিদের সাথে যুক্ত করা হয়। উল্টানো সূচক কি আপনি নিজে একটি ফোন নম্বর লিখুন অনুমতি দেয়, এবং যখন আপনি আঘাত "ডায়াল" তুমি কি ব্যক্তির নাম দেখতে, বরং সংখ্যার চেয়ে, কারণ আপনার ফোন ফোন নম্বর নিয়েছে এবং আপনি এটি সঙ্গে যুক্ত পরিচিতি পাওয়া যায়নি।


11
সময় দেয়ার জন্য ধন্যবাদ. তবে আপনার উত্তরটি এখনও তথ্যহীন। আমি আমার অনুগ্রহের অনুরোধে যেমন উল্লেখ করেছি, জড়িত শর্তগুলি কী বোঝায় এবং সেগুলি কেন উত্থিত হয় তা আমি বুঝতে পারি। আমার প্রশ্নটি ছিল: "যে লোকেরা উল্টা সূচকের নামকরণ করেছিল তাদের কেন উল্টা বলা হয়েছিল যখন আমাদের দীর্ঘকালীন traditionতিহ্য রয়েছে যা তাদেরকে কেবল সরল সূচক বলে? উদাহরণস্বরূপ, বইগুলির শেষে সূচকগুলি, যেমন আপনি দেখিয়েছেন, আসলে উল্টানো হচ্ছে Go historicalতিহাসিক দৃষ্টিকোণ অনুসারে, বইয়ের শেষে সূচকগুলি ওয়েব সূচকের আগে এসেছিল Then আমার অনুমান যে সবেমাত্র ঘটেছিল সেগুলির মধ্যে এটি একটি ছিল ...
মানব

4
"আমি মনে করি না কেন পদ ব্যবহারের একটি ঐতিহাসিক পরীক্ষায় পরিচালনার ছাড়া জানেন যে সম্ভব" - আমি আশা কেউ আছে চাই হবে যেমন একটি ঐতিহাসিক পরীক্ষায় আচার এবং একটি উত্তর দেব। :-) কারণ এটি "সূচক" এর সাধারণ ভাষার অর্থের বিপরীতে হওয়া অবাক করা। (একটি সম্ভাব্য উত্তর হ'ল "ইনভার্টেড ইনডেক্স" বাক্যাংশটি যখন প্রথম ভাবা হয়েছিল, তখন "সূচক" শব্দটি ইতিমধ্যে কিছু "ইনডেক্স" ইনভার্টেড আর্ট "ইনভার্টেড ইনডেক্স", অর্থাৎ, ইনভার্টেড আর্টকে "ইনডেক্সের আসল-জীবনের অর্থ বোঝায়" "। সেক্ষেত্রে ফরোয়ার্ড" সূচক "কেন অদ্ভুত নামটি পেয়েছে তা জেনে রাখা কার্যকর হবে))
শ্রীভাতসার

4
ফরোয়ার্ড ইনডেক্সিং কেন ব্যবহার করা উচিত সে সম্পর্কে @ জেফ্লান্ট কেবলই ভাবছেন। আমি এখানে ওয়েব অনুসন্ধান উদাহরণ সম্পর্কে বিশেষত কথা বলছি। সুতরাং গুগল যদি ফরোয়ার্ড ইনডেক্সিংয়ের অংশ হিসাবে তাদের মধ্যে দস্তাবেজের <-> শব্দের তালিকা করে এবং শেষ পর্যন্ত শব্দের তালিকা <-> তাদের অনুসন্ধানে নথির তালিকা ব্যবহার করে তবে দস্তাবেজের তালিকা কেন <-> শব্দ তাদের ? অন্য কথায়, আমার প্রশ্ন হ'ল: কোনও নির্দিষ্ট পৃষ্ঠায় (ডকুমেন্ট) কোন শব্দগুলি রয়েছে তা গুগলকে জিজ্ঞাসা করতে পারে না বা মূলত সে জিজ্ঞাসা করতে চলেছে যে সে কী কীওয়ার্ডগুলি সন্ধান করছে সেগুলি পৃষ্ঠাগুলিতে ঘটে। তাহলে ফরোয়ার্ড ইনডেক্সিং কেন?
কুইকব্রাউনফক্স

4
রিলেশনাল ডাটাবেসের প্রসঙ্গে তাই কোনও উল্টো সূচক নেই? বা সেই সূচকগুলি আসলে 'ইনভার্টেড ইনডেক্স'। সাহিত্যে "সম্মত" পদগুলির সমস্যা হ'ল কয়েকজন অগ্রগামী বা কর্পস যারা বিভিন্ন চুক্তি শুরু করেন এবং সম্প্রদায়ের একটি অংশ সেই নামকরণ অনুসরণ করেন অজ্ঞতা / ভুল / বিবেচনা। সবাই কিছুক্ষণ পরে বিভ্রান্ত হয়। আমি নিশ্চিত যে সফ্টওয়্যারটিতে এমন অনেক শর্ত রয়েছে যা মূলত এটিকে বলতে বলা হয়েছিল তবে বিভিন্ন সম্প্রদায় ইচ্ছাকৃতভাবে বা ভুলভাবে এটিকে 'এ' বা বি হিসাবে বিবেচনা করে, সিন্ট্যাক্টিকভাবে কোর্স ছাড়াই। এটি এখনও নতুন শিক্ষার্থী থেকে জাহান্নামকে বিভ্রান্ত করে।
নীর

4
@ রোলি - আমি সেই সাদা কাগজটি পড়িনি। আমার মনে হয় আপনি যা জিজ্ঞাসা করছেন তা হ'ল "ফরওয়ার্ড সূচক আপডেট করার সময় আপনি কি উল্টো সূচি আপডেট করেন?" যদি এটি আপনার প্রশ্ন হয় তবে উত্তরটি হ্যাঁ।
jefflunt

27

ইতিমধ্যে একটি ফরোয়ার্ড সূচক আছে বলেই তারা এটিকে উল্টা বলেছে। সার্চ ইঞ্জিনের উদাহরণটি ধরুন, এটি দুটি অংশ দ্বারা রচিত: প্রথম অংশটি হ'ল "ওয়েব ক্রলার এবং পার্সার" যা নথি থেকে শব্দের একটি সূচক তৈরি করে, দ্বিতীয় অংশটি অনুসন্ধান ডাটাবেস যা শব্দ থেকে ডকুমেন্টের সূচক তৈরি করে। প্রথম সূচকের অস্তিত্ব থাকায় আমরা স্বাভাবিকভাবেই দ্বিতীয় সূচকটিকে উল্টো সূচক বলে থাকি।

আপনি যদি কোনও বইয়ের টিওসি (সামগ্রীর সারণি )টিকে সূচক হিসাবে নাম দেন, তবে আপনার বইয়ের শেষে সূচকটি "উল্টানো সূচক" হিসাবে কল করা উচিত। অথবা, অন্যদিকে, আপনি টিওসিটিকে উল্টো সূচক হিসাবে কল করতে পারেন।


6
এটি গ্রহণযোগ্য উত্তর হওয়া উচিত কারণ আমরা কেন একটি সূচককে "উল্টো" বলি কেন এমন প্রশ্নের উত্তর দেয় যদিও সকলেই ঠিক "সাধারণ সূচক" বলে মনে করে। একটি এসকিউএল বি-ট্রি সূচক প্রতিটি শব্দের জন্য এটিতে থাকা সমস্ত সারি ("নথি") এর পয়েন্টার সঞ্চয় করে stores সেখানে আমরা একে "সূচক" বলি। তবে অনুসন্ধান ইঞ্জিনগুলিতে আমরা হঠাৎ এই ঠিক একই পদ্ধতিটিকে "ইনভার্টেড ইনডেক্স" বলি। এটি মৌলিকভাবে পৃথক নয় বলে নয়, তবে আমরা প্রথমে একটি "ফরোয়ার্ড সূচী" (বিভক্ত পাঠ্য) তৈরি করেছিলাম এবং তারপরে এটি "বিপরীত" করি। সুতরাং, সর্বোপরি, "বিপরীত" নামটি এটি তৈরির প্রক্রিয়া থেকে আসে, সূচকের চূড়ান্ত কাঠামো থেকে নয়।
ফু বার

অন্তর্দৃষ্টিগুলির জন্য @ এক্সারনিক ধন্যবাদ তাত্ক্ষণিক প্রশ্ন: ইনভার্ট ইনডেক্সটি তৈরি হওয়ার পরে ফরওয়ার্ড ইনডেক্স ফাইল থেকে এন্ট্রিগুলি সরানো কি বাস্তব?
রায় লি

4
আমি @ ফুবারের সাথে একমত এই উত্তরটি সঠিক উত্তর হিসাবে বেছে নেওয়া উচিত। এটি উত্তর দিয়েছিল যে আমরা কেন একটি নতুন শব্দ উদ্ভাবন করি inverted index যদিও আমাদের জীবনের সমস্ত সাধারণ সূচক ইতিমধ্যে হিসাবে ব্যবহৃত হয় inverted
রায়ান লিউ

7

সাধারণত সূচকের কথা বলার সময়, আপনি কিছু যুক্ত গণনা বা পদ্ধতির সঞ্চিত ফলাফলগুলি বোঝাতে চেয়েছিলেন যা অ্যাপ্লিকেশনটি গতি বাড়ানোর জন্য করা হয়েছে (যেমন মাইএসকিউএল বা অন্যান্য আরডিবিএমএস মাইএসকিউএল ডক্সের সাথে পরামর্শ করুন )। ইনডেক্সিং ক্যাচিং ইত্যাদির সাথেও সম্পর্কিত হতে পারে etc.

ইনভার্টেড ইনডেক্স এমন কাঠামোযুক্ত ফাইল তৈরি করে যা মূলত (ফুলটেক্সট) অনুসন্ধানের জন্য অন্তর্ভুক্ত।

ইনভার্টেড ইনডেক্স দুটি প্রধান ফাইল নিয়ে গঠিত:

  • শব্দভাণ্ডার
  • ঘটনা

শব্দভান্ডারে সাধারণ শব্দগুলি পাঠ্য থেকে বের করা হয় (অবশ্যই সর্বনামের মতো ব্ল্যাকলিস্ট শব্দগুলি ফিল্টার করার পরে)। ঘটনা ফাইলটি শব্দ এবং নথিগুলির মধ্যে সংযোগ ধারণ করে (শব্দ 1 ডক 1 এবং ডক 2 এ প্রদর্শিত হয়, ডক 3 তে নয়)। এটি একটি ম্যাট্রিক্সের আকারে উপস্থাপিত হয়।

সূচীকরণ প্রক্রিয়া - উল্টো সূচক

উপরের চিত্রটিতে উল্লিখিত দুটি ফাইল তৈরির প্রক্রিয়াটি দেখানো হয়েছে।

আপনি যদি এই সমস্যাজনিত বিষয়ে আরও আন্তঃস্বাক্ষর হন তবে আমি আপনাকে রিকার্ডো ইয়াটেড - আধুনিক তথ্য পুনরুদ্ধার ( এটি আমাজনে দেখুন ) - র প্রায় 200 পৃষ্ঠা মনে করি বলে একটি দুর্দান্ত বইয়ের সুপারিশ করতে পারি।

আশা করি এটা সাহায্য করবে :-)


এটি একটি খুব ভাল উত্তর কারণ এটি উল্টানো সূচকটি আসলে কী তা ব্যাখ্যা করে। এটি ফরোয়ার্ড ইনডেক্সিং এবং ইনভার্স ইনডেক্সিংয়ের ধারণার অতীত হয়ে যায় যা সন্ধানের সক্ষমতার জন্য ব্যবহৃত হয় যা উল্টানো সূচক তৈরি করে এবং উল্টানো সূচক দ্বারা সক্ষম হয় the
এএন 6 ইউ 5

6

স্বাভাবিকতা ইতিমধ্যে একটি ফরোয়ার্ড এবং একটি উল্টানো সূচকের মধ্যে বিস্ময়করভাবে পার্থক্য করেছে তবে কেন একজনকে ফরোয়ার্ড সূচক এবং অন্যটিকে উল্টো সূচক বলা হয় এই প্রশ্নের জন্য, সম্ভবত এ কারণেই তাদের এ কারণেই বলা হয় ---

সার্চ ইঞ্জিন ক্রলিং এবং ইনডেক্সিং (বা কোনও বইয়ের জন্য বিল্ডিং ইনডেক্স) এর উদাহরণ গ্রহণ করে আপনি ওয়েব পৃষ্ঠাগুলি ক্রল করার সময় (বা বইটি পড়তে) বা এগিয়ে যাওয়ার সময় একটি ফরোয়ার্ড সূচক এক সাথে তৈরি করা যেতে পারে । সুতরাং আপনার যদি ক্রল করার জন্য 10 টি ওয়েবপৃষ্ঠা থাকে (বা কোনও বইয়ের 10 টি অধ্যায়) আপনি প্রথম ওয়েবপৃষ্ঠাটি ক্রল করতে পারেন (প্রথম অধ্যায়টি পড়ুন) এবং তারপরে ওয়েবপৃষ্ঠায় উপস্থিত শব্দের একটি তালিকা তৈরি করুন (অধ্যায়টিতে প্রদর্শিত শব্দগুলি) এবং চালিয়ে যেতে পারেন অন্যান্য ওয়েবপৃষ্ঠাগুলির (অন্যান্য অধ্যায়গুলির) জন্য এই প্রক্রিয়াটি তাই 10 টি ওয়েবপৃষ্ঠাগুলি ক্রল করার পরে (সমস্ত 10 টি অধ্যায় পড়ুন) আপনার ফরোয়ার্ড সূচকটি প্রতিটি ওয়েবপৃষ্ঠা (অধ্যায়) এর সাথে থাকা শব্দের তালিকার দিকে ইঙ্গিত করে সম্পূর্ণ হবে

তবে একটি উল্টানো সূচী তৈরি করতে আপনাকে সমস্ত 10 টি ওয়েবপৃষ্ঠাগুলি ক্রল করতে হবে (10 টি অধ্যায়টি পড়ুন) এবং তারপরে প্রতিটি নথির তালিকা থেকে প্রতিটি শব্দ নেবেন এবং কোন নথিতে সেই শব্দটি রয়েছে তা নির্ধারণ করুন। তাই এই অনগ্রসর যাচ্ছে একবার আপনি ওয়েব পেজ ক্রল আছে ভালো হয় (পড়া বইয়ের অধ্যায়) । সুতরাং এটি একটি বিপরীত সূচক বলা হয়।

এটি আমার অনুমান মাত্র।


5

বিভিন্ন ধরণের সূচক রয়েছে। উদাহরণস্বরূপ, বি-ট্রি, আর-ট্রি, হ্যাশ ... বিভিন্ন উদ্দেশ্যে, আমাদের অবশ্যই সঠিক সূচি নির্বাচন করতে হবে।

ইনভার্টেড ইনডেক্স বিশেষ একটি। উল্টানো সূচক সাধারণত সম্পূর্ণ পাঠ্য অনুসন্ধান ইঞ্জিনে ব্যবহৃত হয়। ইনভার্টেড ইনডেক্স ব্যবহার করুন আমরা একটি ডকুমেন্টে (বা দস্তাবেজগুলি সেট করা) যত তাড়াতাড়ি সম্ভব কোনও শব্দের সন্ধান করতে পারি। মেমরির সীমাবদ্ধতা এবং সিপিইউ সম্পর্কে চিন্তা করুন, অন্যান্য সূচি এই কাজটি শেষ করতে পারে না।

আপনি আরও তথ্যের জন্য লুসিন ডকুমেন্টটি পড়তে পারেন। এটি একটি মুক্ত উত্স অনুসন্ধান ইঞ্জিন। http://lucene.apache.org/java/docs/index.html


3

"ইনভার্টেড ওয়ার্ড ইনডেক্স" শব্দটি বহু-শব্দের সমন্বিত একক নথির সম্পর্কের পরিবর্তনকে বোঝায়, প্রতিটি অনন্য শব্দের সাথে অনেকগুলি নথির একটি তালিকা (বা সনাক্তকরণ) থাকে। এটি কার্যকরভাবে একের মধ্যে একাধিক সম্পর্ক নিয়ে চলেছে (ডক্স টু ওয়ার্ডে) এবং এটিকে উল্টানো (বা বিপরীতভাবে) এমনভাবে তৈরি করা হচ্ছে যে এখন একটি নতুন "ইনভার্টেড" ওয়ান-টু-মেন রিলেশনশিপ বিদ্যমান, যা বহু- সম্পর্কিত প্রতিটি-অনন্য-শব্দ is ডকুমেন্টস (অর্থাত্ সেই শব্দটি ধারণ করে) এটির উত্সটি আসলেই সহজ and গ্রেস হপারকে "মিষ্টি যুবতী" হিসাবে বিবেচনা করার মতো যথেষ্ট বয়স্ক সিওবিএল একটি চকচকে নতুন ভাষা থাকাকালীন পিছনে আদালতের জন্য উপযুক্ত বয়স)। দয়া করে এখনও আমাদের গিজারগুলি এড়ান না, কারণ আমরা মাঝে মাঝে একটি দরকারী, এবং সম্ভবত মূল্যবান, historicalতিহাসিক জোয়ার-বা দুটি সরবরাহ করতে পারি - যখন আমাদের ব্যক্তিগত র‌্যাম এখনও কাজ করছে, তা। [হাসি]


2

ইনভার্টেড ইনডেক্সগুলিতে আমাদের নিম্নলিখিত ফর্ম রয়েছে:

word1-> দস্তাবেজের তালিকাতে এটি ঘটে (সাজানো ক্রম)

word2-> দস্তাবেজের তালিকাতে এটি ঘটে (সাজানো ক্রম)

এটি সার্চ ইঞ্জিন ক্যোয়ারী প্রসেসিংয়ের জন্য খুব দরকারী কারণ এটি আমাদের যে শব্দটির মধ্যে ডক্স রয়েছে তা খুঁজে পেতে দেয়।

এই উল্টানো সূচকটি তৈরি করতে আপনি তদারকি করা মেশিন লারিং ব্যবহার করতে পারেন।


6
আমার কাছে এটি সূচির মতো শোনাচ্ছে, এ সম্পর্কে কি উল্টে আছে?
নির্দেশিকা

4
@ গিগডিজম ইনভার্টেড ইনডেক্স হ'ল ফরোয়ার্ড ইনডেক্স of একটি ফরোয়ার্ড সূচী প্রতিটি নথির জন্য শব্দের একটি তালিকা সঞ্চয় করে। উদাহরণস্বরূপ ডক-> ডাব্লু 1, ডাব্লু 2
প্রোগ্রামার

আমি এখনও ফরোয়ার্ড এবং ইনভার্টেড ইনডেক্সের মধ্যে কোনও পার্থক্য খুঁজে পাই না (এটি কীভাবে কাজ করে তার পরিপ্রেক্ষিতে নামকরণটি ছেড়ে দিন)। আমার কাছে উভয়ই সূচকের মতো দেখায় যা একটি ক্ষেত্রকে নথি আইডির একগুচ্ছ মানচিত্র করে। এইভাবে আমি বুঝতে পেরেছিলাম যে কীভাবে ওরাকল বিটি্রি (অন্যথায় ফরোয়ার্ড সূচকে উল্লিখিত) ডেটা সংগঠিত করে। উল্টানো সূচকের নীতিগুলির সাথে আমি কোনও পার্থক্য দেখছি না। একটি ডক ম্যাপিং -> ডাব্লু 1, ডাব্লু 2, ডাব্লু 3 অনুসন্ধানের ক্ষেত্রে আমার কাছে একটি অদৃশ্য প্রস্তাবের মতো দেখায়। ভাবছেন কেন এটি প্রথম স্থানে রয়েছে? এটি আমাকে আবার স্কোয়ারে ছেড়ে দেয়। :-)।
ব্যবহারকারী 1189332

@ প্রোগ্রামার তাত্ক্ষণিক প্রশ্ন: ইনভার্ট ইনডেক্সটি তৈরি হওয়ার পরে ফরওয়ার্ড ইনডেক্স ফাইল থেকে এন্ট্রিগুলি সরিয়ে ফেলা কি বাস্তব?
রায় লি

0

আরও একটি পার্থক্য:

ইনভার্টেড ইনডেক্সের সাথে হ্যান্ডলিং আপডেটগুলি ফরওয়ার্ড সূচকের তুলনায় ব্যয়বহুল।

ফরোয়ার্ড সূচকগুলি কেবলমাত্র সম্পর্কিত ডকুমেন্ট সূচকে পরিবর্তনগুলি প্রতিবিম্বিত করে সহজেই আপডেটগুলি পরিচালনা করে, যখন উল্টানো সূচীতে একই পরিবর্তনটি উল্টানো সূচক জুড়ে একাধিক অবস্থানে প্রতিফলিত হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.