বড় সার্চ ইঞ্জিনগুলি কোন ডাটাবেস প্রযুক্তি ব্যবহার করে? [বন্ধ]

32

গুগল বা ইয়াহু কীভাবে খুব বিপুল পরিমাণে ডেটার বিপরীতে কীওয়ার্ড অনুসন্ধান করে তা কী কেউ জানেন? তারা এর জন্য কোন ধরণের ডাটাবেস বা প্রযুক্তি ব্যবহার করে?

এটি কয়েক মিলিসেকেন্ডে লাগে, তবে এগুলিতে এক বিলিয়ন পৃষ্ঠারও বেশি তালিকাবদ্ধ রয়েছে।

database-design full-text-search

— rkosegi
সূত্র

আছে: স্ট্যাক ওভারফ্লো উপর একটি অনুরূপ প্রশ্ন হল stackoverflow.com/questions/362956/...

— splattne

21

আমি নিশ্চিত যে এখানে জিনিসের সংমিশ্রণ রয়েছে:

গুরুতর হার্ডওয়্যার
এটির প্রচুর - অনেকগুলি নোড এবং বিভিন্ন ডেটা সেন্টারগুলিতে ডেটা বিতরণ ও প্রতিলিপি করা হয়
- (আসলে গুগলের ক্ষেত্রে আমি বিশ্বাস করি যে তাদের হাজার হাজার এবং হাজার হাজার লো-এন্ড সার্ভার রয়েছে)
প্রচুর সাধারণ প্রশ্নের ফলাফলগুলিকে ক্যাশে করা হয়, লক্ষ্য করুন যে কীভাবে আপনি জানেন যে আপনি এর আগে কখনও অনুসন্ধান করেননি সেগুলির জন্য তারা সম্ভাব্য অনুসন্ধানগুলি প্রাক-জনবসতিপূর্ণ করে; তারা আপনার জন্য কী অনুসন্ধান করতে পারে তার পূর্বাভাস দিচ্ছেন এবং আশা করছেন যে তারা ইতিমধ্যে আপনার ফলাফলটি প্রাক-গণনা করা হয়েছে এবং কোথাও ক্যাশে করেছে। তারা অনেকগুলি ক্ষেত্রে - এমন অনেকগুলি সন্ধান নেই যা আজ আপনি গুগলে নিয়ে আসতে পারেন যা আপনার আগে কেউ জিজ্ঞাসা করেনি। যখন তারা একটি নতুন অনুসন্ধান বাক্যাংশ পেয়ে যায় তখন তারা সম্ভবত ফ্রি-টেক্সট অনুসন্ধানের মতো কিছু ব্যবহার করে - এবং আমি প্রত্যাশা করছিলাম যে কোনও পৃষ্ঠা প্রথম নথিতে কীওয়ার্ড অনুসন্ধান করার পরিবর্তে নথিতে কীওয়ার্ড সন্ধান করার চেয়ে প্রথমে ক্রল করা হবে তখন শব্দার্থে শব্দার্থগুলি বের করা হবে racted । অবশ্যই তাদের পর্যায়ক্রমে সেই ক্যাশেগুলি অকার্যকর করতে হবে, পৃষ্ঠা র‌্যাঙ্কটি পুনরায় গণনা করে,

— অ্যারন
সূত্র

34

কবুতর ।

গুগলের অনুসন্ধান প্রযুক্তির প্রাণকেন্দ্র হলেন পিগনর্যাঙ্ক ™ , স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের গুগল প্রতিষ্ঠাতা ল্যারি পেজ এবং সার্জি ব্রিন দ্বারা বিকাশিত ওয়েব পৃষ্ঠাগুলির র‌্যাঙ্কিংয়ের একটি সিস্টেম:

এখানে চিত্র বর্ণনা লিখুন

বিএফ স্কিনার, পেজ এবং ব্রিনের যুগান্তকারী কাজের উপর ভিত্তি করে যুক্তি দিয়েছিলেন যে কম দামের কবুতর ক্লাস্টারগুলি (পিসি) মানব সম্পাদকদের বা মেশিন-ভিত্তিক অ্যালগরিদমের চেয়ে দ্রুত ওয়েব পৃষ্ঠাগুলির তুলনামূলক মান গণনা করতে ব্যবহার করা যেতে পারে। এবং গুগলের প্রতিদিন আমাদের পরিষেবাগুলির প্রতিটি দিক উন্নত করার লক্ষ্যে কয়েক ডজন ইঞ্জিনিয়ার কাজ করার সময়, পিগনর্যাঙ্ক আমাদের সমস্ত ওয়েব অনুসন্ধান সরঞ্জামের জন্য ভিত্তি সরবরাহ করে চলেছে।

গুগলের পেটেন্টড পিজনর্যাঙ্ক Why কেন এত ভাল কাজ করে

কবুতর্যাঙ্কের সাফল্য মূলত গার্হস্থ্য কবুতরের (কলম্বা লিভিয়া) উচ্চতর প্রশিক্ষণের উপর নির্ভর করে এবং স্থানিক দিকনির্দেশনা নির্বিশেষে বস্তুগুলি সনাক্ত করার জন্য এর অনন্য ক্ষমতা । সাধারণ ধূসর কবুতরটি কেবলমাত্র সর্বনিম্নতম পার্থক্য প্রদর্শনকারী আইটেমগুলির মধ্যে সহজেই পার্থক্য করতে পারে, এমন একটি দক্ষতা যা হাজার হাজার অনুরূপ পৃষ্ঠাগুলির মধ্যে থেকে প্রাসঙ্গিক ওয়েবসাইটগুলি নির্বাচন করতে সক্ষম করে।

ঘন ক্লাস্টারে কবুতরের ঝাঁক সংগ্রহ করে, গুগল traditionalতিহ্যবাহী সার্চ ইঞ্জিনগুলির চেয়ে উচ্চতর গতিতে অনুসন্ধান অনুসন্ধানগুলি প্রক্রিয়া করতে সক্ষম হয়েছে, যা সাধারণত শিকারের পাখির উপর নির্ভর করে, ব্রুডিং মুরগি বা ধীরে চলমান জলছোঁয়া তাদের প্রাসঙ্গিকতা র‌্যাঙ্কিং করতে।

যখন অনুসন্ধানের কোয়েরি গুগলে জমা দেওয়া হয়, তখন এটি এমন একটি ডেটা কুপে স্থানান্তরিত হয় যেখানে জ্বলন গতিতে ফলাফলের পৃষ্ঠাগুলি ফ্ল্যাশ করে । গোষ্ঠীর কবুতরগুলির মধ্যে একটি দ্বারা কোনও প্রাসঙ্গিক ফলাফল পর্যবেক্ষণ করা হলে, এটি তার চঞ্চু দিয়ে একটি রাবার-প্রলিপ্ত ইস্পাত বারে আঘাত করে, যা পৃষ্ঠাটির একটিতে একটি কবুতর্যাঙ্ক মান নির্ধারণ করে। প্রতিটি পেকের জন্য, পায়রাঙ্কটি বৃদ্ধি পায় । যে পৃষ্ঠাগুলি সর্বাধিক বিদ্রূপ প্রাপ্ত রয়েছে, ব্যবহারকারীর ফলাফলের পৃষ্ঠার শীর্ষে ফিরে আসে অন্য ফলাফলগুলির সাথে তীক্ষ্ণ ক্রমে প্রদর্শিত হয়।

— ইয়ারক्यूब ᵀᴹ
সূত্র

6

দ্রষ্টব্য: এই পৃষ্ঠাটি এপ্রিল ফুল দিবসের জন্য পোস্ট করা হয়েছিল - 2002

— ডাঃ জিম্বোব

19

গুগল সম্পর্কে কয়েকটি বিষয় মনে রাখা গুরুত্বপূর্ণ:

তাদের ডিবি মালিকানা হয় Bigtable - এটা কাস্টম পরিকল্পিত ছিল GOOGLE এর বাই ঠিক তাদের চাহিদা মাপসই
তাদের মালিকানাধীন ডিবি তাদের মালিকানাধীন ফাইল সিস্টেমের উপরে নির্মিত হয়েছে - গুগল ফাইল সিস্টেম - এটি সাধারণ পণ্য হার্ডওয়্যার ব্যবহার করে সহজেই প্রসারণযোগ্য হতে গুগল দ্বারা আবার ডিজাইন করা হয়েছিল । হারুন তার উত্তরে যেমন উল্লেখ করেছেন, তাদের কাছে খুব শক্তিশালী সার্ভারের সংখ্যার পরিবর্তে গড়ে প্রচুর গড় সার্ভার রয়েছে।

তারা একাধিক মেশিনে দ্রুত অ্যাক্সেস তৈরির উপায় হিসাবে পৃথক টেবিলগুলি সংরক্ষণ করে - তাদের সফ্টওয়্যার জানে যে কোন ডেটাটি কোন মেশিনে রয়েছে এবং এটি সনাক্ত করার জন্য কোনও ডিস্কের মাধ্যমে আঘাতের পরিবর্তে সরাসরি সম্পর্কিত সার্ভারে সার্ভারে যেতে পারে।

— JNK
সূত্র

11

গুগল traditionalতিহ্যগত সম্পর্কযুক্ত ডাটাবেস প্রযুক্তি ব্যবহার করে না। এটি নিজস্ব প্রযুক্তি, বড় টেবিল এবং মানচিত্র হ্রাস বিকাশ করেছে। মূল গবেষণা কাগজপত্র এখানে: বড় সারণী এবং মানচিত্র / হ্রাস । আগ্রহের বিষয়টি হ'ল এসএসটিবল, বাছাই করা স্ট্রিং টেবিল ।

অনুরূপ প্রযুক্তিটি এখন হ্যাডোপ এবং নোএসকিউএল ডাটাবেসগুলিতে ব্যবহৃত হয় ।

— NimChimpsky
সূত্র

9

স্টিভেন লেভির " দ্য প্ল্লেক্সে: গুগল কীভাবে চিন্তাভাবনা করে, কাজ করে এবং আমাদের জীবনকে রূপ দেয় " পড়ুন। গুগল সমস্ত বিষয় সম্পর্কে এই বইটি পড়ার মনোমুগ্ধকর এবং অনুসন্ধানের পিছনে প্রযুক্তি এবং প্রকৌশল সম্পর্কিত কিছু উচ্চ স্তরে আলোচনা করে। হারুন তার উত্তরে সত্যিই এটি সংক্ষেপে লিখেছেন এবং লেবির বইটি তারা এটি কীভাবে করে সে সম্পর্কে আপনাকে আরও বিশদ দেবে।

— টড এভারেট
সূত্র