একা একা পূর্ণ-পাঠ্য অনুসন্ধানের সার্ভারটি চয়ন করছেন: স্পিনক্স বা এসএলআর? [বন্ধ]


192

আমি নিম্নলিখিত বৈশিষ্ট্য সহ একা একা পূর্ণ-পাঠ্য সার্ভার সার্ভারের সন্ধান করছি:

  • একা একা থাকা সার্ভার হিসাবে পরিচালনা করতে হবে যা একাধিক ক্লায়েন্টের অনুসন্ধান অনুরোধগুলি পরিবেশন করতে পারে
  • এসকিউএল ক্যোয়ারির ফলাফলকে সূচীকরণ করে "বাল্ক ইনডেক্সিং" করতে সক্ষম হতে হবে: বলুন "সलेक्ट আইডি, পাঠ্য_আপনি নথি থেকে সূচি;"
  • অবশ্যই নিখরচায় সফ্টওয়্যার থাকতে হবে এবং ডাটাবেস হিসাবে মাইএসকিউএল দিয়ে লিনাক্সে চলতে হবে
  • অবশ্যই দ্রুত হতে হবে (মাইএসকিউএলের অভ্যন্তরীণ পূর্ণ-পাঠ্য অনুসন্ধানের বিধি নিষেধ)

এই বৈশিষ্ট্যগুলির মধ্যে আমি যে বিকল্পগুলি পেয়েছি সেগুলি হ'ল:

  • সোলার (লুসিনের উপর ভিত্তি করে)
  • ইলাস্টিক অনুসন্ধান (লুসিনের উপর ভিত্তি করে)
  • স্পিংক্স

আমার প্রশ্নগুলো:

  • তারা কীভাবে তুলনা করবে?
  • আমি কি কোন বিকল্প মিস করেছি?
  • আমি জানি যে প্রতিটি ব্যবহারের কেস আলাদা, তবে এমন কি কিছু ক্ষেত্রে রয়েছে যেখানে আমি অবশ্যই একটি নির্দিষ্ট প্যাকেজ ব্যবহার করতে চাই না ?

1
আপনি কি সোজা লুসিন ব্যবহার করতে অস্বীকার করেছেন? সোলার লুসিনের শীর্ষে একটি পরিষেবা, তাই সরাসরি লুসিনের সম্ভাবনা কমতে পারে।
ডেভ

Lucene একটি একা একা সার্ভার মোড আছে? আমি ভেবেছিলাম SOLR যুক্ত জিনিসগুলির মধ্যে একটি ছিল? আমি কিছুতেই
অস্বীকার করিনি

মশক: মূলত জাভা তবে অন্যান্য ভাষাও।
নর্ভ

ব্যক্তিগতভাবে আমি স্পিনক্স পছন্দ করি। তবে সম্প্রতি একটি "বৃহত" প্রকল্পের সময়, সর্বশেষ প্রকাশের প্রার্থী (0.9.9-rc2) মাল্টি-ভ্যালু অ্যারে (এমভিএ) ব্যবহার করার সময় স্টপার বাগগুলি প্রদর্শন করেছিল show এটি এলোমেলো ফলাফল! সুতরাং আমরা এসএলআর এ স্থানান্তরিত হিসাবে এটি পেতে। একবার এসএলআর তৈরি হয়ে গেলে এবং সঞ্চালনটি ঠিকঠাক হয়েছিল, এবং শো স্টপার বাগ ছাড়াই।
pchap10k

2
আপনি কি ইলাস্টিক্স.কম.কে দেখেছেন?
এফওয়াইএ

উত্তর:


327

আমি এখন প্রায় 2 বছর ধরে সোলারকে সফলভাবে ব্যবহার করে আসছি এবং স্পিনক্স কখনও ব্যবহার করি নি, তাই আমি স্পষ্টতই পক্ষপাতদুষ্ট। যাইহোক, আমি ডক্স বা অন্যান্য লোকের উদ্ধৃতি দিয়ে এটিকে উদ্দেশ্যমূলক রাখার চেষ্টা করব। আমি আমার উত্তরে প্যাচগুলিও নেব :-)

মিল:

  • সোলার এবং স্পিনিক্স উভয়ই আপনার সমস্ত প্রয়োজনীয়তা পূরণ করে। এগুলি দ্রুত এবং ডিজাইনের জন্য দক্ষতার সাথে বিশাল আকারের ডেটা সূচীকরণ এবং অনুসন্ধানের জন্য।
  • উভয়েরই হাই ট্র্যাফিক সাইটগুলি ব্যবহার করে তাদের দীর্ঘ তালিকা রয়েছে ( সোলার , স্পিংক্স )
  • উভয় বাণিজ্যিক সমর্থন প্রস্তাব। ( সোলার , স্ফিংস )
  • উভয়ই বেশ কয়েকটি প্ল্যাটফর্ম / ভাষাগুলির জন্য ক্লায়েন্ট এপিআই বাইন্ডিং অফার করে ( স্ফিংস , সোলার )
  • উভয়ই গতি এবং ক্ষমতা বাড়াতে বিতরণ করা যেতে পারে ( স্ফিংস , সোলার )

এখানে কিছু পার্থক্য রয়েছে:

সম্পর্কিত প্রশ্নগুলি:


4
সোলার এবং লুসিন উভয়ের প্রতি অঙ্গীকারবদ্ধ করার বিষয়ে কথা বলে মনে হচ্ছে তারা আরও দুটি পণ্যকে আরও বিকাশকে আরও সহজ এবং দ্রুত তৈরি করে একত্রিত করেছে - lucidimagination.com/blog/2010/03/26/…
জিমিস্টর্মিগ

3
@ স্ট্যান: কেমন? আমি প্রায় 5 বছর আগে সোলার ব্যবহার করেছি এবং জাভাটির একক লাইন লেখার প্রয়োজন নেই।
মৌরিসিও শেফার

@ মরিসিসিও শেফার আপনি কি সত্যিই ভাবেন যে জাভা কোডটি সি ++ এর চেয়ে দ্রুততর হবে। এখানে তুলনা বিল Karwin এবং স্পিংক্স দ্বারা তৈরি জিনিস Lucene তুলনায় 10 গুণ দ্রুত অনুসন্ধান করে (এবং solr পেতেই হবে এমনকি ধীর চেয়ে।) Slideshare.net/billkarwin/...
অরেঞ্জ

3
@ স্ট্যান: আপনি কি সত্যিই মনে করেন যে সলারের সাহায্যে কয়েকটি ওয়েবসাইটের নাম দেওয়ার জন্য হোয়াইটহাউস.gov, নেটফ্লিক্স, দ্য গার্ডিয়ান, ডিগের চেয়ে আপনার আরও কর্মক্ষমতা প্রয়োজন? wiki.apache.org/solr/PublicServers
মরিসিও শেফার

3
এখানে স্ফিংস-এর একটি উত্তর যা সোলারের এই উত্তরের একটি ভাল জুড়ি
নিউ আলেকজান্দ্রিয়া

48

আপনার যদি কোনও মালিকানাধীন উপায়ে অনুসন্ধানের কার্যকারিতা প্রসারিত করার প্রয়োজন না হয়, স্ফিংস আপনার সেরা বাজি।

স্ফিংক্স সুবিধা:

  1. উন্নয়ন এবং সেটআপ দ্রুত হয়
  2. আরও ভাল (এবং দ্রুত) সমষ্টি। এটি ছিল আমাদের জন্য হত্যাকারী বৈশিষ্ট্য।
  3. এক্সএমএল নয়। শেষ পর্যন্ত আমাদের পক্ষে সোলারকে এটি বাতিল করে দেয়। আমাদের পরিবর্তে বড় ফলাফলের সেটগুলি ফিরে আসতে হয়েছিল (শত শত ফলাফল বিবেচনা করুন) এবং তারপরে সোলার সমাহারটির ঘাটতি হওয়ায় সেগুলি নিজেই একত্রিত করতে হয়েছিল। এক্সএমএল থেকে এবং সিরিয়ালিয়াল করার সময়টির পরিমাণটি একেবারে নিখুঁতভাবে নিহত হয়েছে। ছোট ফলাফলগুলি সেট করার জন্য, এটি পুরোপুরি ঠিক ছিল।
  4. আমি ওপেন সোর্স অ্যাপে সেরা দস্তাবেজগুলি দেখেছি

সোলার সুবিধা:

  1. বাড়ানো যেতে পারে।
  2. এটি সরাসরি কোনও ওয়েব অ্যাপ্লিকেশন থেকে হিট করতে পারে, অর্থাৎ আপনি স্বয়ংক্রিয়ভাবে-সম্পূর্ণ-মতো অনুসন্ধানগুলি সরাসরি এজেএক্সের মাধ্যমে সোলার সার্ভারে হিট করতে পারেন।


24
সোলার / লুসিন ডকুমেন্টেশন কতটা ভয়ানক তা আমি উল্লেখ করেছি? কার্যকারিতা বের করার জন্য জাভাদোকসের মধ্যে রুট করা ডকুমেন্টেশন সম্পর্কে আমার ধারণা নয়।
larf311

3
আমার উইকির সাথে লিঙ্ক করা উচিত: wiki.apache.org/solr/…
শেফার

2
আমি পুরো দিনটি আমার ম্যাকটিতে স্ফিংক্স 0.9.9 এর কিছু ইনস্টলেশন বাগ ঠিক করতে ব্যয় করি। এখনও পর্যন্ত এটি কাজ করছে না। এটা এত বগি। আমি প্রস্তাবিত খুব উপায় ব্যবহার। আমি সত্যিই হতাশাবোধ করছি ...
lkahtz

সোলারের ডকুমেন্টেশনগুলি স্ফিংক্সের মতো ভাল নয়। তবে সম্প্রদায়টি বড়। এবং আমি সর্বদা সলারের উত্স কোডটি পড়ে সমস্ত কিছু বের করতে পারি।
টাইলার লং

21

দ্রষ্টব্য: একই প্রশ্নটি মাথায় রেখে অনেক ব্যবহারকারী রয়েছেন।

সুতরাং, বিষয়টির উত্তর দিতে:

কোনটি এবং কেন?

  • সোলার ব্যবহার করুন যদি আপনি এটি আপনার ওয়েব-অ্যাপে ব্যবহার করতে চান (উদাহরণস্বরূপ-সাইট অনুসন্ধান ইঞ্জিন)। এটি অবশ্যই দুর্দান্ত হয়ে উঠবে, এর API এর জন্য ধন্যবাদ। একটি ওয়েব-অ্যাপ্লিকেশনটির জন্য অবশ্যই আপনার সেই শক্তির প্রয়োজন হবে।

  • আপনি রিয়েল দ্রুত টন নথি / ফাইলের মাধ্যমে সন্ধান করতে চাইলে স্পিনক্স ব্যবহার করুন । এটি বাস্তবকেও দ্রুত সূচক করে। আমি অনুসন্ধানের ফলাফলগুলি পেতে JSON বা পার্সিং এক্সএমএল জড়িত এমন অ্যাপে এটি ব্যবহার না করার পরামর্শ দেব recommend এটি সরাসরি ডিবি অনুসন্ধানের জন্য ব্যবহার করুন। এটি মাইএসকিউএলে দুর্দান্ত কাজ করে।

বিকল্প

যদিও এগুলি দৈত্য, তবে আরও অনেক কিছু রয়েছে। এছাড়াও, এমন কিছু রয়েছে যা তাদের কাস্টম ফ্রেমওয়ার্কগুলি পাওয়ার জন্য এটি ব্যবহার করে। সুতরাং, আমি বলব যে আপনি সত্যিই কোনওটি মিস করেন নি। যদিও এর মধ্যে একটি স্থিতিস্থাপক অনুসন্ধান রয়েছে যাতে ভাল ব্যবহারকারী বেস রয়েছে।


13
সেই বিশ্রী মুহুর্তে যখন আমি এই উত্তরটি দেড় বছর পরে পড়ি এবং উপভোটে ক্লিক করি এবং দেখুন যে আমি এই উত্তরটি নিজেই লিখেছি। হাঃ হাঃ হাঃ. : ডিএ যদিও এতে সামান্য সংযোজন: 18 মাস পরে, ইলাস্টিক অনুসন্ধানটি একটি দুর্দান্ত বিকল্প হিসাবে প্রমাণিত হয়েছে এবং একটি সভ্য সম্প্রদায়ও রয়েছে। শীতল, বনসাই শীতল!
অগিওয়ান

অগাস্টাস! সেই বিশ্রী মুহুর্ত: ডি। তাই অজগর ওয়েব-অ্যাপ্লিকেশনটির জন্য আপনি এখন কী সেরা বলে মনে করেন? কর্মক্ষমতা, মেমরির ব্যবহার এবং কোনও ধারণা সেটআপ করার স্বাচ্ছন্দ্যের ভিত্তিতে সোলার বা ইলাস্টিক অনুসন্ধান?
মেভিন বাবু

ওয়েব অ্যাপটি কোন ভাষায় লিখিত হয়েছে তা বিবেচ্য নয় your আপনার ব্যবহারের কেসের ভিত্তিতে চয়ন করুন!
আগুয়ানওয়ান

19

আমি এখন প্রায় এক বছর ধরে স্পিনিক্স ব্যবহার করছি এবং এটি আশ্চর্যজনক। আমি আমার ম্যাকবুকের প্রায় এক মিনিটের মধ্যে 1.5 মিলিয়ন ডকুমেন্টস এবং সার্ভারে আরও দ্রুত সূচি করতে পারি। আমি নির্দিষ্ট অক্ষাংশ এবং দ্রাঘিমাংশের মধ্যে অনুসন্ধানগুলিকে সীমাবদ্ধ করতে স্পিনিক্সও ব্যবহার করছি এবং এটি খুব দ্রুত। এছাড়াও, ফলাফলগুলি কীভাবে র‌্যাঙ্ক করা হয় তা খুব সাদামাটা। ইনস্টল করা সহজ এবং সেটআপ করা, যদি আপনি দুটি বা দুটি টিউটোরিয়াল পড়ে থাকেন। প্রায় ১.০ স্থিতি তবে তাদের প্রকাশিত প্রার্থীরা বেশ শক্ত।


3
লোকালসোলার প্লাগইন দিয়ে সোলারে ভৌগলিক অনুসন্ধান করা যেতে পারে: gissearch.com/localsolr
মরিসিও শেফার

1
আপনি কি এক মিনিটে 1.5 মিলিয়ন ডকুমেন্ট ইন্ডেক্স করতে পারবেন? এমনকি আমি এগুলি পড়ার খুব কাছেও আসতে পারি না - সরাসরি আমার এসএসডি-তে 7zip (কনসোলটিতে আউটপুট লিখছেন না) থেকে! এবং এটি 2017! এগুলি কী ধরণের দলিল? এটা বেশ অবিশ্বাস্য। দ্রষ্টব্য: আমি আশা করি আপনি এক মিনিটের মধ্যে 1.5 মিলিয়ন এর সূচকটি অনুসন্ধান করেন নি । ডাব্লু / 1.5 মিলিয়ন ডক্সের সূচীর অনুসন্ধানগুলি এখনও সেকেন্ডে ফিরে আসবে (এমনকি ২০০৯ সালেও)।
ফাস্টএল

2

লুসিন / সোলার আরও বেশি বৈশিষ্ট্যযুক্ত এবং ব্যবসায়িক দীর্ঘ সময় এবং আরও শক্তিশালী ব্যবহারকারী সম্প্রদায় হিসাবে উপস্থিত বলে মনে হয়। imho যদি আপনি প্রাথমিক সেটআপ সমস্যাগুলি পেরিয়ে যেতে পারেন কারণ কিছু মনে হয় (আমরা নয়) তবে আমি বলব Lucene / Solr আপনার সেরা বাজি।


ব্যবহারকারী সম্প্রদায় একটি গুরুত্বপূর্ণ বিষয় is স্ফিংস ফোরামগুলিতে বেশ কয়েকটি, খুব সহায়ক ব্যক্তি রয়েছেন, তবে অন্যথায় শক্তিশালী সম্প্রদায় নেই।
mlissner
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.