কমান্ড-লাইন-বন্ধুত্বপূর্ণ পূর্ণ পাঠ্য সূচি?


37

একটি পূর্ণ-পাঠ্য ইনডেক্সিং ইঞ্জিন হিসাবে এমন কোনও জিনিস রয়েছে, যা কমান্ড লাইন থেকে জিজ্ঞাসা করা যেতে পারে এবং আদর্শভাবে কোনও গুই ব্যবহার করার প্রয়োজন নেই?

আমি আমার ইবুকগুলি এবং কাগজপত্রগুলি সূচীকরণে বিশেষভাবে আগ্রহী, সুতরাং এটি পিডিএফ, ইপাব এবং কয়েকটি ডিজেভু মিশ্রণ। (ওপেন) অফিস ডক্সটি সুন্দর হবে তবে আমার তালিকার চেয়ে অনেক কম।


1
সূচকটি কী ফর্ম্যাট গ্রহণ করে সে সম্পর্কে আপনি আরও সুনির্দিষ্ট হতে পারেন?
ixtmixilix

ভাল পয়েন্ট, সম্পাদিত।
জুলিয়েন

-1 লুসিন বা ট্র্যাকারের নীচে যেমন উল্লেখ করা হয়েছে তা ভাল পছন্দ, তবে "জিটিকি ব্যবহার করুন, বা আরও খারাপ কিউটি" নিয়ে আপনার সমস্যা কী? কেবল কমান্ড লাইনটি ব্যবহার করা ভাল, তবে আমি গ্রন্থাগারের একটি সেট সমালোচনা করার বিষয়টি দেখতে পাচ্ছি না ...

2
@ টমো: পয়েন্ট নেওয়া হয়েছে, প্রশ্ন সম্পাদিত হয়েছে। দুঃখিত, যে এর কিভাবে এটি মাধ্যমে এসেছিলেন ... কারো কঠোর পরিশ্রমের পতনসাধনের বলিনি
Julien

উত্তর:


11

আপনি Lucene বা স্পিনক্স তাকান? আপনার সূচী করতে চান এমন দস্তাবেজগুলি প্রাথমিকভাবে পার্স করতে হবে, এটি শেষ হয়ে গেলে, হয় কেউ ক্লাইম থেকে অনুসন্ধান করতে পারে।

লুসিনের জন্য, এটি উপলভ্য করার বিষয়ে কিছু তথ্য রয়েছে ।

স্পিনিক্স, কিছুটা অস্পষ্ট, তবে কিছু ডকুমেন্টেশনও উপলব্ধ । আপনি xmlpipe2 ডেটা উত্সের মাধ্যমে আপনার পছন্দের কাঠামোগত এক্সএমএল ডেটা স্ফিংকে পাস করতে পারেন।

Lucene জাভার উপর নির্ভর করে, যখন স্পিনক্স বাইরের নির্ভরতার বাইরে সি ++ এ নির্মিত।

হয় আপনি যা চান তা করতে কিছুটা কাজ করা দরকার তবে এটি পুরোপুরি কার্যক্ষম সমাধান হিসাবে মনে হচ্ছে।


1
একদিকে যেমন, আপনি যদি কোনও ডিবিতে (ডিগ্রিগ্রেস, মাইএসকিএল) ডেটা ইনডেক্স করতে চান তবে এর মধ্যে দুটিও অবিশ্বাস্যভাবে ভাল কাজ করে।
গ্যাবে

হুম, আমি খুব নিম্ন স্তরের জন্য স্পিংক্স বরখাস্ত, কিন্তু xmlpipe2 দিকে তাকিয়ে এটা pdf2txt জন্য মোড়কের স্ক্রিপ্ট মনে হয় বা মত বেশ সহজ হবে ...
Julien

Lucene উল্লেখ করার জন্য +1। আমি লুসিনের সাথে ভাল সময় কাটিয়েছি, এটি হত্যাকারী জিনিস !!
নিখিল মুলি

আমি বিশ্বাস করি স্থিতিস্থাপক অনুসন্ধান লুসিনের উপর ভিত্তি করে, এবং এটি ব্যবহার করতে আরও সুবিধাজনক হতে পারে (উচ্চ স্তরের জিনিস হিসাবে)।
অফবি 1

5

জ্যাপিয়ান চেক আউট । এটিতে কমান্ড লাইন ইন্টারফেস রয়েছে এবং এটি প্রচুর ফর্ম্যাটকে সূচক করতে পারে।


xapian একটি দুর্দান্ত সূচক, যা আমার ব্যক্তিগত প্রিয়, এবং এটি স্থানীয় সি ++ তে লেখা আছে। জ্যাপিয়ান ব্যবহার করে এমন কিছু হ'ল সবচেয়ে আদর্শ হবে, অনেকগুলি প্রকল্পের জন্য ইনডেক্সের প্রয়োজন হয় +1।
জেএম বেকার


3

কমান্ড লাইন থেকে ট্র্যাকার আহ্বান করা যেতে পারে এবং gtk + কোনও প্রকল্পের জন্য হার্ড নির্ভরতা নয় (তবে প্যাকেজগুলির জন্যও হতে পারে)।


ভাল যদি আমি ভুল না হয়ে থাকি তবে এটি জিনোমকে নির্ভরতার হিসাবে টানতে চেষ্টা করবে।
জুলিয়ান

1
যেমনটি আমি বলেছি - প্রকল্প (0.9.x সংস্করণে কমপক্ষে একমাত্র জিনোম হার্ড নির্ভরতা গ্লিব)। প্যাকেজগুলি GUI এর মতো বুদ্ধিমান ডিফল্ট কর্মীদের সংকলন করতে পারে যাতে আপনার নিজের হাতে এটি সংকলন করতে হতে পারে।
ম্যাকিয়েজ পাইচোটকা

3

এই উত্তরটি গুগলের কোডসার্ক ব্যবহার করার পরামর্শ দেয় ,

কোড অনুসন্ধান সূচীকরণের জন্য একটি সরঞ্জাম এবং এরপরে উত্স কোডের বৃহত সংস্থাগুলির উপরে নিয়মিত অভিব্যক্তি অনুসন্ধানগুলি সম্পাদন করে।

দেবিয়ান / ডেরিভেটিভস উপর সুপারউসাররা চেষ্টা করতে পারেন: sudo apt-get install codesearch


1
উত্স থেকে ইনস্টল করার বিষয়ে এই উত্তরের কিছু বিশদ রয়েছে; যদি এটি আপনার ওএসের জন্য
রেপোগুলিতে

2

বর্তমানে ট্র্যাকারের দুটি স্ট্রিম রয়েছে, স্থিতিশীল (0.8) এবং অস্থির (0.9)। আপনার ওএসটির সম্ভবত 0.8 সংস্করণ রয়েছে, সুতরাং আপনি যদি এটি সামর্থ্য করতে পারেন (এটির কিছুটা রক্তস্রাব প্রান্ত সফ্টওয়্যার নির্ভরতা রয়েছে), সর্বশেষতম টারফাইলটি ধরুন (0.9.x)। এটি 0.8 এরও বেশি উন্নতি করেছে এবং বর্তমানে 0.10 (এমনকি সংখ্যা স্থিতিশীলতার প্রতিনিধিত্ব করে) হওয়ার জন্য আরও স্থিতিশীল করা হচ্ছে । আপনি যদি এই রুটে যেতে চান তবে কনফিগার করতে এই কমান্ডটি ব্যবহার করুন:

./configure --disable-tracker-needle --disable-tracker-preferences --disable-tracker-explorer --disable-tracker-status-icon

আপনি সম্ভবত নির্ভরতা ইনস্টল করতে যাচ্ছেন না, সুতরাং আপনার ডিস্ট্রো থেকে কেবল 0.8 ইনস্টল করা আরও সহজ হবে এবং কেবল জিইউআই বিটগুলি এড়ানো উচিত। ডেবিয়ান স্কিজে, উবুন্টু 10.10 এবং উবুন্টু 11.04 এ এগুলি খুব সুন্দরভাবে বিভক্ত। সুতরাং ( মূল হিসাবে ) চালান:

apt-get install --no-install-recommends tracker-utils tracker-miner-fs

এর জন্য সিএলআই সরঞ্জামটি tracker-search, সুতরাং এটির --helpসুবিধা কীভাবে নিতে হবে তা দেখার জন্য এটি বিকল্পটি দিয়ে চালান :-)

নোট :

  • ফেডোরা ১৪-এ, ট্র্যাকার প্যাকেজের GTK + এর উপর নির্ভরতা রয়েছে। আমি কারণ এটি জিনিষ পছন্দ অন্তর্ভুক্ত এটা tracker-appletএবং tracker-preferences। তবে তাদের tracker-search-toolজিইউআই অনুসন্ধান ইন্টারফেসের জন্য আলাদা প্যাকেজ রয়েছে ।
  • DjVu এবং ePUB (এখনও) সমর্থিত নয়। এখানে কি একটি তালিকা

0

আমি এই গ্রীষ্মে স্ক্লাইট 3 ব্যবহার করে নেটবিএসডি-র জন্য ম্যান পেজগুলি সূচীকরণ এবং অনুসন্ধানের জন্য একটি সম্পূর্ণ পাঠ্য অনুসন্ধান সরঞ্জাম (একটি নতুন এপ্রোপো) লেখার উপর কাজ করেছি। এটিতে দুটি কমান্ড লাইনের সরঞ্জাম রয়েছে:

  • Makemandb: যা ম্যান পেজগুলির সামগ্রীর সূচকে বিশ্লেষণ করে এবং তৈরি করে।
  • apropos: এই সূচকটি অনুসন্ধানের জন্য সরঞ্জাম।

আপনি সহজেই নিজের জন্য অনুরূপ একটি সরঞ্জাম লিখতে পারেন, পিডিএফ এর জন্য আপনার পিডিএফ নথি পার্স করার জন্য একটি লাইব্রেরি এবং একইভাবে ওপেন অফিসের ডকুমেন্টগুলি পার্স করার জন্য একটি ইউটিলিটি প্রয়োজন।

আপনি এখানে প্রকল্প সম্পর্কে আরও পড়তে পারেন

কোডটি এখানে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.