আমার বিলিয়াত্ব দৈর্ঘ্যের কোটি কোটি লাইনযুক্ত একটি বড় বাছাই করা ফাইল রয়েছে। একটি নতুন লাইন দেওয়া আমি জানতে চাই যে এটি বাছাই করা ফাইলটিতে অন্তর্ভুক্ত করা হলে কোন বাইট নম্বরটি পেত।
উদাহরণ
a\n
c\n
d\n
f\n
g\n
ইনপুট 'foo' দেওয়াতে আমি আউটপুট 9 পেতে পারি।
কেবল পুরো ফাইলটি দিয়েই এটি করা সহজ, তবে কয়েক মিলিয়ন লাইনের পরিবর্তনশীল দৈর্ঘ্যের কারণে এটি বাইনারি অনুসন্ধান করা আরও দ্রুত হবে be
এই জাতীয় পাঠ্য প্রক্রিয়াকরণ সরঞ্জাম ইতিমধ্যে বিদ্যমান?
সম্পাদনা:
এটি এখন করে: https://gitlab.com/ole.tange/tangetools/blob/master/bsearch/bsearch