যেহেতু আপনি অন্য কোথাও দেখিয়েছেন যে টিএফ-আইডিএফ আলোচনা করা হয়েছে, টিএফ-আইডিএফ বা এমনকি (আপনার প্রশ্নে) আইডিএফ গণনা করার জন্য সর্বজনীনভাবে একমতীত কোনও সূত্র নেই । উদ্দেশ্য দুটি উদ্দেশ্য এক সম্পন্ন করার জন্য হল: ক) শূন্য দ্বারা এড়ানোর বিভাগের , যেমন যখন কোন দস্তাবেজে একটি শব্দ উপস্থিত হয়, এমনকি এই যদিও একটি কঠোরভাবে "শব্দ ব্যাগ" পদ্ধতির মধ্যে ঘটবে না, অথবা খ) কোনও শর্তকে শূন্য ওজন দেওয়া হ্রাস এড়ানোর জন্য একটি নিম্ন সীমা নির্ধারণ করার জন্য এটি সমস্ত নথিতে প্রদর্শিত হয়েছিল।+1
যদিও আমি কোনও পাঠ্যপুস্তকের উল্লেখ করেছি, আমি প্রকৃতপক্ষে সূত্রের কখনও দেখিনি । তবে উদ্দেশ্যটি হ'ল শূন্যের চেয়ে নিম্ন সীমাটি নির্ধারণ করা হবে, যেমন আপনি সঠিকভাবে ব্যাখ্যা করেন। আমি দেখেছি 1 + + , যা একটি নিম্ন সবচেয়ে বেশি ব্যবহৃত গণনার মনে করা হয় 1. বাউন্ড সেট করে , ম্যানিং, ক্রিস্টোফার হিসেবে ডি, প্রভাকর রাঘাভান, এবং হিরিচ স্কটজি (২০০৮) তথ্য পুনরুদ্ধারের পরিচিতি , কেমব্রিজ বিশ্ববিদ্যালয় প্রেস, পি 118 বা উইকিপিডিয়া (একই সূত্রের ভিত্তিতে)।log(1+Nnt)log(2)log(Nnt)log(Nnt)
আপনার প্রশ্নের সাথে সরাসরি প্রাসঙ্গিক নয়, তবে উপরের , তবে আপনার স্মুথিং গঠনের উপর নির্ভর করে যেখানে । এটি 0 বা 1 নথিগুলিতে উপস্থিত শর্তগুলির জন্য ঘটে (আবার আপনি শূন্য নথির ফ্রিকোয়েন্সি সহ শর্তাদির জন্য এটি সংজ্ঞায়িত করতে সাথে মসৃণ কিনা তার উপর নির্ভর করে - যদি তা না হয় তবে কেবলমাত্র একটি নথিতে উপস্থিত শর্তাদির জন্য সর্বাধিক মান হয়)) IDF যখন এবং ।∞k+log(N/s)k,s∈0,1s→∞1+nt=1N→∞