আমি পরিতেছিলাম:
https://en.wikipedia.org/wiki/Tf%E2%80%93idf#Definition
তবে সূত্রটি কেন ঠিক এমনভাবে তৈরি করা হয়েছিল তা আমি বুঝতে পারি না।
আমি কি বুঝতে পারি:
আইডিএফকে কিছু স্তরে পরিমাপ করা উচিত যে প্রতিটি নথিতে একটি শব্দ এস কতবার প্রকাশিত হয়, শব্দটি আরও ঘন ঘন প্রদর্শিত হওয়ায় মান হ্রাস পায়।
সেই দৃষ্টিকোণ থেকে
তদুপরি টার্ম ফ্রিকোয়েন্সি যথাযথভাবে বর্ণনা করা যায়
সুতরাং তারপর পরিমাপ
কোনও উপায়ে কোনও প্রদত্ত নথিতে প্রায়শই কী শব্দটি প্রকাশিত হয় তার সাথে আনুপাতিক এবং ডকুমেন্টগুলির সেটের তুলনায় সেই শব্দটি কতটা অনন্য।
আমি কি বুঝতে পারি না
তবে প্রদত্ত সূত্রটি এটিকে বর্ণনা করে
সংজ্ঞায় বর্ণিত লগারিদমগুলির প্রয়োজনীয়তাটি বুঝতে আগ্রহী। যেমন, তারা সেখানে কেন? তারা কোন দিকটি জোর দেয়?