আমি একটি ছোট লাইব্রেরিতে কাজ করছি যা বেসিক, সুপরিচিত স্ট্রিং মেট্রিকগুলির বাস্তবায়ন সরবরাহ করে। বেশিরভাগই আমার নিজের লেখাপড়ার জন্য। সুতরাং যখনই আমি কিছুটা অতিরিক্ত সময় পেয়েছি উন্নয়ন ঘটে।
এ কারণে আমি বেশিরভাগ প্রক্রিয়া স্বয়ংক্রিয় করেছি তাই আমি খুব বেশি প্রচেষ্টা ছাড়াই যতক্ষণ না এর উপর কাজ করি ততবারই একটি সংস্করণ প্রকাশ করতে পারি। তবে জাভা ডক রক্ষণাবেক্ষণ করা এখনও একটি বোঝা কারণ এটির উদাহরণ রয়েছে।
এপিআইটি বিকশিত হওয়ার সাথে সাথে আমি নিজেই প্রতিটি উদাহরণ বারবার পরীক্ষা করে দেখতে পারি। এই কাজ করতে একটি ভাল উপায় আছে কি?
আমি ডকুমেন্টেশন এবং উদাহরণগুলি একটি পৃথক প্রকল্পে (উদাহরণস্বরূপ ক্যালিপার টিউটোরিয়াল ) সরানো বিবেচনা করেছি যাতে এটি নিয়মিত কোডের সাথে পুনরায় ফ্যাক্টর এবং সংকলন করা যায়। তবে এটি ডকুমেন্টেশনটিকে ক্লাস থেকে দূরে সরিয়ে দেয়।
তাই হ্যা. আমি আমার কেক রাখতে চাই এবং এটিও খেতে চাই। : ডি
* <h2>Tokenization</h2>
*
* Tokenization cuts up a string into tokens e.g.
* <code>chilperic ii son of childeric ii</code> is tokenized into
* <code>[chilperic, ii, son, of,
* childeric, ii]</code>. Tokenization can also be done repeatedly by tokenizing
* the individual tokens e.g.
* <code>[ch,hi,il,il,lp,pe,er,ri,ic, ii, so,on, of, ch,hi,il,ld,de,er,ri,ic, ii]</code>
* <p>
*
* <pre>
* <code>
* {@code
* return new StringMetricBuilder()
* .with(new SimonWhite<String>())
* .tokenize(new Whitespace())
* .tokenize(new QGram(2))
* .build();
* }
* </code>
* </pre>
*
* <p>
উপরের এটি খুব বিমূর্ত যদি। এটি ডকুমেন্টেশনের একটি নমুনা। বর্তমানে আমি কার্যকর জাভা দ্বারা পরামর্শ হিসাবে স্থির কনস্ট্রাক্টর যুক্ত করছি যেমন Tokenizers.createQGram(2)
কনস্ট্রাক্টর পদ্ধতির অবমূল্যায়ন করার সময়। প্রতিবার যখন আমি এই জাতীয় কিছু করি, আমাকে উপরের উদাহরণ কোডটি আপডেট করতে হবে এবং এটি এখনও কাজ করে কিনা তা পরীক্ষা করে দেখতে হবে।