আমি একটি স্পেল চেক / স্বয়ংক্রিয় সম্পূর্ণ বৈশিষ্ট্য সহ একটি প্রোগ্রাম লেখার চেষ্টা করছি। এর জন্য আমার সবচেয়ে সাধারণ ইংরেজি শব্দের একটি শালীন আকারের তালিকা দরকার। আমি যে সমস্যাটি দেখেছি তা হ'ল তালিকার আকারগুলিতে একটি দুর্দান্ত বৈষম্য রয়েছে যা আমি খুঁজে পেয়েছি। এগুলি হয় <1,000 শব্দ বা> 50,000। <1,000 শব্দের একটি তালিকা খুব সংক্ষিপ্ত এবং অনেকগুলি দরকারী শব্দ বাদ দেওয়া হয়েছে। যাইহোক,> 50,000 শব্দের একটি তালিকা আমার অ্যালগরিদমের (গতি বিজ্ঞানের) জন্য কিছুটা হয়ে উঠতে শুরু করে।
যে কোনও তালিকার 3,000-12,000 ডলার ইংরেজি শব্দ জানে। সাধারণত একটি টেক্সট ফাইলে। এছাড়াও, এটি তুলনামূলকভাবে অ-বিধিনিষেধযুক্ত লাইসেন্স থাকা প্রয়োজন (অর্থাত্ পুনরায় বিতরণযোগ্য)।