ইংরেজি শব্দের মাঝারি আকারের তালিকা


3

আমি একটি স্পেল চেক / স্বয়ংক্রিয় সম্পূর্ণ বৈশিষ্ট্য সহ একটি প্রোগ্রাম লেখার চেষ্টা করছি। এর জন্য আমার সবচেয়ে সাধারণ ইংরেজি শব্দের একটি শালীন আকারের তালিকা দরকার। আমি যে সমস্যাটি দেখেছি তা হ'ল তালিকার আকারগুলিতে একটি দুর্দান্ত বৈষম্য রয়েছে যা আমি খুঁজে পেয়েছি। এগুলি হয় <1,000 শব্দ বা> 50,000। <1,000 শব্দের একটি তালিকা খুব সংক্ষিপ্ত এবং অনেকগুলি দরকারী শব্দ বাদ দেওয়া হয়েছে। যাইহোক,> 50,000 শব্দের একটি তালিকা আমার অ্যালগরিদমের (গতি বিজ্ঞানের) জন্য কিছুটা হয়ে উঠতে শুরু করে।

যে কোনও তালিকার 3,000-12,000 ডলার ইংরেজি শব্দ জানে। সাধারণত একটি টেক্সট ফাইলে। এছাড়াও, এটি তুলনামূলকভাবে অ-বিধিনিষেধযুক্ত লাইসেন্স থাকা প্রয়োজন (অর্থাত্‍ পুনরায় বিতরণযোগ্য)।


উত্তর:



2

http://wordlist.sourceforge.net/ এর শব্দের একটি তালিকা রয়েছে। আমি সাধারণত কল্পনা করব যে আরও শব্দ যুক্ত করা মোটেই সংখ্যামূলক নিবিড় হবে না (যেহেতু এটির তুলনায় ওয়ার্ডলিস্টের পরিমাণের দৈর্ঘ্য সবচেয়ে খারাপ, এবং আপনি যদি অভিধান বা অন্য কোনও অনুকূলিত ডেটাস্ট্রিউচার ব্যবহার করছেন তবে এটি সম্ভবত দ্রুত))।


আমার বর্তমান অ্যালগরিদম পুরোপুরি পাইথনে লেখা এবং তালিকাগুলি ব্যবহার করে। সুতরাং আরও আইটেম, আরও তুলনা। এটি আসলে ~ 100,000 পর্যন্ত ভাল পরিচালনা করে। তবে আমার এটি তাত্ক্ষণিকভাবে হওয়া দরকার, এমনকি কম পারফরম্যান্স মেশিনে (যেমন, নেটবুক এবং পুরানো কম্পিউটার)। প্রায় ,000 50,000 এ আমার নেটবুক স্ট্রেন হতে শুরু করে (এটি প্রায় 0.3 সেকেন্ড সময় নেয়)।
আয়তক্ষেত্র

আমার মনে হয় আপনি তখন কিছু ভুল করছেন ... তদতিরিক্ত, একটি কেস স্যুইচ (26 টি প্রথম অক্ষরের জন্য) নাটকীয়ভাবে জিনিসগুলিকে গতিবেগিত করবে।
সান্দোস

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.