একটি ইংরেজী বাক্যটির জটিলতা কীভাবে নির্ধারণ করবেন?


10

আমি লোককে দ্বিতীয় ভাষা হিসাবে ইংরেজি শিখতে সাহায্য করার জন্য একটি অ্যাপে কাজ করছি। আমি বৈধতা দিয়েছি যে বাক্যগুলি অতিরিক্ত প্রসঙ্গ সরবরাহ করে একটি ভাষা শিখতে সহায়তা করে। আমি 60 ছাত্রের একটি শ্রেণিকক্ষে একটি ছোট গবেষণা পরিচালনা করে তা করেছি।

আমি বিভিন্ন ইংরেজি শব্দের জন্য উইকিপিডিয়া থেকে এক লক্ষেরও বেশি বাক্য খনন করেছি (ব্যারনস ৮০০ শব্দ এবং ১০০০ সর্বাধিক প্রচলিত ইংরেজি শব্দ সহ)

সম্পূর্ণ ডেটা https://buildmyvocab.in এ উপলব্ধ

সামগ্রীর মান বজায় রাখার জন্য, আমি বাক্যগুলি ফিল্টার করেছিলাম যা 160 টি অক্ষরের চেয়ে বেশি লম্বা ছিল কারণ তাদের বুঝতে অসুবিধা হতে পারে।

পরবর্তী পদক্ষেপ হিসাবে, আমি বোঝার সুবিধার্থে এই বিষয়বস্তু বাছাইয়ের প্রক্রিয়াটি স্বয়ংক্রিয় করতে সক্ষম হতে চাই। আমি নিজেও একজন স্থানীয় নাগরিক English আমি সহজ বৈশিষ্ট্যগুলি কঠিন বাক্যগুলি থেকে আলাদা করতে কী কী বৈশিষ্ট্যগুলি ব্যবহার করতে পারি তা জানতে চাই।

এছাড়াও, আপনি কি মনে করেন এটি সম্ভব?

উত্তর:


8

হ্যাঁ. বিভিন্ন মেট্রিক রয়েছে যেমন fogg সূচক। পাইথনে পাঠ্যপুস্তকের একটি দুর্দান্ত তালিকা এবং প্রয়োগ রয়েছে।

>>> ts.flesch_kincaid_grade_level
10.853709110179697
>>> ts.readability_stats
{'automated_readability_index': 12.801546064781363,
 'coleman_liau_index': 9.905629258346586,
 'flesch_kincaid_grade_level': 10.853709110179697,
 'flesch_readability_ease': 62.51222198133965,
 'gulpease_index': 55.10492845786963,
 'gunning_fog_index': 13.69506833036245,
 'lix': 45.76390294037353,
 'smog_index': 11.683781121521076,
 'wiener_sachtextformel': 5.401029023140788}

আপনি এন্ট্রপি বা অনন্য শব্দের শতাংশের দিকেও দেখতে পারেন তবে উপরের ম্যাট্রিকগুলি আরও প্রাসঙ্গিক।
গ্রিমস্পেকার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.