চ্যালেঞ্জ:
প্রদত্ত পাঠ্যে সর্বাধিক ব্যবহৃত শব্দের একটি ASCII চার্ট তৈরি করুন।
নিয়ম:
- কেবলমাত্র একটি শব্দের অংশ হিসাবে গ্রহণ করুন
a-z
এবংA-Z
(বর্ণানুক্রমিক অক্ষর)। - কেসিং উপেক্ষা করুন (
She
==she
আমাদের উদ্দেশ্যে)। - নিম্নলিখিত শব্দগুলি উপেক্ষা করুন (বেশ স্বেচ্ছাচারী, আমি জানি):
the, and, of, to, a, i, it, in, or, is
স্পষ্টকরণ: বিবেচনা করা
don't
: এটি 2 টি পৃথক শব্দ হিসাবে বিবেচিত হবে পরিসীমাa-z
এবংA-Z
: (don
এবংt
)।Allyচ্ছিকভাবে (আনুষ্ঠানিকভাবে এখন স্পেসিফিকেশনগুলি পরিবর্তন করতে খুব দেরি হয়ে গেছে) আপনি সমস্ত একক-বর্ণের 'শব্দ' বাদ দিতে পছন্দ করতে পারেন (এটি সম্ভবত উপেক্ষা তালিকার সংক্ষিপ্তকরণের জন্য তৈরি করতে পারে)।
প্রদত্ত একটি পার্স text
(কমান্ড লাইন আর্গুমেন্টের মাধ্যমে নির্দিষ্ট ফাইল পড়ুন বা পাইপড ইন অনুমান করুন us-ascii
) এবং word frequency chart
নিম্নলিখিত বৈশিষ্ট্যগুলি সহ আমাদের একটি তৈরি করুন :
- সবচেয়ে সাধারণ 22 শব্দের (অবতরণ ফ্রিকোয়েন্সি অনুসারে অর্ডার করা) জন্য চার্টটি (নীচের উদাহরণটিও দেখুন) প্রদর্শন করুন।
- বারটি
width
শব্দের উপস্থিতি (ফ্রিকোয়েন্সি) সংখ্যার প্রতিনিধিত্ব করে (আনুপাতিকভাবে)। একটি স্থান যুক্ত করুন এবং শব্দটি মুদ্রণ করুন। - নিশ্চিত হয়ে নিন যে এই বারগুলি (প্লাস স্পেস-ওয়ার্ড-স্পেস) সর্বদা ফিট থাকে :
bar
+[space]
+word
+[space]
সর্বদা <=80
অক্ষর হওয়া উচিত (নিশ্চিত হয়ে নিন যে আপনি সম্ভাব্য পৃথক বার এবং শব্দের দৈর্ঘ্যের জন্য অ্যাকাউন্ট করছেন: উদাহরণস্বরূপ: দ্বিতীয় সর্বাধিক সাধারণ শব্দটি তখন অনেক দীর্ঘ হতে পারে প্রথম যখন ফ্রিকোয়েন্সি তে এত পার্থক্য না)। এই সীমাবদ্ধতার মধ্যে বারের প্রস্থকে সর্বাধিক করুন এবং বারগুলি যথাযথভাবে স্কেল করুন (তারা যে ফ্রিকোয়েন্সিগুলি প্রতিনিধিত্ব করেন সে অনুযায়ী)
একটি উদাহরণ:
উদাহরণস্বরূপ পাঠ্যটি এখানে পাওয়া যাবে ( লুইস ক্যারল দ্বারা অ্যালিসের অ্যাডভেঞ্চারস ইন ওয়ান্ডারল্যান্ড )।
এই নির্দিষ্ট পাঠ্যটি নিম্নলিখিত চার্টটি প্রদান করবে:
_________________________________________________________________________ | _________________________________________________________________________ | সে | _______________________________________________________________ | আপনি | ____________________________________________________________ | বললেন | ____________________________________________________ | এলিস | ______________________________________________ | ছিল | __________________________________________ | যে | ___________________________________ | যেমন | _______________________________ | তার | ____________________________ | সঙ্গে | ____________________________ | এ | ___________________________ | গুলি | ___________________________ | টি | _________________________ | চালু | _________________________ | সব | ______________________ | এই | ______________________ | জন্য | ______________________ | ছিল | _____________________ | কিন্তু | ____________________ | থাকা | ____________________ | না | ___________________ | তারা | __________________ | সুতরাং
আপনার তথ্যের জন্য: উপরের চার্টটি এগুলি নির্মিত ফ্রিকোয়েন্সিগুলি:
[('সে', 553), ('তুমি', 481), ('বলে', 462), ('এলিস', 403), ('ছিল', 358), '' ', 330), (' হিসাবে ', 274), (' তার ', 248), (' সাথে ', 227), (' এট ', 227), (' এস ', 219), (' টি ' , 218), ('অন', 204), ('সব', 200), ('এটি', 181), ('জন্য', 179), ('হ্যাড', 178), (' তবে ', 175), (' হতে ', 167), (' নয় ', 166), (' তারা ', 155), (' তাই ', 152)]
দ্বিতীয় উদাহরণ (আপনি যদি পুরো স্পেসটি প্রয়োগ করেছেন কিনা তা পরীক্ষা
করে দেখুন ):you
লিঙ্কযুক্ত অ্যালিস ইন ওয়ান্ডারল্যান্ড ফাইলের প্রতিটি ঘটনাকে এর সাথে প্রতিস্থাপন করুন superlongstringstring
:
________________________________________________________________ | ________________________________________________________________ | সে | _______________________________________________________ | superlongstringstring | _____________________________________________________ | বললেন | ______________________________________________ | এলিস | ________________________________________ | ছিল | _____________________________________ | যে | ______________________________ | যেমন | ___________________________ | তার | _________________________ | সঙ্গে | _________________________ | এ | ________________________ | গুলি | ________________________ | টি | ______________________ | চালু | _____________________ | সব | ___________________ | এই | ___________________ | জন্য | ___________________ | ছিল | __________________ | কিন্তু | _________________ | থাকা | _________________ | না | ________________ | তারা | ________________ | সুতরাং
বিজয়ী:
সংক্ষিপ্ততম সমাধান (প্রতিটি ভাষাতে অক্ষর গণনা অনুসারে)। আনন্দ কর!
সম্পাদনা করুন : এখন পর্যন্ত ফলাফলগুলির সংক্ষিপ্তসার সারণী (2012-02-15) (মূলত ব্যবহারকারী নাস বানভ দ্বারা যুক্ত করেছেন):
ভাষা স্বচ্ছন্দ ======================= গল্ফস্ক্রিপ্ট 130 143 পার্ল 185 উইন্ডোজ পাওয়ারশেল 148 199 গণিত 199 রুবি 185 205 ইউনিক্স টুলচেন 194 228 পাইথন 183 243 ক্লোজার 282 স্কেল 311 হাসেল 333 আওক 336 আর 298 জাভাস্ক্রিপ্ট 304 354 গ্রোভি 321 মতলব 404 সি # 422 স্মার্টটাক 386 পিএইচপি 450 এফ # 452 টিএসকিউএল 483 507
সংখ্যাগুলি একটি নির্দিষ্ট ভাষায় সংক্ষিপ্ত সমাধানের দৈর্ঘ্যের প্রতিনিধিত্ব করে। "স্ট্রিক্ট" এমন একটি সমাধানকে বোঝায় যা স্পেকটিকে পুরোপুরি কার্যকর করে ( |____|
বারগুলি টেনে তোলে, একটি ____
লাইন দিয়ে প্রথম বারটি বন্ধ করে দেয়, উচ্চ ফ্রিকোয়েন্সি সহ দীর্ঘ শব্দগুলির সম্ভাবনার জন্য অ্যাকাউন্ট করে)। "রিলাক্সড" অর্থ সমাধানের জন্য সংক্ষিপ্ত করার জন্য কিছু স্বাধীনতা নেওয়া হয়েছিল।
শুধুমাত্র সংক্ষিপ্ততর সমাধানগুলি হলে 500 টি অক্ষর অন্তর্ভুক্ত থাকে। ভাষার তালিকাটি 'কঠোর' সমাধানের দৈর্ঘ্য অনুসারে বাছাই করা হয়। 'ইউনিক্স টুলচেইন' ব্যবহার করা হয় এমন বিভিন্ন সমাধানের জন্য যা traditionalতিহ্যবাহী * নিক্স শেল এবং সরঞ্জামগুলির একটি মিশ্রণ (যেমন গ্রেপ, টিআর, সাজানো, ইউনিক, মাথা, পার্ল, অ্যাজক) ব্যবহার করে।
s
এবং t
উপস্থাপিত হয়েছে তা দেখে আমি আনন্দিত ।