আমি ম্যাক ওএস এক্স ১০.৮-তে একটি কমান্ড লাইন ইউটিলিটি কল করতে চাই যা আমাকে স্ট্যান্ডার্ড ওয়েস্টার্ন ম্যাক ওএস রোমান এনকোডিংয়ে সংরক্ষিত একটি পাঠ্য ফাইলকে আরও জেনেরিক ইউটিএফ -8 এ রূপান্তর করার ক্ষমতা দেয়।
আমি তৈরি করা একটি অ্যাপলস্ক্রিপ্ট থেকে ইউটিলিটিটি কল করব। অ্যাপলস্ক্রিপ্ট অত্যন্ত বড় টেক্সট ব্লকের সাথে কাজ করার সময় অত্যন্ত ধীর হয়। এর মতো, আমি ওএস এক্স কমান্ড লাইনটি ব্যবহার করে আমার পাঠ্য পার্সিং এবং রূপান্তর করতে চাই। আমি "সেড" নামে একটি সরঞ্জাম পেয়েছি, যা আমাকে পাঠ্য পার্সিং করতে দেয়। তবে, ফাইলটির এখনও অনেকগুলি উপাদান রয়েছে যা পরিষ্কার করা দরকার, ফাইলগুলি utf-8 হিসাবে খোলা থাকলে আবর্জনা হিসাবে উপস্থিত হওয়া অক্ষর (যেমন স্মার্ট উদ্ধৃতি এবং উপবৃত্তাকার))
আমি ভাবছি যে কোনও পাঠ্য এনকোডিং রূপান্তর জোর করে ফাইলে সমস্ত নন- utf8 অক্ষর মুছে ফেলতে সহায়তা করতে পারে। তবে, আমি দেখতে পাচ্ছি না যে কীভাবে "সেড" সহজেই পাঠ্য এনকোডিংকে রূপান্তর করতে পারে।
আমি ইতিমধ্যে বিল্ট-ইন অ্যাপলস্ক্রিপ্ট রুটিন ব্যবহার করে ডিস্কে ম্যাকআরমন হিসাবে টেম্প টেক্সট ফাইলটি সংরক্ষণ করব।
আপনার কোনও বিল্ট-ইন কমান্ড-লাইন সরঞ্জাম যা কোনও পাঠ্য এনকোডিংকে রূপান্তর করতে পারে সে সম্পর্কে কোনও ধারণা আছে? পারফরম্যান্স এবং অন্তর্নির্মিতের জন্য কমান্ড-লাইন, যেহেতু আমার স্ক্রিপ্টের অন্যান্য ব্যবহারকারীদের মধ্যে এটি বিল্ট-ইন না থাকলে অগত্যা যথাযথ সরঞ্জামসেট থাকবে না।
আপনার সাহায্যের জন্য ধন্যবাদ!