আমি এমএস ওয়ার্ডের সামগ্রীটি পাঠ্য ও ফাইল ইউটিলিটি সহ ব্যবহারের জন্য সরল পাঠ্যে রফতানি করছি । আমার সীমাবদ্ধতা রয়েছে যেখানে এমএস সফ্টওয়্যারটিতে লাইন নম্বর বৈশিষ্ট্য সক্ষম করা হয়েছে এবং চূড়ান্ত আউটপুটে লাইন সংখ্যাগুলির কোনও রেফারেন্স অবশ্যই সেই সংখ্যার সাথে মেলে। সুতরাং "সংখ্যায়ন লাইন" লিখুন:
( পো, ইএ )
স্পষ্টতই ওয়ার্ডের জন্য , এই ধরণের সংখ্যাটি নতুন লাইনে লাইনগুলিকে ভেঙে দেয় না , এটি ডান মার্জিন (বা কিছু) পরে "লাইনগুলি" ভেঙে দেয় । একটি স্ক্রিপ্ট docx2txt
, এর জন্য ডিফল্টরূপে এটি অ্যাকাউন্ট করে না বলে মনে হয় এবং নতুন লাইনে লাইনগুলি ভেঙে দেয়। সুতরাং আমি যদি grep -n
নম্বর দিয়ে ব্যবহার করি তবে উপরের চিত্রের মতো লাইনগুলি উত্স লাইন সংখ্যা বৈশিষ্ট্যের সাথে মেলে না। এই ফাইলগুলিতে আমার যেমনভাবে ফাইলগুলি রূপান্তর করতে পার্ল স্ক্রিপ্টটি সম্পাদনা করতে হবে তা ডকুমেন্টেশন থেকে একেবারে পরিষ্কার নয়:
our $config_newLine = "\n"; # Alternative is "\r\n".
our $config_lineWidth = 80; # Line width, used for short line justification.
আমি বদলে চেষ্টা \n
জন্য \r\n
কিন্তু যে আমার জন্য কাজ বলে মনে হচ্ছে না। সুতরাং আমি নিম্নলিখিত সেটিংসের মাধ্যমে ওয়ার্ড থেকে ডকুমেন্টগুলি সরাসরি রফতানি করার জন্য অবলম্বন করেছি ( v21,64pc তে সরল পাঠ্য হিসাবে সংরক্ষণ করুন):
- ইউনিকোড (UTF-8)
- (সিআর / এলএফ) এর সাথে লাইন বিরতি + শেষ লাইনগুলি সন্নিবেশ করান
- চরিত্রের প্রতিস্থাপনের অনুমতি দিন
আর এখন তো যখন আমি ব্যবহার.txt
ফাইল সেখানে উৎস সংখ্যায়ন বৈশিষ্ট্য এবং লাইন সংখ্যার মধ্যে একটি নিখুঁত ম্যাচ হয় grep -n
আউটপুট।
- আমার মতো কোনও নির্দিষ্ট কনফিগারেশন / প্রক্রিয়া
docx2txt
বা এমন একটি কমান্ড লাইন ইউটিলিটি সম্পর্কে জানা উচিত যা আমার মতো ওয়ার্ডের অবলম্বন না করে লাইন ব্রেকগুলি সংরক্ষণ করার সময় আমার .docx ফাইলগুলিকে প্লেইন পাঠ্যে রূপান্তর করতে পারত? - লাইন ব্রেক এবং ফর্ম্যাটিংয়ের ক্ষেত্রে ফাইল / পাঠ্য উপযোগিতা ব্যবহারের জন্য প্লেইন টেক্সটটিতে এমএস ওয়ার্ড ডকুমেন্টগুলি (যার মধ্যে উচ্চারণযুক্ত অক্ষর থাকতে পারে) রফতানির জন্য সর্বোত্তম অনুশীলনগুলি কী কী ; এবং আমি রফতানির জন্য সিআর / এলএফ serোকানোর জন্য যে সেটিংসকে বেছে নিয়েছি তার সাথে কি কোনও নেতিবাচক প্রভাব রয়েছে?
নমুনা
প্রস্তাবিত হিসাবে আমি একটি নমুনা প্রদান। এই রার সংরক্ষণাগারে , আমি একটি সরল অনুচ্ছেদে একটি .ডোক্স ফাইল এবং এর রফতানি .txt ফাইলটি উল্লিখিত বিকল্পগুলির সাহায্যে ওয়ার্ড ব্যবহার করে বান্ডিল করেছি । পরেরটি docx2txt
সোর্স ফাইলে একটি ডিফল্ট রানের সাথে তুলনা করা যায় ।