অ্যাক্রোব্যাট একাদশ ব্যবহার করে ল্যাটেক্স জেনারেটেড পিডিএফকে শব্দে রূপান্তর করা


5

আমি নিজেকে আবার খুঁজে পেয়েছি যে ল্যাটেক্স এবং মাইক্রোসফ্ট ওয়ার্ড উভয় দেশে বাস করা দরকার। আমার কাছে অ্যাক্রোব্যাট একাদশ উপলব্ধ আছে, তাই আমি ভেবেছিলাম যে আমি ল্যাটেক্স থেকে ওয়ার্ডে রূপান্তরকালে এটি কেবল মধ্যবয়স্ক হিসাবে ব্যবহার করব। দেখে মনে হয় অতীতে আমার এই কাজটি ছিল তবে এখন এটি কেবল প্রচুর গীব্র পাঠ্য তৈরি করে।

বর্তমান কর্মপ্রবাহ:

  • টেক্সওয়ার্কে লিকেক্স লিখুন (মিকটেক্স থেকে)
  • "PdfLaTeX + MakeIndex + BibTex" সেটিংস ব্যবহার করে টাইপসেট
  • অ্যাক্রোব্যাট প্রো একাদশে আউটপুট পিডিএফ খুলুন
  • ফাইল-> অন্যান্য হিসাবে সংরক্ষণ করুন-> মাইক্রোসফ্ট ওয়ার্ড-> শব্দ নথি Go
  • সেটিংসে, "মন্তব্য অন্তর্ভুক্ত করুন" এবং "প্রয়োজনে ওসিআর চালান" অনিচ্ছুক করুন
  • সংরক্ষণ

সমস্ত ঠিক হয়ে গেছে বলে মনে হচ্ছে, তারপরে আমি আউটপুট ওয়ার্ড ডকুমেন্টটি খুলি এবং সমস্ত পাঠ্যটি কেবল এলোমেলো প্রতীক। মজার বিষয় হচ্ছে, ফর্ম্যাটটি একেবারে নিখুঁত বলে মনে হচ্ছে - তালিকাগুলি তালিকাগুলি, লিঙ্কগুলি এখনও কাজ করে, পৃষ্ঠা বিন্যাসটি দুর্দান্ত দেখায় - কেবল অপঠনযোগ্য পাঠ্য। আমি পরীক্ষা করে দেখেছি, এবং অ্যাক্রোব্যাট পিডিএফটি সন্ধান করতে সক্ষম হয়েছে এবং টেক্সটটি শব্দে অনুলিপি করা (ক্লিপবোর্ডের মাধ্যমে) পুরোপুরি ঠিক আছে। তবে আমি যদি "ফরমেটিং সহ অনুলিপি" নির্বাচন করি এবং কথায় পেস্ট করি তবে আমি প্রতীকগুলিতে ফিরে আসছি।

আমি সন্দেহ করছি এটি কেবল একটি হরফ ইস্যু। আমি এটাও ধরে নিচ্ছি যে এটি মোটামুটি জেনেরিক সমস্যা যা অ্যাক্রোব্যাটের কাছে বিশেষভাবে নির্দিষ্ট নয়। আমি এইটিকে সাজানোর জন্য সত্যিই প্রত্যাশা করছি - আউটপুট ওয়ার্ড ডকুমেন্টের নিখুঁত হওয়ার দরকার নেই, এটির জন্য একই পাঠ্য এবং মোটামুটি একই বিন্যাস থাকা দরকার। মিকটেক্সে পরিবর্তনের সম্ভাব্য সেটিংস সম্পর্কিত কোনও ভাবনা যা পিডিএফ অ্যাক্রোব্যাট অর্জন করতে পারে তার সাথে আরও সহজ সময় কাটবে?

ধন্যবাদ!


আকর্ষণীয় - আমি টেমপ্লেটে \ RequirePackage {mmap added যুক্ত করেছি এবং এটি উল্লেখযোগ্যভাবে উন্নত হয়েছে। এটি এখনও ঠিক কী করে তা আমি নিশ্চিত নই (আমাকে এটি সন্ধান করতে হবে) তবে আমি এটি টেক্সট.স্ট্যাকেক্সেঞ্জা.কম / সেকশনস / ১১৫০০০/২ তে পেয়েছি । এখনও কিছু ভাঙা অক্ষর রয়েছে যদিও ডাবল ড্যাশ "এক্স" হয়ে যায়, 'চ' অভিনব হয়ে যায় '+' চিহ্ন, # 2 এর উপর একটি ক্রেজি বালজ রয়েছে বলে মনে হয় এবং কিছু অ্যাডাস্ট্রোফ তারা হয়ে উঠেছে। আরও চিন্তা কার্যকর হবে!
জ্যাকব শ্যাচার

উত্তর:


1

আমি ল্যাটেক্স ডকুমেন্ট ব্যবহার করে এই সমস্যাটি সমাধান করেছি

\usepackage[T1]{fontenc}
\usepackage{lmodern}

প্রথম বিবৃতিটি T1ফন্ট এনকোডিং সক্ষম করে এবং দ্বিতীয়টি আধুনিক ল্যাটেক্স ফন্টের ব্যবহার সক্ষম করে।

এমনকি আমি পুরো সময়টি (কেবল) প্রথমবার ব্যবহার করে আসছিলাম (যা নিজেই এই সমস্যাটি সমাধান করেনি) তবে দ্বিতীয় বিবৃতিটি যুক্ত করে এটি সংশোধন করে এবং অ্যাক্রোব্যাট প্রো (আমার ক্ষেত্রে এক্স) থেকে সংরক্ষিত ওয়ার্ড ডকুমেন্টটি সঠিকভাবে প্রদর্শিত হয়েছিল।

আরও তথ্যের জন্য এই https://tex.stackexchange.com/questions/115080/cannot-copy-text-from-the-simplest-pdf-file?rq=1 প্রশ্নের উত্তর দেখুন ।


0
  1. এই প্যাকেজগুলি লেটেক্স ফাইলে ব্যবহার করুন যা আরও ভাল পাঠ্য অনুলিপিযোগ্য পিডিএল ফাইল তৈরি করতে সহায়তা করতে পারে।

    • \ Usepackage [T1 এর] {fontenc}
    • \ Usepackage {lmodern}
  2. পিডিএফ ফাইল তৈরি করুন

  3. মাইক্রোসফ্ট ওয়ার্ড 2013 বা তারও বেশি দিয়ে পিডিএফ ফাইলটি খুলুন

  4. এটি আপনার সমস্ত পাঠ্য, চিত্র, সারণী রূপান্তরিত করবে। তবে পাতার উপরে / নীচে পাদটীকা, বইয়ের নাম, লেখকের নাম বিভাগগুলি নিয়ে আমার কিছুটা সমস্যা হয়েছিল।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.