পিডিএফ অনুলিপি করা পাঠ্য কপি করার সময়


23

আমি একটি পিডিএফ ফাইল থেকে পাঠ্য অনুলিপি এবং আটকানোর চেষ্টা করছি।

যাইহোক, আমি যখনই মূল পাঠ্যটি পেস্ট করি তবে এটি গলার স্বরযুক্ত চরিত্রগুলির একটি বিশাল জগাখিচুড়ি। পাঠ্যটি নীচের মতো দেখাচ্ছে (এটি কেবলমাত্র একটি ছোট এক্সট্র্যাক্ট):

4$/)5=$13! ,4&1*%-! )5'$! 1$2$)&,$40! 65))! .*5)1! -#$! )/'8*/8$03! 
(4/+$6&4;0!/'1!-&&)0!*0$1!.9!/,,)5%/-5&'!1$2$)&,$403!5'!+*%#!-#$! 
0/+$!6/9! -#/-! &,$4/-5'8! 090-$+! 1$2$)&,$40! .*5)1!1$25%$! 1452$40! 
/'1! &-#$4! 090-$+! 0&(-6/4$! %&+,&'$'-0! *0$1! .9! /,,)5%/-5&'! 
1$2$)&,$40!-&1/97!"#$!+5M!&(!,4&1*%-!)5'$!/'1!,4&1*%-!1$2$)&,$40! 
65))! .$!+*%#!+&4$! $2$')9! ./)/'%$13! #&6$2$43! -#/'! -#$!+5M! &(! 
&,$4/-5'8!090-$+!/'1!/,,)5%/-5&'!1$2$)&,$40!-&1/97! 
)*+*+, C<88,?>8513AG<5A14, 

আমি এটি অ্যাডোব এবং ফক্সিট পিডিএফ পাঠক উভয় ক্ষেত্রেই চেষ্টা করেছি। আমি অ্যাডোব রিডারটিতে একটি 'সংরক্ষণাগার হিসাবে সংরক্ষণ করুন' করেছি এবং ফলস্বরূপ পাঠ্য ফাইলটি একই গার্ল্ড পাঠ্য।

কোনও ধারণা কীভাবে আমি এই পাঠ্যটি নন-গার্ফড থেকে বের করতে পারি? (ম্যানুয়াল টাইপিং ব্যতীত ... উত্তোলনের জন্য অনেকগুলি পাঠ্য রয়েছে))


কিছু স্ক্রিন রিডার ইউটিলিটিগুলি চেষ্টা করুন (যা জেপিগের সাথে কাজ করে, একটি মুদ্রণ স্ক্রিন করুন এবং সেখানে আপনি যান) বা এখানে অন্যরকম উপায় । (কেবলমাত্র 'অনুমান', এর জন্য আমাকে কামড়ান না then আমি তারপরে প্রথম পথটি ব্যবহার করেছি Hope আশা করি আরও সুবিধাজনক উপায় রয়েছে)।
অ্যাপাচি


আমি কমপক্ষে 10.8.2 হিসাবে ওএস এক্স এর মাধ্যমেও এই সমস্যাটি নিশ্চিত করতে পারি। আমি পিডিএফ ফাইলের কাঠামোর মধ্য দিয়ে বেশ কিছুটা সময় ব্যয় করেছি, তবে দুর্ভাগ্যক্রমে আমি ক্ষতিটি মেরামত করার কোনও উপায় দেখতে পাচ্ছি না। অ্যাক্রোব্যাট প্রো-এর "প্রিফলাইট" ফাইলটি পিডিএফ / এ স্ট্যান্ডার্ডের বিপরীতে পরীক্ষা করার সময় সমস্যাগুলির প্রতিবেদন করে এবং ইনভেন্টরি প্রতিবেদনে দেখানো হয়েছে যে গ্লাইফগুলি স্পষ্টত ভুল ইউনিকোড অক্ষরের বিরুদ্ধে ম্যাপ করা হয়েছে। আমি অ্যাপল - আইডি 12655651 এর সাথে একটি বাগ রিপোর্ট উত্থাপন করেছি / আমি / আমার কাছে কোনও আপডেট পেলে এখানে আবার রিপোর্ট করব।
কেনডি

Mught সহায়ক হতে superuser.com/a/481510/153937
অঙ্কিত

উত্তর:


11

এর কাছাকাছি যাওয়ার সহজ উপায় হ'ল বিল্ট-ইন পিডিএফ রিডিং প্লাগইন সহ গুগল ক্রোমের সাম্প্রতিক সংস্করণে ফাইলটি খুলুন । তারপরে আপনি পাঠ্যের সন্ধানের জন্য Chrome এর অনুসন্ধান বৈশিষ্ট্যটি ব্যবহার করতে পারেন এবং অনুলিপি-পেস্টটি সঠিকভাবে কাজ করে।

আমি শিকির উত্তরে পিপিটাসের মন্তব্যে ভোট দিতে চাই, তবে আমার কাছে ক্রেডিট নেই :( সমস্যাটি কাস্টম ফন্ট এনকোডিং হতে পারে , এনক্রিপশন নয় । অ্যাক্রোবটে ফাইল -> বৈশিষ্ট্যগুলি ক্লিক করুন, তারপরে এনকোডিং দেখতে ফন্ট ট্যাবটি ক্লিক করুন , এবং সুরক্ষা ট্যাব এটি এনক্রিপ্ট করা হয়েছে কিনা তা দেখতে।


প্রকৃতপক্ষে, কাস্টম ফন্ট এনকোডিংটি আমার জন্য অপরাধী ছিল। তবে, ক্রোম এর সমাধান ছিল না। আমি ঘোস্টস্ক্রিপ্ট থেকে পিএস থেকে পিডিএফ পুনরুত্পাদন করে সমস্যাটি আংশিকভাবে সমাধান করেছি (পিএস উত্স পাওয়ার জন্য আমি ভাগ্যবান)। ল্যাটেক্স লিগ্যাচার প্রয়োগ করে এমন কোনও অক্ষর গোষ্ঠী (যেমন, এফএফ, সি, ফাই ইত্যাদি) পিডিএফের অনুলিপি করা পাঠ্যে প্রদর্শিত হবে না, যার জন্য আপনি অনুলিপি / পেস্ট করার সময় কিছু সম্পাদনা প্রয়োজন।
ফুহরম্যানেটর

1
ক্রোমের একই সমস্যা
জিনস্নু

4

আমার তৈরি পিডিএফগুলির সাহায্যে আমি এই সমস্যাটি আবিষ্কার করেছি এবং আমি বিশ্বাস করি যে সমস্যার উত্সটি আমি খুঁজে পেয়েছি: পিডিএফ ফাইলের আকার হ্রাস করতে ম্যাক ওএস এক্স এর পূর্বরূপ ব্যবহার করে।

চিত্রগুলির সাথে পিডিএফের সামগ্রিক ফাইলের আকার হ্রাস করার জন্য আমি পিডিএফগুলিতে চিত্রগুলি সঙ্কুচিত করতে কালারসিঙ্ক ইউটিলিটি ব্যবহার করে কিছু কোয়ার্টজ ফিল্টার তৈরি করেছি। যেমন এখানে বর্ণিত: http://www.macosxhints.com/article.php?story=20031106133852693

আমি দেখতে পেয়েছি যে আমি মূল (সঙ্কুচিত) পিডিএফ ফাইলটি থেকে টেক্সট অনুলিপি এবং অনুলিপি করতে সক্ষম হয়েছি, তবে আমার তৈরি ফাইল সাইজ হ্রাস ফিল্টারের মাধ্যমে পিডিএফ চালানোর পরে, ফলাফলযুক্ত সংকুচিত পিডিএফ স্পষ্টভাবে অনুলিপিটি অনুলিপি করে না (দেখতে দেখতে বেরিয়ে আসে) আপনার পোস্ট করা স্ট্রিং)।

তবে এটি একই মূল পিডিএফটি অ্যাডোব অ্যাক্রোব্যাট প্রো ডকুমেন্ট> ফাইল সাইজ হ্রাস ফাংশন এর মাধ্যমে চালিয়ে যাচ্ছে, ফলে সংকুচিত পিডিএফ সাফল্যের সাথে টেক্সট অনুলিপি এবং আটকান।

সুতরাং, এটি আপনার ক্ষেত্রে পুরোপুরি সহায়ক নয় যে ধরে নেওয়া যায় যে আপনার পিডিএফ ফাইলটি অন্য কোথাও থেকে পাওয়া গেছে এবং আপনি যদি আসল সংস্করণে পেতে পারেন না, যদি এটি কোনওভাবে সংকীর্ণ হয়। তবে এটি ব্যাখ্যা হতে পারে - যে ফাইলটির আকার হ্রাস করার প্রয়াসে কোনওভাবে ফাইলটি ম্যাঙ্গেল করা হয়েছিল।

এটি পিডিএফ থেকে পাঠ্য অনুলিপি এবং অনুলিপি করার অনুরূপ সমস্যাগুলির মধ্যে চলছে এমন কন্টেন্ট স্রষ্টাদের পক্ষে কার্যকর হতে পারে - আপনার পিডিএফ সঙ্কুচিত করতে ওএস এক্স কোয়ার্টজ ফিল্টার ব্যবহারে সতর্ক থাকুন!

--edit-- পূর্বরূপের সাথে পিডিএফ একত্রিত করার সময় আমি এই সমস্যাটিও লক্ষ্য করেছি। দুটি উত্স পিডিএফ অনুলিপি করে অনুলিপি করা যায়, তবে একটি ফাইল থেকে অন্য ফাইলটিতে একটি পৃষ্ঠা টেনে আনার পরে, সম্মিলিত পিডিএফ সংরক্ষণ করার সময়, সম্মিলিত নথির পাঠ্যটি অনুলিপি / আটকানো যায় না। এটি ম্যাকের ফাইলমেকার প্রো 11 এর সাথে একই সময়ে তৈরি হওয়া দুটি দস্তাবেজ - আমি ভাবতে পারি না যে তাদের আলাদা আলাদা এনকোডিং বা এ জাতীয় কোনও জিনিস থাকবে।


আমি একটি ম্যাক ওএস ব্যবহারকারীর কাছ থেকে কয়েকটি পিডিএফ ফাইল পেয়েছি। নির্বাচনটি ভাল, তবে অনুলিপি এবং পেস্ট আপনাকে কেবল আবর্জনা দেবে। গুগলেডক, অ্যাডোব টেক্সট হিসাবে সংরক্ষণ করুন সহ শব্দ রূপান্তরকারীগুলিতে একগুচ্ছ পিডিএফ চেষ্টা করুন, এগুলি সমস্তই টুকরো টুকরো টেক্সট দেয়।
টাইগার

আমি সন্দেহ করি যে ওএস এক্স পিডিএফ সঙ্কুচিত হওয়াই অপরাধী। এর বাইরে যে কেউ এই ধরনের অপারেশন "পূর্বাবস্থাপন" করার কোন উপায় সম্পর্কে সচেতন? ধন্যবাদ!
টাইগার

আমি পিডিএফ ফাইলটি কয়েকটি (ভার্চুয়াল) প্রিন্টারে মুদ্রণ করেছি এবং আমি 4x আকারের পিডিএফ ফাইলগুলি স্ফীত করেছি। আপাতত মুদ্রিত ফাইলটি চিত্র, কোনও পাঠ্য নির্বাচন করা যায় না, যখন মূলটি নির্বাচিত করা যায় (যদিও গার্ফড)।
টাইগার

4

কার্যকারণ করার আরও একটি সহজ উপায় আছে :)

ক্রেডিপিডিএফ, অ্যাডোব 2 পিডিএফ প্রিন্টার বা অন্য কোনও অনুরূপ স্টাফ ব্যবহার করে ডকুমেন্টটি প্রিন্ট করুন নীচের লাইনটি হ'ল, আপনাকে পিডিএফ ফর্ম্যাটে মুদ্রণ করতে হবে।

অনেক ক্ষেত্রে এটি সহজেই সমস্যাটি সরিয়ে ফেলবে।


2

সমাধান আমার পক্ষে কাজ করেছে:

  • দস্তাবেজটি Google ড্রাইভ / ডক্সে আপলোড করুন
  • গুগল এটি পিডিএফ হিসাবে (২০১৩ হিসাবে) আমদানি করবে
  • পিডিএফ ভিউ খুলুন এবং ফাইল > ওপেন > গুগল ডক্স নির্বাচন করুন
  • দস্তাবেজটি রফতানি করতে প্রায় এক মিনিট সময় লাগবে

ফলাফলগুলি নিখুঁত ছিল না, তবে আমি সেখানে of০% পথ পেয়েছি এবং আমাকে পর্যাপ্ত পাঠ্য সরবরাহ করেছেন যা আমাকে সবকিছুই আবার লিখতে হয়নি!


2

সলভড: (উইন্ডোজ 8, অ্যাক্রোব্যাট একাদশ, অফিস 2010 এ আমার জন্য কাজ করেছেন)

বিকল্প 1:

  1. "মাইক্রোসফ্ট এক্সপিএস ডকুমেন্ট রাইটার" আউটপুট ব্যবহার করে অ্যাক্রোব্যাট থেকে মুদ্রণ করুন: "আপনার ফাইলের নাম.অক্সপস"
  2. এক্সপিএস ভিউয়ারের সাথে "... অক্সপিএস" খুলুন। * (নীচের মন্তব্যে ডাউনলোড লিঙ্ক দেখুন)
  3. সর্বোচ্চ রেজোলিউশন (600 ডিপিআই) ব্যবহার করে পিডিএফ (এক্রোব্যাট পিডিএফ, বা কিউটপিডিএফ) মুদ্রণ করুন।
  4. অ্যাক্রোব্যাট দিয়ে খুলুন এবং ওসিআর (অনুসন্ধানযোগ্য চিত্র (সঠিক)) বিকল্পটি ব্যবহার করুন।

লোটোখেলা!

মন্তব্যসমূহ:

  • সর্বাধিক রেজোলিউশন এবং সন্ধানযোগ্য চিত্র (নির্ভুল) ব্যবহার করা আপনার পাঠ্যটি পরিষ্কার চেহারাটি হারিয়ে না ফেলে সংরক্ষণ করবে। নিম্ন রেজোলিউশন আপনার পাঠ্য পাঠযোগ্য, তবে কৃপণ খুঁজছেন।
  • মাইক্রোসফ্ট এক্সপিএস (ফাইলগুলি) ডাউনলোড করুন : http://www.microsoft.com/en-us/download/details.aspx?id=11816
  • আপনি যদি না জানেন তবে ওসিআর কী, বা সন্ধানযোগ্য চিত্রটি কোথায় পাবেন (সঠিক), বা কীভাবে "মাইক্রোসফ্ট এক্সপিএস ডকুমেন্ট রাইটার" ব্যবহার করে মুদ্রণ করবেন, আপনার নিজের অভিজ্ঞতার জন্য দয়া করে এটি গুগল করুন।

* যদি আপনার এক্সপিএস ইনস্টল না থাকে তবেই ডাউনলোড করুন।

বিকল্প 2:

অনুরূপ করুন, তবে চিত্র হিসাবে সংরক্ষণ করুন (পিএনজি, টিফ, ...), তারপরে আপনাকে সমস্ত পৃষ্ঠাগুলি এক "পিডিএফ" ফাইলে একত্রিত করতে হবে।


1
আপনি যখন পিডিএফ-তে মুদ্রণ 3 পদক্ষেপে যেতে পারেন তখন 1,2 এবং 3 টি পদক্ষেপ অনেক দীর্ঘ পথ বলে মনে হয়। (যেমন আপনার পিডিএফ পাঠকের অভ্যন্তর থেকে)। এক্সপিএসের মাধ্যমে ঘুরতে হবে না।
হেনেস

@ হেনেস ৪ র্থ পদক্ষেপ নেওয়ার ফলে ত্রুটি পাওয়া যায়Acrobat could not perform OCR on this page because: This page contains renderable text
ফুহরম্যানেটর

'রেন্ডারেবল টেক্সট' এমন কিছু শব্দ যা এখনও আঁকতে (রেন্ডার করা) দরকার। সম্ভাব্য ইতিমধ্যে এটি সম্পন্ন হয়েছে এবং আপনি যদি এক্সপিএসের মাধ্যমে যান তবে ওসিআর-সক্ষম বিটম্যাপ হিসাবে সঞ্চিত। কিন্তু যে শুধু একটি অনুমান।
হেনেস

1

এমন ঝুঁকি রয়েছে যে তথ্যগুলি মোটেও পুনরুদ্ধারযোগ্য হবে না। পিডিএফ ডকুমেন্টগুলি মূলত একটি ডকুমেন্ট অন্যটি, একটি সাধারণ পাঠ্য, অন্যটি একটি চিত্রকে বোঝায়। আপনি যখন দস্তাবেজটি অনুলিপি করে আটকান, তখন ছবিটি দেখার সময় আপনি পাঠ্যটিকে চিহ্নিত করেন তবে আপনার ক্লিপবোর্ডে যা অনুলিপি করা হয়েছে তা হ'ল পাঠ্যের অংশের সাথে সম্পর্কিত টুকরা।

দস্তাবেজটি তৈরি হওয়ার উপর নির্ভর করে পাঠ্য অংশের গুণমান এবং প্রাপ্যতা ব্যাপকভাবে পৃথক হতে পারে। আপনি যদি অ্যাক্রোব্যাট, ওয়ার্ড, পিডিএফ প্রিন্টার ড্রাইভার বা অন্য কোনও পদ্ধতি ব্যবহার করে ওয়ার্ড প্রসেসর ডকুমেন্টটি পিডিএফ ফর্ম্যাটে সংরক্ষণ করেন তবে মানটি সাধারণত দুর্দান্ত হবে, যেহেতু মূল ফাইলটির পাঠ্য ফাইল থেকে তৈরি করা যেতে পারে। কিছু বিশেষ অক্ষর বিকৃত হয়ে উঠতে পারে, তবে সাধারণ পাঠ্যটি সাধারণত সূক্ষ্ম হয়।

যদি স্ক্যান করা চিত্র থেকে দস্তাবেজটি তৈরি করা হয় তবে, পাঠ্যের অংশটি সাধারণত চিত্রটির ওসিআর প্রসেসিং দ্বারা তৈরি করা হয়, যা দুঃখজনক ফলাফল তৈরি করতে পারে, বিশেষত যদি উদ্দেশ্যটি সর্বোত্তমর চেয়ে কম হয়।

পিডিএফ তৈরির জন্য ব্যবহৃত একটি খারাপ প্রোগ্রাম বা ভুল সেটিংস, পাঠ্য অংশটি সম্পূর্ণরূপে গল্ফ হয়ে যেতে পারে, সম্ভবত, সম্ভবত এটি তৈরির পরে ফাইলটিতে কিছু ধরণের এনক্রিপশন চলতে পারে।

নীচের লাইনটি হ'ল, যদি নথির পাঠ্য অংশটি সত্যিই খারাপ হয়, তবে এটি আরও ভাল করার কোনও উপায় নেই। আপনার সেরা বাজি হ'ল পাঠ্যের অংশটি পুরোপুরি সরিয়ে ফেলা হবে এবং প্রোগ্রামটি ওসিআর প্রক্রিয়াটি আবার করবে। আমি মনে করি এটি অ্যাক্রোব্যাটের মধ্যে থেকে কার্যকর হতে পারে তবে আমি পুরোপুরি নিশ্চিত নই।


1

এর একটি সম্ভাব্য কারণ হ'ল পিডিএফটিতে ফন্ট এম্বেড করা একটি কাস্টম এনকোডিং ব্যবহার করছিল, যা পিডিএফ থেকে পাঠ্য অনুলিপি করার সময় সঠিকভাবে প্রয়োগ হয় না।

সমস্ত সামগ্রী নিজে নিজে টাইপ করা থেকে নিজেকে বাঁচাতে আপনি বিভিন্ন পদ্ধতি প্রয়োগ করতে পারেন।

  1. আপনি কি 'নেট জুড়ে ডাউনলোডযোগ্য' pdftotext.exe 'সরঞ্জামগুলির সাথে পাঠ্যটি বের করার চেষ্টা করেছিলেন? (আমি ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.02pl4-win32.zip এ অন্তর্ভুক্ত থাকা একটিতে সুপারিশ করব )।
  2. অ্যাক্রোব্যাট রিডারের সর্বশেষ সংস্করণটিতে "পাঠ্য হিসাবে সংরক্ষণ করুন ..." বিকল্প রয়েছে । এটি "copy'n'paste" ব্যবহার করে না (যা আপনাকে গার্ফলেড পাঠ্য দিয়েছে), তবে সম্ভবত পর্দায় পাঠ্য রেন্ডারিংয়ের জন্য ব্যবহৃত একই সফ্টওয়্যার রুটিনগুলি ব্যবহার করে এবং এর ফলে আরও কার্যকর ব্যবহারের ফল হতে পারে।
  3. যদি '২' কাজ করে না, এবং যদি আপনার অ্যাক্রোব্যাট পেশাদারের অ্যাক্সেস থাকে: ফন্ট-এম্বেডিং ডিস্টিলার প্রোফাইলগুলির মধ্যে একটি ব্যবহার করে পিডিএফটিকে পুনরায় ডিস্টিল করার চেষ্টা করুন।
  4. যদি '3.' অ্যাক্রোব্যাট প্রফেশনাল অ্যাক্সেস থাকা সত্ত্বেও, কাজ করে না: পিডিএফটি আবার ডিস্টিল করার চেষ্টা করুন, তবে এবার আপনার 'ইমেজ হিসাবে মুদ্রণ' বিকল্পটি ব্যবহার করা উচিত (মূল মুদ্রণের নীচের বাম কোণে 'অ্যাডভান্সড' বোতামের মাধ্যমে উপলব্ধ ডায়ালগ)। নিশ্চিত করুন যে আপনি 600dpi ব্যবহার করেছেন (যদিও এটি একটি বিশাল ফাইল তৈরি করতে পারে)। ফলস্বরূপ পিডিএফ আপনি আবার অ্যাক্রোব্যাট প্রোতে খুলবেন। এখন ফাইলটিতে অ্যাক্রোব্যাটের 'ওসিআর' অ্যালগরিদম প্রয়োগ করুন, যার ফলে এম্বেড করা টেক্সট হবে (রিডারে অন-স্ক্রিন উপস্থাপনের জন্য ব্যবহৃত হয় না, তবে স্ট্রিংগুলি অনুসন্ধান এবং হাইলাইট করার জন্য ব্যবহৃত হয়)। এখন আপনি উপরের আলোচিত যে কোনও পদ্ধতি ব্যবহার করে এই পিডিএফ থেকে পাঠ্যটি বের করার জন্য আবার চেষ্টা করতে পারেন।

আমার জন্য, পিডিএফ-এ পুনরায় মুদ্রণের জন্য অ্যাক্রোব্যাট প্রো একাদশ ব্যবহার করে - তবে "চিত্র হিসাবে মুদ্রণ করুন" এর সাহায্যে চেক করা হয়েছে ( প্রিন্ট ... ডায়ালগ থেকে অ্যাডভান্সড ... বোতাম / উপ- ডায়ালগ - এ পরীক্ষা করা হয়েছে) the তারপরে আপনি শেষ পর্যন্ত সঠিকভাবে ফলাফলটি ওসিআর করতে পারেন । এই পৃষ্ঠায় উল্লিখিত অন্য কোনও সমাধান সমাধান করেনি। দ্রষ্টব্য: বড় নথির জন্য এটি কিছুটা সময় নিতে পারে এবং ফলাফল পিডিএফটি বেশ বিশাল হতে পারে।
গ্লেন স্লেডেন

@ গ্লেনস্লেডেন: খুশী আমার পরামর্শ আপনার পক্ষে কাজ করেছে ... এতে কী অনুপস্থিত ছিল যে আপনি ভেবেছিলেন এটি এখনও উত্থানের যোগ্য নয়?
কার্ট ফেফেল

উম, আমি upvote করেছি। এটি এখনও আমার জন্য '1' হিসাবে দেখায়। আমার একমাত্র অভিযোগ ছিল আপনার উত্তরটি নীচে ছিল এবং এটি খুঁজে পেতে আমাকে কিছুটা সময় নিয়েছিল (আপনার দোষ নয় ...)
গ্লেন স্লেডেন

ঠিক আছে, @ গ্লেনস্লেডেন, তারপরে সেই উর্ধ্বতনটি অবশ্যই অনেক আগে হয়েছে (উপরে আপনার মন্তব্যের অনেক আগে)।
কার্ট ফেফেল

না, আমি একই সাথে "12 ঘন্টা আগে" আপত্তি জানিয়েছিলাম আমি মন্তব্যটি লিখেছি ... আমি এখনও একটি নীল তীর দেখতে পাচ্ছি যার (আমার বিশ্বাস) আমার ভোট (এক) ভোট যা বর্তমানে নিবন্ধিত হয়েছে। এবং আমি স্মরণ করি যে গত রাতে আমি ভোট দেওয়ার আগে এটি '0' ছিল।
গ্লেন স্লেডেন

1

আমার একজন ব্যবহারকারী সবেমাত্র একই সমস্যাটির প্রতিবেদন করেছেন (উইন্ডোজের জন্য ডিস্টিলার দিয়ে পিডিএফ তৈরি করা হয়েছিল), অনুলিপি করা পাঠ্যটি কেবল গার্ফড টেক্সট এবং তিনি কোনও নথির ভিতরে সন্ধান করতে পারেন নি। আমি আমার ম্যাক এ চেষ্টা করেছি এবং কোন সমস্যা পাইনি। দেখা গেল, আমি অ্যাপলের প্রাকদর্শন অ্যাপ্লিকেশনটি ব্যবহার করেছি, যখন তিনি তার উইন্ডোজ মেশিনে অ্যাডোব রিডার ব্যবহার করেছিলেন। তারপরে আমি আমার ম্যাকে অ্যাডোব রিডারকে একই রকম প্রভাবের মুখোমুখি করেছিলাম। আমার কাছে মনে হচ্ছে:

  • অ্যাডোব রিডার সংরক্ষিত পাঠ্যে কাইপিং করছে এবং অনুসন্ধান করছে।

  • অ্যাপলের প্রাকদর্শন এনকোডিং ভেক্টর প্রয়োগ করার পরে অনুলিপি এবং অনুসন্ধান করবে।

আমি এটি নিশ্চিত করে বলতে পারি না তবে এটি আমার পর্যবেক্ষণের ব্যাখ্যা দেবে। এবং এটি প্রকৃতপক্ষে এখানে অন্য পোস্টে বর্ণিত সংযুক্ত / হ্রাসযুক্ত ফাইলগুলি সংরক্ষণ করার সময় সমস্ত ধরণের এনকোডিং তৈরি করার অনুমতি দেবে: প্রাকদর্শন সহ আপনি এখনও পাঠ্যটি বের করতে পারেন।

প্রথমে আমি ভেবেছিলাম যে এমবেড থাকা ফন্ট সাবসেটটি ভিতরে গর্তগুলি রেখে মূল চরিত্রের অবস্থানটি ব্যবহার না করে সংবিধ এনট্রি হিসাবে এনকোড করা আরও যুক্তিযুক্ত হবে। তবে আমি বুঝতে পেরেছি যে মূল এন্ট্রি সহ ফন্ট সাবসেটে একটি এনকোডিং ভেক্টর ব্যবহার করে, প্রায়শই ব্যবহৃত হয় এমন অক্ষরগুলির বাইটে কম বিট 1 সেট করা যেতে পারে এবং আরও ভালভাবে সংকুচিত করা যেতে পারে (এটি এর এনট্রোফি কমিয়ে দিতে পারে) সামগ্রিক পাঠ্য এইভাবে)।


1

এটিকে গুগল ডক্সে আপলোড করা এবং অপশন > সাদামাটা এইচটিএমএল বিকল্পটি ব্যবহার করে পাঠ্য অনুলিপিযোগ্য পাঠ্যকে কিছুটা ফাঁকা ফাঁকে প্রায় 80% পর্যন্ত সঠিক করে দেয়।

এই সহ থ্রেড গৃহীত উত্তর থেকে একই সমস্যা ওয়ার্কিং উদাহরণ দিয়ে এই ব্যাখ্যা করে।


1

আমি গুগল ডক্স বিকল্পটি চেষ্টা করিনি কারণ এটি এখনও আমার অফিসে সমর্থিত নয়। তবে ফাইলটি "স্ক্যানসফট পিডিএফ তৈরি করুন!" এ মুদ্রণ করে! "অ্যাক্রোব্যাট 9" থেকে (পুরো ফাইলটি ছবিতে মুদ্রণ করে) এবং "নুয়েন্স পিডিএফ রূপান্তরকারী" এ মুদ্রিত ফাইলটি খোলার মাধ্যমে (যদি আমি চিত্র ফাইলটি সন্ধানযোগ্য এবং সম্পাদনাযোগ্য করতে চাই, তবে আমি এটির জন্য অনুরোধ জানাই) তবে আমি সক্ষম হয়েছি একটি ওয়ার্ড ডকুমেন্ট আছে যাতে আমি অনুলিপি থেকে অনুলিপি করতে পারি। যদিও এটি প্রায় 80-90% নির্ভুলতার সাথে নিখুঁত নয়। তবে ওহে, সেই অংশগুলির সাথে তুলনা করতে এবং অফসেট করার জন্য আপনার কাছে এখনও মূল পিডিএফ ফাইল রয়েছে যা ঠিক করা যায় না। পুরো জিনিস টাইপ করা থেকে সময় বাঁচায়। আমার 2 সি।


0

আমি উইন্ডোজ এক্সপির জন্য স্ক্যানসফ্ট পিডিএফ কনভার্টারের একটি পুরানো সংস্করণ সহ কিছু সম্পাদনাযোগ্য-টেক্সট পিডিএফ তৈরি করেছি এবং তারপরে ম্যাকের পূর্বরূপ প্রোগ্রামে পৃষ্ঠাগুলি একত্রিত করেছি। পৃথক পৃষ্ঠাগুলির প্রত্যেকটির জন্য, আমি ম্যাকের অ্যাডোব রিডার থেকে সঠিকভাবে অনুসন্ধান করতে, অনুলিপি এবং রফতানি করতে পারি। পূর্বরূপের সাথে মিলিত হয়ে একটি ফাইল হিসাবে সংরক্ষণ করা হলে, সমস্তই স্ক্রিনে ভাল দেখায় তবে কয়েকটি সংখ্যক উত্তরণ সঠিকভাবে অনুসন্ধানযোগ্য / রপ্তানিযোগ্য ছিল। এই সমস্যাটি আমাকে এখানে এনেছে।

এখানে পোস্টগুলি আমাকে কিছু ভাল পয়েন্টার দিয়েছে (ধন্যবাদ!) আমি ফন্টের জন্য ফাইল বৈশিষ্ট্য তাকান। উইন এক্সপি (যেখানে সব কিছু ঠিক আছে) এর একক পৃষ্ঠার ফাইলগুলি জানিয়েছে এনকোডিংটি এএনএসআই। পূর্বরূপে সংযুক্ত ফাইলটিতে (যেখানে অনুলিপিযুক্ত পাঠ্য টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো রয়েছে) বেশিরভাগ ফন্টের জন্য "বিল্ট-ইন" হিসাবে কয়েকটি "রোমান" হিসাবে এনকোডিং দেখিয়েছিল।

আমার সমস্যার সমাধানটি সর্বদা আমার নাকের নীচে ছিল - স্ক্যানসফট প্রোগ্রাম নিজেই ফাইলগুলি একত্রিত করতে পারে। আমি যখন স্ক্যানসফ্টের কম্বিনার ব্যবহার করেছি এবং ম্যাকটিতে ফাইলটি খুলি তখন সমস্ত ফন্টগুলি এএনএসআই-এনকোড হিসাবে প্রদর্শিত হয়েছিল এবং সমস্ত পাঠ্য নিখুঁতভাবে রফতানি / অনুলিপি করা হয়েছিল। কেন পৃথিবীতে আমি এগুলিকে প্রথমে পিডিএফ কনভার্টারে একত্রিত করিনি, জানি না। ধন্যবাদ, পোস্টার!

লিনাক্স সিস্টেমে ফাইলগুলি খোলার বিষয়টিও সত্য।

আমি জানি এটি উইন্ডোজ-শুধুমাত্র সমস্যাগুলি ব্যাখ্যা করে না - যদি না পিডিএফটির অনুরূপ মিশ্র উত্স না থাকে?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.