আমি কীভাবে একটি দূষিত পিডিএফ ফাইল ঠিক করতে / মেরামত করতে পারি?


79

দুর্নীতিগ্রস্ত পিডিএফ মেরামত করার জন্য কারও কি কোনও সুপারিশ বা পদ্ধতি রয়েছে? আমি যখন ফাইলটি খুলি তখন আমি পাই "এই দস্তাবেজটি খোলার সময় একটি ত্রুটি হয়েছিল the ফাইলটি ক্ষতিগ্রস্থ হয়েছে এবং এটি মেরামত করা যায় না।" সেখানে অনেকগুলি অজস্র সরঞ্জাম রয়েছে বলে মনে হচ্ছে তবে আমি সম্মানজনক হিসাবে বর্ণনা করতে পারি নি। এটির জন্য সম্ভবত কোনও ওপেনসোর্স লিনাক্স ভিত্তিক সমাধান রয়েছে?


ওপেনসোর্স পিডিএফ সরঞ্জামগুলি বেশ কৃপণ হয়ে থাকে, আমি ভয় করি। আপনি কি ব্যবহার করছেন?
শয়তনিকপপি 3'11

আরও দেখুন: superuser.com/questions/166999/…
slhck

অকার্যকর যেগুলি "রেজিস্ট্রি ক্লিনার" এর অগণিতের মতো দেখায় তেমন কোনও সরঞ্জামের চেহারা পছন্দ হয়নি। অ্যাডোব প্রো চেষ্টা করে চলেছেন এবং ঘোস্টস্ক্রিপ্ট বা পিডিএফফর্জের কোনও মেরামতের স্যুইচ রয়েছে কিনা তা সন্ধান করা শুরু করেছেন।
টিম আলেকজান্ডার

ঘোস্টস্ক্রিপ্ট ঠিক আছে, তবে এটি অবশ্যই অ্যাক্রোব্যাটের চেয়ে ভাল নয়। এটি সম্পূর্ণ খালি হাড়।
শয়তনিকপপি

6
@ স্যাটানিকপুপি আমি একমত নই :: আমি ক্ষতিগ্রস্থ বা নিম্ন-মানের পিডিএফগুলি প্রায়শই পুনর্নির্মাণের জন্য ভূস্ট্রিপ্ট ব্যবহার করি এবং এটি খুব ভাল সম্পাদন করে।
এডি বি

উত্তর:


99

ঘোস্টস্ক্রিপ্ট আপনার দূষিত পিডিএফটি স্বয়ংক্রিয়ভাবে মেরামত করবে ... এটি যদি এটি প্রথম স্থানে খুলতে পারে (এটি যদি মেরামতির বাইরে ক্ষতিগ্রস্থ না হয়)। তবে এর পরেও আপনাকে ফলাফলটি ডাবল-চেক করতে হবে ...

লিনাক্সে, এই কমান্ডটি ব্যবহার করে দেখুন:

 gs \
  -o repaired.pdf \
  -sDEVICE=pdfwrite \
  -dPDFSETTINGS=/prepress \
   corrupted.pdf

উইন্ডোজে, এটি ব্যবহার করে দেখুন:

 gswin32c.exe ^
  -o repaired.pdf ^
  -sDEVICE=pdfwrite ^
  -dPDFSETTINGS=/prepress ^
   corrupted.pdf

2
ঘোস্টস্রিপ্ট পিডিএফএস রেন্ডারিংয়ের দুর্দান্ত কাজ করে ... আমি ফন্টের মান উন্নত করতে পিডিএফএস পুনর্নির্মাণের জন্য নিয়মিত জিএস ব্যবহার করি।
এডি বি

1
/ প্রিপ্রেস / স্ক্রিনের তুলনায় গুণমানটিকে সত্যই ভাল করে তোলে। ধন্যবাদ।
ডোলানর

আমি পেয়েছি "একটি এক্সআরএফ সারণী পড়ার সময় একটি ত্রুটি ঘটেছে।" ওটার মানে কি?
জেরেমিয়া

এর অর্থ বিষয়বস্তুগুলির অভ্যন্তরীণ সারণী (পিডিএফগুলিতে XREF টেবিল হিসাবে কী থাকতে হবে ) একটি ত্রুটি ছিল, পিডিএফ অবজেক্টের জন্য একটি ভুল বাইট অফসেটের দিকে ইঙ্গিত করে। ঘোস্টস্ক্রিপ্ট খুব সম্ভবত সেই ত্রুটিটি মেরামত করে এবং আউটপুটে একটি সঠিক এক্সআরএফ সারণী .োকানো। আপনি আরও একবার ঘোস্টস্ক্রিপ্টের মাধ্যমে আউটপুট চালিয়ে এটি পরীক্ষা করতে পারেন এবং এই বার্তাটি এখনও উপস্থিত কিনা তা দেখুন।
কুর্ট ফেফিল

37

আমার একটি দূষিত পিডিএফ ফাইল ছিল print.pdf, যে ঘোস্টস্রিপ্ট খুলতে পারে না, তবে সাধারণ গ্রাফিকাল লিনাক্স পিডিএফ ভিউয়ার্স (ওকুলার, এভিনস) ভাল খোলায়। (আমার ক্ষেত্রে, ফাইলের শুরুতে একটি পিডিএফ শিরোনামের পরিবর্তে কোনও আবর্জনা ছিল, যখন একটি হেক্স সম্পাদকে খোলা হয়েছিল))

এই পিডিএফ দর্শকরা পপলারকে ব্যাক-এন্ড পিডিএফ রেন্ডারার হিসাবে ব্যবহার করে। সুতরাং আপনি পপলারের কমান্ড-লাইন সরঞ্জাম ব্যবহার করে পিডিএফটি মেরামত করতে পারেন। উবুন্টুতে এগুলি poppler-utilsপ্যাকেজে রয়েছে। আমি ব্যবহার করতাম:

pdftocairo -pdf print.pdf print_repaired.pdf

যা সঠিক শিরোনাম সহ একটি পিডিএফ ফাইল তৈরি করেছে, যা ঘোস্টস্ক্রিপ্টের মতো সরঞ্জামগুলি এখন গৃহীত।


3
+1 এটি অভিযোগ ছাড়াই আমার কোয়ার্টজ উত্পাদিত পিডিএফ পড়ে এবং অবিলম্বে আউটপুট উত্পাদন শুরু করে। ঘোস্টস্ক্রিপ্ট, অ্যাডোব অ্যাক্রোব্যাট প্রো এবং অন্যরা প্রথমে আমার 120GB পিডিএফ পুনর্নির্মাণের জন্য জোর দিয়েছিল।
অরওলোফিল

এটি কমপক্ষে একটি অদ্ভুত পিডিএফটির জন্য কাজ করে নি, তবে এটি একটি ভাল শুরু বলে মনে হচ্ছে।
ব্রায়ান পিটারসন

1
একটি পিডিএফটিতে পুরোপুরি কাজ করে যা গোস্টসক্রিপ্ট পৃষ্ঠাগুলিতে কিছু স্বেচ্ছাচারী উপাদানগুলি সরাতে চেয়েছিল।
আন্ড্রেয়া লাজারোত্তো

ঘোস্ট স্ক্রিপ্ট দস্তাবেজটি পড়তে ব্যর্থ হয়েছে তবে এটি একটি কবজির মতো কাজ করেছে। বিটিডাব্লু আমি নতুন লিনাক্স সাবসিস্টেমটি উইন্ডোজে এটি ব্যবহার করেছি, তাই দুর্দান্ত!
হাইলিয়ান

24

mutool( প্রকল্প পৃষ্ঠা , ম্যানপেজ ) ভাঙা পিডিএফগুলি মুদ্রণ না করে মেরামত করবে

  • উবুন্টুতে উদাহরণস্বরূপ: sudo apt-get install mupdf-tools
  • এটি এইভাবে চালান: mutool clean input.pdf output.pdf
mutool clean [options] input.pdf [output.pdf] [pages]

  The clean command pretty prints and rewrites the syntax of a PDF file.
   It can be used to repair broken files, expand compressed streams,
   filter out a range of pages, etc.
  If no output file is specified, it will write the cleaned PDF to
   "out.pdf" in the current directory.

বিকল্পভাবে, কয়েকটি সরঞ্জাম এবং ফ্রেমওয়ার্ক রয়েছে যা পিডিএফগুলি বিন্যাস ছাড়াই তাদের উপাদানগুলিতে পচন / ডিকম্পাইল করতে পারে। এগুলি পাঠ্য, স্ক্রিপ্ট এবং চিত্রগুলি বের করার জন্য কার্যকর হতে পারে। এই জাতীয় সরঞ্জামগুলির তালিকার জন্য এই উত্তরটি দেখুন: https://reverseengineering.stackexchange.com/q/1526/8210 । উদাহরণস্বরূপ আপনি বর্তমান শীর্ষ উত্তর অরিগামি চেষ্টা করতে পারেন , এটিতে জিটিকে ভিত্তিক ভিউয়ার রয়েছে।


3
এই সমাধানটি উপরের প্রস্তাবিত সমাধানগুলি বা আরও ভাল র‌্যাঙ্কিংয়ের চেয়ে "আরও ভাল" কাজ করে, কারণ এটি পিডিএফ ফাইলটি "মুদ্রণ" করে না এবং লিঙ্কগুলি, ক্লিকযোগ্য আইটেম ইত্যাদিকে সক্রিয় রাখে ... আমার কাছে এটি ভূতের স্ক্রিপ্ট ব্যবহারের চেয়ে আরও মার্জিত সমাধান বলে মনে হচ্ছে বা কায়রো
স্পেরডেন

1
দুর্ভাগ্যক্রমে, mutool cleanসমস্ত সম্ভাব্য ত্রুটিগুলি ঠিক করে না। আমার একটি ফাইল রয়েছে যাতে ফন্ট এবং সামগ্রী স্ট্রিমে বিভিন্ন ত্রুটি রয়েছে এবং মিউটুল সেই ত্রুটিগুলি রাখবে।
ডোমিনিক হ্নেফ

1
@ ডোমিনিকহোনেনিফ আপনি সর্বদা সরঞ্জাম / ফ্রেমওয়ার্ক চেষ্টা করতে পারেন যা পিডিএফটি পচে যায় এবং আপনাকে সমস্ত অংশগুলি রেন্ডারিং ছাড়াই দেখার অনুমতি দেয়। এটি আপনাকে পাঠ্য, স্ক্রিপ্ট, চিত্র ইত্যাদি সরাসরি পেতে সক্ষম করবে। সরঞ্জামগুলির তালিকার জন্য এই উত্তরটি দেখুন: রিভার্সেনজিনিয়ারিং.স্ট্যাকেক্সেঞ্জাও.কম
জেমিসেরেজ

আমার পক্ষে কাজ করেছে!
জামাডগনি

এটি আরও ভাল কাজ করেছে যেহেতু এটি নথিকে পরীক্ষা করে পিডিএফ সরবরাহ করে না।
riccs_0x

10

আমার একটি দূষিত পিডিএফ ফাইল ছিল, কারণ এটি ডাউনলোড করতে ব্যবহৃত পিএইচপি ফাইলটি কিছু ত্রুটি (এইচটিএমএল) এবং নুল অক্ষরগুলি প্রতিধ্বনিত করেছিল।

সমাধানটি ছিল নোটপ্যাড ++ দিয়ে পিডিএফ খোলার এবং লাইনের পরে সমস্ত পাঠ্য অপসারণ করা

%%EOF

একই ছিল, অ্যাডোব রিডার খোলেনি তবে নেটিভ ম্যাক, ক্রোম এবং ফায়ারফক্স পিডিএফ প্লাগইন পিডিএফ ফাইল সূক্ষ্মভাবে প্রদর্শিত হয়েছিল। আপলোড চলাকালীন যুক্ত লাইনটিতে যুক্ত হওয়ার কারণে অতিরিক্ত "NUL" অতিরিক্ত ছিল।
টিলো

আমি দুটো একটি PDF ছিল %%EOF। আমি প্রথমে %%EOFহেক্স সম্পাদক ব্যবহার করে সমস্ত কিছু মুছলাম। এখন সবকিছু ঠিকঠাক কাজ করে।
অ্যাড্রিয়ান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.