পিডিএফ ফাইল থেকে কীভাবে চিত্রগুলি সরিয়ে ফেলা যায়


13

আমি এতে অনেকগুলি চিত্রের (একটি চিত্র এবং পটভূমির চিত্র হিসাবে) এর চেয়ে একটি বড় (M 100MB) পিডিএফ ডকুমেন্ট পেয়েছি, এবং আমি ছবিগুলি ছাড়াই পিডিএফটির একটি অনুলিপি পেতে চাই তবে কীভাবে করব তা আমি খুঁজে পাচ্ছি না কর এটা.

আমি এটিকে কেবল পাঠ্যে রূপান্তর করার বিষয়ে কথা বলছি না, আমি অনুচ্ছেদ / সারণী / বহু-কলামগুলি যেমন আছে তেমন রাখতে চাই।

আমি কমান্ড লাইনে আরামদায়ক এবং আমি ব্যবহার করতে পারি এমন বিভিন্ন বিতরণ সহ বেশ কয়েকটি কম্পিউটার রয়েছে।


যেহেতু আমরা প্রতিটি পৃষ্ঠায় একাধিক চিত্র সহ একটি 500 পৃষ্ঠাগুলির নথির কথা বলছি, আমি প্রতিটি ছবি সরানোর জন্য একটি স্বয়ংক্রিয় উপায়ের সন্ধান করছি ।
অরনাক্স

উত্তর:


14
cpdf -draft original.pdf -o version_without_images.pdf

এটি ভান্ডারগুলিতে নেই তবে আপনি তাদের ওয়েবসাইটে ডাউনলোড ( প্রাক-সংকলিত বা উত্স ) পেতে পারেন ।


ম্যানুয়াল :

15.1 খসড়া ডকুমেন্টস

-ড্রাফ্ট বিকল্পটি কোনও ফাইল থেকে বিটম্যাপ (ফোটোগ্রাফিক) চিত্রগুলি সরিয়ে দেয়, যাতে এটি কম কালি দিয়ে মুদ্রণ করা যায়। Allyচ্ছিকভাবে, -boxes বিকল্পটি যুক্ত করা যেতে পারে, শূন্যস্থানটি ফাঁকা স্থানটি পূরণ করে চিত্রটি যেখানে ছিল তা বোঝানো হচ্ছে box এটি সমস্ত ক্ষেত্রে সম্পূর্ণরূপে দৃশ্যমান হওয়ার গ্যারান্টিযুক্ত নয় (বিটম্যাপটি ভেক্টর অবজেক্টগুলি আংশিকভাবে আচ্ছাদিত হয়ে থাকতে পারে বা মূলতে ক্লিপড)। উদাহরণ স্বরূপ:

 cpdf -draft -boxes in.pdf -o out.pdf

1
আমি ঠিক তাই খুঁজছিলাম। আউটপুট ফাইল ঠিক নিখুঁত। তোমাকে অনেক ধন্যবাদ!
অরনাক্স

@ রিনজউইন্ড দয়া করে নোট করুন যে "তাদের ওয়েবসাইট" লিঙ্কটি আসলে একটি জিপ ফাইলে যায়।
জোস

হুম .. আমার জন্য এটি পাঠ্যের ওপারে প্রায় এলোমেলো রেখা যুক্ত করে রাখে এবং ফাইল আকারটি সঙ্কুচিত হওয়ার পরিবর্তে কিছুটা বাড়তে থাকে।
হেনিং কোহেলার

23

ঘোস্টস্ক্রিপ্টের সর্বশেষ প্রকাশনাগুলি এটিও করতে পারে। -dFILTERIMAGEআপনার কমান্ডে কেবলমাত্র প্যারামিটার যুক্ত করুন ।

এগুলি আরও দুটি নতুন প্যারামিটার যা সামগ্রীতে ধরণের "ভেক্টর" এবং "পাঠ্য" অপসারণের জন্য যুক্ত করা যেতে পারে :

  1. -dFILTERIMAGE: একটি আউটপুট উত্পাদন করে যেখানে সমস্ত রাস্টার চিত্র সরিয়ে ফেলা হয়।

  2. -dFILTERTEXT: একটি আউটপুট উত্পাদন করে যেখানে সমস্ত পাঠ্য উপাদান সরানো হয়।

  3. -dFILTERVECTOR: একটি আউটপুট উত্পাদন করে যেখানে সমস্ত ভেক্টর অঙ্কন সরানো হয়।

এই বিকল্পগুলির যে কোনও দুটি একত্রিত করা যেতে পারে। (আপনি যদি 3 টি একত্রিত হন তবে আপনি সমস্ত পৃষ্ঠা ফাঁকা হয়ে যাবেন ...)

উদাহরণ

এখানে একটি উদাহরণ পিডিএফ পৃষ্ঠার স্ক্রিনশট যা উপরে উল্লিখিত সমস্ত 3 ধরণের সামগ্রী রয়েছে:

"চিত্র", "ভেক্টর" এবং "পাঠ্য" উপাদানযুক্ত মূল পিডিএফ পৃষ্ঠার স্ক্রিনশট
"চিত্র", "ভেক্টর" এবং "পাঠ্য" উপাদানযুক্ত মূল পিডিএফ পৃষ্ঠার স্ক্রিনশট।


নিম্নলিখিত 6 টি কমান্ড চালনা করা সমস্ত অবশিষ্ট 6 টি সম্ভাব্য প্রকরণ তৈরি করবে:

 gs -o noIMG.pdf -sDEVICE = pdfwrite -dFILTERIMAGE ইনপুট.পিডিএফ
 gs -o noTXT.pdf -sDEVICE = pdfwrite -dFILTERTEXT ইনপুট.পিডিএফ
 gs -o noVCT.pdf -sDEVICE = pdfwrite -dFILTERVECTOR ইনপুট.পিডিএফ

 gs -o onlyIMG.pdf -sDEVICE = pdfwrite -dFILTERVECTOR -dFILTERTEXT ইনপুট.পিডিএফ
 gs -o onlyTXT.pdf -sDEVICE = pdfwrite -dFILTERVECTOR -dFILTERIMAGE ইনপুট.পিডিএফ
 gs -o onlyVCT.pdf -sDEVICE = pdfwrite -dFILTERIMAGE -dFILTERTEXT ইনপুট.পিডিএফ

নিম্নলিখিত চিত্রটি ফলাফল চিত্রিত করে:


শীর্ষ সারি, বাম থেকে: সমস্ত "পাঠ্য" সরানো হয়েছে; সমস্ত "চিত্র" অপসারণ; সমস্ত "ভেক্টর" সরানো হয়েছে। নীচে সারি, বাম থেকে: কেবলমাত্র "পাঠ্য" রাখা হয়েছে; শুধুমাত্র "চিত্র" রাখা; শুধুমাত্র "ভেক্টর" রাখা হয়েছে।
শীর্ষ সারি, বাম থেকে: সমস্ত "পাঠ্য" সরানো হয়েছে;  সমস্ত "চিত্র" অপসারণ;  সমস্ত "ভেক্টর" সরানো হয়েছে।  নীচে সারি, বাম থেকে: কেবলমাত্র "পাঠ্য" রাখা হয়েছে;  শুধুমাত্র "চিত্র" রাখা;  শুধুমাত্র "ভেক্টর" রাখা হয়েছে।



2

@ রিনজউইন্ডের উত্তরটি সঠিক জিনিস , আমি কেবল "মিডওয়ে" সমাধানটি মন্তব্য করতে চাই। আপনি সাধারণত ব্যাপকভাবে ব্যবহার করে ছবি আকার কমে যায় Ghostscript সঙ্গে

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen \
   -dNOPAUSE -dQUIET -dBATCH -sOutputFile=small.pdf original.pdf

... প্রুফরিডিংয়ের জন্য এটি একসময় সত্যিই কার্যকর। পিডিএফ লেখার জন্য ম্যানুয়াল পৃষ্ঠাটি এখানে


@ কুর্টফিফেল /screenবিটম্যাপ চিত্র (গুলি) রেজোলিউশনটিকে 72dpi এ সেট করবে। হ্যাঁ, আপনার যদি ছোট ডিপিআইতে চিত্র থাকে তবে এটি ফাইলের আকার বাড়াতে পারে। এই কারণেই আমি "স্বাভাবিকভাবে" শব্দটি ব্যবহার করেছি ("সর্বদা নয়, তবে বেশিরভাগ ক্ষেত্রে" অর্থে)। আপনি যা চান নিচে নির্দ্বিধায় অনুভব করুন।
রোমানো

এই কমান্ড সঞ্চালন করুন: for s in screen default ; do gs -o /dev/null -sDEVICE=pdfwrite -dPDFSETTINGS=/${s} -c "currentpagedevice {exch ==only ( ) print === } forall" | sort | tee ghostscript---pdfwrite-PDFSETTINGS-${s}--pagedevice-settings.txt; done। এটি দুটি পাঠ্য ফাইল তৈরি করবে যা আপনি ব্যবহার করে তুলনা করতে পারেন sdiff -sbB $[file1}.txt ${file2}.txt। এখন আপনি সঠিকভাবে এবং সম্পূর্ণরূপে সমস্ত বিভিন্ন সেটিংস দ্বারা প্রবর্তিত জানেন -dPDFSETTINGS=/screen!
কর্ট ফেফেল

সম্পন্ন. এরপরে কোন বিকল্পটি এর /screenচেয়ে বড় ফাইল দিতে পারে তা দেখতে পাচ্ছেন না /default--- d২ ডিপিআই বনাম 150 ডিপিআই, অনুকূলিতকরণ, ইপিএস পূর্বরূপটি বাতিল করুন ... তবে আরে, বড় সমস্যা নয়। লোকেরা আরও ভাল সমাধান পরীক্ষা করে নিবে।
রুমানো

আমি দুঃখিত - আমার প্রথম বিবৃতিটির গালমন্দ করার জন্য আমাকে এখনই ক্ষমা চাইতে হবে। সত্যি বলতে, আমি শুধু মনে আমার আগের তদন্ত (কয়েক বছর পেছনে) থেকে মনে রাখা /screenদিলেন সত্যিই খারাপ ফলাফল নেই। সম্ভবত আমার স্মৃতিশক্তি ব্যর্থ হয়, বা আমি এটি মিশ্রিত করি /epub। আমি আপনাকে যে আদেশ দিয়েছি তা স্মৃতি থেকে হয়েছিল কারণ আমি নিশ্চিত ছিলাম যে এটি আমার অর্থ কি তা প্রদর্শন করবে। এখন আমি আবার এটি চালিয়েছি, আমি কী প্রত্যাশা করেছি তা আর দেখতে পাচ্ছি না: কয়েক বছর আগে আমি আরও বর্ধিত পরীক্ষাগুলি চালিয়েছি। তারপরে প্রচুর (সিআইডি? / সিএফএফ?) ফন্ট ফলস্বরূপ পিডিএফগুলির ব্লাস্টিং মাপসই পেয়েছে। আমি আরও একবার এই সমস্যাটি আবার দেখতে হবে, একবার আরও সময় ... :-)
কার্ট ফেফেল

0

আপনি মাস্টার পিডিএফ সম্পাদক ব্যবহার করতে পারেন, সেই চিত্রগুলি মুছতে এবং একটি নতুন পিডিএফ ফাইল হিসাবে সংরক্ষণ করতে পারেন। আপনি এটি উবুন্টু সফ্টওয়্যার কেন্দ্র থেকে ডাউনলোড করতে পারেন।


আমি চেষ্টা করার জন্য এটি ইনস্টল করেছি তবে আমি এটি করার কোনও স্বয়ংক্রিয় উপায় দেখতে পাচ্ছি না। এটি একটি 500 পৃষ্ঠাগুলির নথি হিসাবে দেওয়া হয়েছে, আমি এখানে সমাধান হিসাবে ম্যানুয়াল অপসারণ দেখতে পাচ্ছি না। আমি কি কিছু রেখে গেলাম ?
অরনাক্স

না আপনি কিছু মিস করেননি আমি ভেবেছিলাম চিত্রগুলি বড় আকারের তাই আপনি সেগুলি মুছতে চান, এতগুলি চিত্রের কথা কখনও ভাবেননি। যাইহোক সুন্দর প্রশ্ন।
সুধীর
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.