কীভাবে পিডিএফ ফাইল সংকোচিত হয় এবং কীভাবে এটি (সং) সংকুচিত করতে হয় তা জানবেন to


18

আমি কেবল শিখেছি পিডিএফ ফাইলগুলি তাদের ডিস্কের আকার হ্রাস করতে সংকোচিত হতে পারে।

  1. আমি ভাবছিলাম যে কীভাবে পিডিএফ ফাইল ইতিমধ্যে সংকুচিত হয়েছে তা কীভাবে জানব?
  2. পিডিএফ ফাইল সংকুচিত বা সঙ্কুচিত করতে কোন অ্যাপ্লিকেশন / আদেশগুলি ব্যবহার করা যেতে পারে?

আমার পরিবেশ লিনাক্স উবুন্টু 10.10।


কিছু প্রচেষ্টা সন্তোষজনক ফলাফল দেয় না:

  1. এখানে চেষ্টা ফলাফল pdftk:

    $ pdftk 3.pdf output 5.pdf uncompress 
    $ pdftk 3.pdf output 3comp.pdf compress 
    $ ls -l 3.pdf 3comp.pdf 5.pdf
    -rwxrwx--- 1 root plugdev  8652269 2011-07-30 12:27 3comp.pdf
    -rwxrwx--- 1 root plugdev  8652319 2011-07-29 22:15 3.pdf
    -rwxrwx--- 1 root plugdev 16829828 2011-07-30 12:27 5.pdf
    

    ফাইলগুলির বৈশিষ্ট্যগুলি দেখায় যে এগুলি সমস্ত অনুকূলিত নয়।

  2. পিএস এ রূপান্তর করার ফলাফল এবং তারপরে পিডিএফ-তে ফিরে আসুন:

    $ pdf2ps 3.pdf 3.ps
    $ ps2pdf 3.ps 3c.pdf
    $ ls -l 3.pdf 3.ps 3c.pdf
    -rwxrwx--- 1 root plugdev   8808946 2011-07-30 13:14 3c.pdf
    -rwxrwx--- 1 root plugdev   8652319 2011-07-29 22:15 3.pdf
    -rwxrwx--- 1 root plugdev 122375966 2011-07-30 13:14 3.ps
    

আমি এখনই এটি পরীক্ষা করতে পারি না, যেহেতু আমার হাতে একটি সংকুচিত পিডিএফ নেই, তবে চেষ্টা করুন file। এটি ফাইল সংকুচিত কিনা তা দেখানো উচিত।
পোলেমন

1
@ পোলেমন: ধন্যবাদ! এটা না। আউট এর করা $file 3.pdfহয়3.pdf: PDF document, version 1.4
এর জন্য সকল StackExchange

নোট করুন যে পিডিএফ ফাইলের পৃথক স্ট্রিমগুলি সংকুচিত করা যেতে পারে। সুতরাং "পুরো পিডিএফ ফাইল সঙ্কুচিত" জিজ্ঞাসা করা ভুল প্রশ্ন (যদিও অনেক ক্ষেত্রে সমস্ত, বা বেশিরভাগ স্ট্রিমগুলি হয় সংকুচিত বা সঙ্কোচিত হবে)।
dirkt

উত্তর:


30

সংক্ষেপে:

এটি ইতিমধ্যে সংকুচিত কিনা তা জানতে:

strings your.pdf | grep /Filter

একটি পিডিএফ সংকুচিত করতে ( আনইন ) করতে, QPDF ব্যবহার করুন

qpdf --stream-data=compress your.pdf compressed.pdf
qpdf --stream-data=uncompress compressed.pdf uncompressed.pdf  

ব্যাখ্যা:

পিডিএফ ফাইলের অভ্যন্তরে "ফিল্টার" কীওয়ার্ডটি ব্যবহৃত কম্প্রেশন পদ্ধতির একটি সূচক। এর মধ্যে কয়েকটি হ'ল:

সিসিআইটিটি জি 3 / জি 4 - একরঙা ছবি
জেপিজি - এর জন্য ব্যবহৃত একটি ক্ষতির অ্যালগরিদম যা জেপিইজি
2000 চিত্রগুলির জন্য ব্যবহৃত হয় - যা জেপিগের আরও আধুনিক বিকল্প, যা চিত্রগুলি সংকোচনের জন্যও ব্যবহৃত হয়
ফ্ল্যাট - পাঠ্য পাশাপাশি চিত্রগুলি
সংক্ষেপিত করতে ব্যবহৃত হয় জেবিআইজি 2 - এর বিকল্প একরঙা চিত্রের জন্য সিসিআইটিটি সংক্ষেপণ
এলজেডাব্লুডাব্লু - পাঠ্য পাশাপাশি চিত্রগুলি সংকোচনের জন্য ব্যবহৃত হয় তবে ফ্ল্যাট
আরএলই দ্বারা প্রতিস্থাপন করা হয় - একরঙা চিত্রের
জন্য ব্যবহৃত জিপ - গ্রেস্কেল বা রঙিন চিত্রের জন্য ব্যবহৃত হয়

( এখান থেকে অনুলিপি করা হয়েছে )।

যাইহোক, পিডিএফ জটিল ফাইল কাঠামো দেওয়া, বেশিরভাগ সময় পিডিএফ এর কিছু অংশ (বা "স্ট্রিম") ইতিমধ্যে কোনওভাবে সংকুচিত হবে (এবং গ্রেপিং / ফিল্টার করার সময় প্রদর্শিত হবে) অন্য কিছু অংশ হবে না, তাই পিডিএফ সংকুচিত কিনা এই প্রশ্নের কোন উত্তর নেই।
এটি পরাস্ত করার একটি উপায় হ'ল যুক্ত করা-c হ'ল গ্রেপ-তে বিকল্প যুক্ত করা, যা ঘটনার সংখ্যাটি দেয়, যাতে আপনি তুলনামূলকভাবে কতটা সংকুচিত তা দেখতে পারেন । উদাহরণস্বরূপ, যদি কম 10 ফেরত দেয় তবে এটি বেশ কম সংকোচিত।strings "large.pdf" | grep -c /Filter

পিডিএফ আকারে সম্পর্কিত অন্য সম্পত্তি হ'ল তারা দ্রুত অ্যাক্সেসের জন্য অনুকূলিত হয়েছে কিনা, উইকিপিডিয়া থেকে উদ্ধৃতি হিসাবে "অনুকূলিত" পিডিএফ আকারে আরও বড় হবে :

পিডিএফ ফাইলগুলিতে দুটি বিন্যাস রয়েছে — অ-রৈখিক ("অনুকূলিত নয়") এবং লিনিয়ার ("অনুকূলিত")। অ-লিনিয়ার পিডিএফ ফাইলগুলি তাদের লিনিয়ার অংশগুলির তুলনায় কম ডিস্কের স্পেস ব্যবহার করে, যদিও তারা অ্যাক্সেস করতে ধীর হয় কারণ নথির পৃষ্ঠাগুলি একত্র করার জন্য প্রয়োজনীয় ডেটার অংশগুলি পিডিএফ ফাইলের মধ্যে ছড়িয়ে ছিটিয়ে থাকে। লিনিয়ার পিডিএফ ফাইলগুলি ("অপ্টিমাইজড" বা "ওয়েব অপ্টিমাইজড" পিডিএফ ফাইলগুলিও বলা হয়) এমনভাবে তৈরি করা হয় যেগুলি ওয়েব ব্রাউজার প্লাগইনে পুরো ফাইলটি ডাউনলোড করার জন্য অপেক্ষা না করেই পড়তে সক্ষম করে, যেহেতু সেগুলি একটিতে ডিস্কে লেখা থাকে since রৈখিক (পৃষ্ঠা ক্রমের মতো) ফ্যাশন। অ্যাডোব অ্যাক্রোব্যাট সফ্টওয়্যার বা কিউপিডিএফ ব্যবহার করে পিডিএফ ফাইলগুলি অপ্টিমাইজ করা যেতে পারে।

পিডিএফটি ব্যবহার করে অপ্টিমাইজ করা হয়েছে কিনা তা আপনি পরীক্ষা করতে পারেন pdfinfo your.pdf


ধন্যবাদ! (1) কিউপিডিএফ ব্যবহারের ফলাফল পিডিএফটক ব্যবহার করার অনুরূপ: সংকোচনের সাথে আকারটি আসলে কিছুটা বড় (অদ্ভুত) হয়ে যায় এবং সঙ্কোচনের সাথে আকারটি আরও বড় হয়ে যায়, প্রায় দ্বিগুণ হয়ে যায়। (২) পিডিএফটক এবং জিপিডিএফ কি সংক্ষেপণ এবং সঙ্কোচিত বিকল্পগুলি ব্যবহার করে একই জিনিস সম্পাদন করার চেষ্টা করে?
সমস্ত

@ টিম: (দুঃখিত আমি এখানে ছিলাম না) (1) এর জন্য, যেমন আমি ব্যাখ্যা করেছি, পিডিএফ আংশিকভাবে ইতিমধ্যে সংকুচিত হয়েছে (সম্ভবত সম্ভবত), সে কারণেই সংকোচন করা খুব বেশি সঞ্চয় করে না, (এবং ডিকম্প্রেসিং এটিকে আরও বড় করে তোলে, কারণ এটি সমস্ত সংক্ষেপিত স্ট্রিমগুলি সংক্ষেপিত করে )। (২) সম্ভবত qpdfএবং pdftkকমপ্রেস সম্পর্কিত একই জিনিসটি কম-বেশি করুন, তবে qpdfখুব অনুকূল করতে পারেন (আরও অনেকগুলি জিনিস)।
ফিলোমাথ

10

পিডিএফটেক হ'ল পিডিএফ ফাইলগুলিতে সংক্ষেপণ / ডিকম্প্রেশন জাতীয় কিছু ক্রিয়াকলাপ সম্পাদন করার জন্য একটি সরঞ্জাম:

$ pdftk test.pdf output compressed_test.pdf compress

ধন্যবাদ! আমি ভাবছিলাম যে পিডিএফ ফাইলটি ইতিমধ্যে সংকুচিত হয়েছে কিনা তা কীভাবে জানব?
13

1
@ টিম: পিডিএফটি অপ্টিমাইজ করা হয়েছেpdfinfo file.pdf কিনা তা আপনাকে জানায় । তবে এর অর্থ সংকুচিত হয়েছে কিনা তা আমি নিশ্চিত নই ।
নিকো

1
@uloBasEI: আমি কম্প্রেশন করার জন্য pdftk ব্যবহার করে আপনার কমান্ডটি চেষ্টা করেছি, তবে আকারটি প্রায় পরিবর্তিত হয়নি। আমি যদি সঙ্কোচন করি তবে ফাইলের আকার দ্বিগুণ। মূল ফাইল, সংকোচিত ফাইল এবং সংকোচিত ফাইলগুলির বৈশিষ্ট্যগুলি সমস্ত তারা দেখায় যে তারা অনুকূলিত নয়।
সমস্ত জন্য স্ট্যাক এক্সচেঞ্জ

@নিকো: ধন্যবাদ! উপরে আমার মন্তব্য এবং আমার আপডেট দেখুন। মনে হচ্ছে কম্প্রেশন এবং অপটিমাইজেশন একে অপরকে বোঝায় না?
16

: @Tim: এছাড়াও এই দেখতে pandemoniumillusion.wordpress.com/2008/05/07/...
নিকো

1

আমি পিডিএফ ফাইলে সংকোচনের পদ্ধতিটি পেয়েছি। পাঠ্য সম্পাদক দিয়ে পিডিএফ খুলুন। সন্ধান বা সন্ধানকারী-সিসিআইটিটি চালিত না হলে, জেপিজি, তারপরে ফ্ল্যাট, তারপরে জেবিআইজি 2, তারপরে এলজেডব্লু, তারপরে আরএলই, এবং তারপরে জিপ প্রবেশ করুন।
এর চেয়ে খারাপ লাগছে! ডেটা স্ট্রিমের সংক্ষেপণ পদ্ধতিটি খুঁজে পাওয়া খুব সহজ।


এটি বরং ifif। আমি একজন ডিকম্প্রেস করা পিডিএফ (qpdf দ্বারা ডিকম্প্রেস) ফাইল ব্যবহার করে পরীক্ষা করার জন্য আপনার পদ্ধতি ব্যবহার , grep হিসাবে , grep -E "(| কোন JPEG | Flate | LZW | RLE | CCITT জিপ)" uncompressed.pdf এবং এটি এই বার্তা ফেরৎ বাইনারি ফাইল uncompressed.pdf ম্যাচ । দেখে মনে হচ্ছে এটি এলজিডাব্লু এবং আরএলই উভয় ধরণের ধারণার জন্য সঙ্কুচিত.পিডিএফ ফাইলটি সনাক্ত করে।
ব্যবহারকারী 91822

-1

শুধু এর বৈশিষ্ট্য পরীক্ষা করুন; ফাইলটি সংকুচিত হয়েছে কিনা তা বলবে।


আমি মনে করি হাইডি প্রশ্নটি হ'ল বিশেষত স্ক্রিপ্টযোগ্য কমান্ড লাইন ভিত্তিক প্রোগ্রামগুলির সাথে বৈশিষ্ট্যগুলি পরীক্ষা করতে হবে।
কালেব

> কেবল এর বৈশিষ্ট্যগুলি পরীক্ষা করুন - কোনটি [ওপেন সোর্স] প্রোগ্রাম এটি করতে পারে তবে, ??
ম্যাক্সিম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.