পিডিএফ ফাইলের বৃহত সংখ্যার তুলনা করার সরঞ্জাম? [বন্ধ]


84

এটির জন্য অপটিক্যাল সামগ্রীর জন্য আমাকে পিডিএফ ফাইলের বৃহত গণনা তুলনা করতে হবে। কারণ পিডিএফ ফাইলগুলি বিভিন্ন প্ল্যাটফর্মে তৈরি হয়েছিল এবং সফ্টওয়্যারটির বিভিন্ন সংস্করণ সহ কাঠামোগত পার্থক্য রয়েছে। উদাহরণ স্বরূপ:

  • পাঠ্য ছিন্ন করা পৃথক হতে পারে
  • লেখার ক্রমটি আলাদা হতে পারে
  • অবস্থান কিছু পিক্সেল পৃথক হতে পারে

এটি কোনও মানুষের মতো সামগ্রীর তুলনা করা উচিত অভ্যন্তরীণ কাঠামোর সাথে নয়। আমরা যে পিডিএফ জেনারেটরটি ব্যবহার করেছি তার বিভিন্ন সংস্করণের মধ্যে অবস্থার জন্য আমি পরীক্ষা চাই।


4
একটি আংশিক উত্তর হ'ল পিডিফোটোটেক্সট ব্যবহার করা এবং এতে থাকা পাঠ্যের তুলনা করা।
Sklivvz

তবে এটি লাইন, বাক্স, ছবি, চার্ট ইত্যাদির মতো সমস্ত অ-পাঠ্য তথ্যকে অগ্রাহ্য করবে I
Horcrux7

আমি একমত, এটি পর্যাপ্ত মানদণ্ড নয়। অন্যদিকে এটি একটি প্রয়োজনীয় মানদণ্ড, সুতরাং এটি ইউনিট পরীক্ষা হিসাবে পর্যাপ্ত।
Sklivvz

বাস্তবে এর আগে কখনও আপনার পরিস্থিতিতে ছিল না, তবে আমি পিডিএফগুলির তুলনা করার জন্য এক্সামডিফ প্রো চেষ্টা করেছি এবং এটি আমার পক্ষে কাজ করেছে।
কিউবেক্স

আপনি পরে আরও ভাল ইউনিট পরীক্ষা যোগ করতে পারেন!
Sklivvz

উত্তর:


39

কারণ এমন কোনও সরঞ্জাম উপলব্ধ নেই যা আমরা একটি লিখেছি। আপনি আই-নেট পিডিএফ সামগ্রী সামগ্রী তুলনামূলক ডাউনলোড করতে এবং এটি ব্যবহার করতে পারেন। আমি আশা করি যে একই সমস্যা অন্যান্যদের সাহায্য করবে। আপনার যদি এটি নিয়ে সমস্যা হয় বা আপনার আমাদের কাছে প্রতিক্রিয়া থাকে তবে আপনি আমাদের সহায়তার সাথে যোগাযোগ করতে পারেন।

এখানে চিত্র বর্ণনা লিখুন


এই সরঞ্জামটির সুবিধাটি হ'ল এটি নিখুঁত পাঠ্য তুলনামূলক বা কোনও চিত্রের তুলকও নয়। এটি কাঠামোর সাথে তুলনা করে, উপস্থিত উপাদানগুলি "একই" কিনা তা যাচাই করে - তাই আপনার তুলনা করা পিডিএফগুলি 100% এর সাথে মেলে না তবে একটি নির্দিষ্ট মিলের মধ্যে থাকতে পারে। এবং এটি বিনামূল্যে।
গামা

আমি এটিও সুপারিশ করতাম! এটি কোনও দস্তাবেজে ক্রাশ হয়েছে তাই আমি এটি তাদের কাছে প্রেরণ করেছি। তারা এটা স্থির! : ডিআই দুর্দান্ত লাগছে। এটি পার্থক্য সহ চিত্র তৈরি করতে পারে বা এটি কনসোলে আপনাকে একটি পাঠ্য প্রতিবেদন দিতে পারে।
জানুস ট্রয়লসেন

4
@gamma কোথায় এই অ্যাপ্লিকেশন বিনামূল্যে? এটির জন্য প্রতি বছর কমপক্ষে 200 ইউএসডি খরচ হয় (!) এটি কেবল 30 দিনের জন্য একবার বিনামূল্যে। আমি এটি দিয়ে যা করব তার জন্য এটি বেশ ব্যয়বহুল।
ygoe

@ লোনলিপিক্সেল হ্যাঁ, আপনি ঠিক বলেছেন। সংস্করণ 1.0 বিনামূল্যে ছিল (2010-10-14 হিসাবে)। আমরা এটিতে কিছুটা পরিবর্তন করেছি এবং এটি এখন একটি প্রদত্ত সরঞ্জাম (2012-10)। তবে আপনি কোনও সীমাবদ্ধতা ছাড়াই 30 দিনের জন্য এটি ব্যবহার করতে পারেন। এটি সত্যই অনেকগুলি নতুন বৈশিষ্ট্য, স্থায়িত্ব এবং নির্ভরযোগ্যতা অর্জন করেছে। আমি আশা করি আপনি এখনও এটি দেখতে পারেন;)
গামা

আমারও পিডিএফ ফাইলগুলির তুলনা করা দরকার - আমি অ্যাপাচি পিডিএফবক্স ব্যবহার করে একটি জার নিয়ে এসেছি। উদাহরণস্বরূপ এবং ডাউনলোডের জন্য এই টেস্টঅটোমেশনগুরু.com /… দেখুন।
ভিন

21

আসলে একটি ডিফ্পডিএফ সরঞ্জাম রয়েছে।

http://www.qtrac.eu/diffpdf.html

এর দুর্বলতা হ'ল সংযোজনগুলি যখন নতুন পৃষ্ঠায় আংশিকভাবে পরিবর্তন করে তখন এটি ভাল প্রতিক্রিয়া জানায় না। উদাহরণস্বরূপ, যদি পুরাতন পৃষ্ঠা 4 টি পৃষ্ঠার 5 এর শেষের সাথে এবং পৃষ্ঠা 6 এর শুরুর সাথে তুলনা করা উচিত, তবে দুটি স্লাইস পৃথকভাবে তুলনা করার জন্য আপনাকে পরামিতিগুলি স্থানান্তর করতে হবে।


4
মূল ওপেন সোর্স সংস্করণটি এখনও qtrac.eu/diffpdf-foss.html
টোবিয়াস কেইনজলার

13

আমি একটি হোম-বেকড স্ক্রিপ্ট ব্যবহার করেছি যা

  • দুটি পিডিএফের সমস্ত পৃষ্ঠাকে বিটম্যাপে রূপান্তর করে
  • পিডিএফ 1 এর রঙিন পৃষ্ঠাগুলি লালচে-সাদা
  • পিডিএফ 2 এর পৃষ্ঠায় স্বচ্ছ থেকে সাদা পরিবর্তন করে
  • পিডিএফ 1 থেকে প্রতিটি পৃষ্ঠাকে সংশ্লিষ্ট পৃষ্ঠার উপরে পিডিএফ 2 থেকে ওভারলে করে
  • রূপান্তর / রঙিং এবং একাধিক কোরের সমান্তরালে ওভারলেলিং চালায়

সফ্টওয়্যার ব্যবহৃত:

  • পিডিএফ থেকে বিটম্যাপ রূপান্তরকরণের জন্য ঘোস্টস্ক্রিপ্ট
  • রঙিন, স্বচ্ছতা এবং ওভারলে এর জন্য চিত্রম্যাগিক
  • সমান্তরাল প্রক্রিয়া সিঙ্ক্রোনাইজ করার জন্য inotify
  • ফলাফলটি পর্যালোচনা করার জন্য কোনও পিএনজি-সক্ষম চিত্র দর্শক er

পেশাদাররা:

  • সহজ বাস্তবায়ন
  • ব্যবহৃত সমস্ত সরঞ্জাম ওপেন সোর্স
  • বিন্যাসে ছোট পার্থক্য সন্ধানের জন্য দুর্দান্ত

কনস:

  • রূপান্তর ধীর
  • পিডিএফ (উদাহরণস্বরূপ পৃষ্ঠা) এর মধ্যে প্রধান পার্থক্যগুলি গোলমেলে পড়ে
  • বিটম্যাপগুলি জুমযোগ্য নয়
  • শুধুমাত্র কালো এবং সাদা পাঠ্য এবং ডায়াগ্রামের জন্য ভাল কাজ করে
  • সহজেই ব্যবহারযোগ্য জিইউআই নেই

আমি এমন একটি সরঞ্জাম খুঁজছিলাম যা পিডিএফ / পোস্টস্ক্রিপ্ট স্তরে একই কাজ করবে।

আমাদের স্ক্রিপ্টটি কীভাবে ইউটিলিটিগুলিকে আহ্বান জানায় তা এখানে দেখুন (নোট করুন যে চিত্র-ম্যাগিক পিডিএফ-> পিএনজি রূপান্তর করতে পর্দার আড়ালে ঘোস্টস্ক্রিপ্ট ব্যবহার করে):

$ convert -density 150x150 -fill red -opaque black +antialias 1.pdf back%02d.png
$ convert -density 150x150 -transparent white +antialias 2.pdf front%02d.png
$ composite front01.png back01.png result01.png # do this for all pairs of images

4
পুরো স্ক্রিপ্ট শেয়ার করবেন না কেন?
জানুস ট্রয়লসন

4
এটি আমি কম্পোজিটিংয়ের জন্য ব্যবহার করেছি:for i in $(seq -w 0 05); do /cygdrive/c/Progra~1/ImageMagick-6.6.9-Q8/composite.exe 1-$i.png 2-$i.png result-$i.png; done
জানুস ট্রয়লসন

এখানে এমন একটি স্ক্রিপ্ট রয়েছে যা অস্থায়ী ফাইলগুলিকে ডিস্কে না লিখে এবং পপলারের পিডিফটপপিএম ব্যবহার করে যা ঘোস্টস্ক্রিপ্টের চেয়ে দ্রুত: gist.github.com/brechtm/891de9f72516c1b2cbc1 । এটি একটি pdfdiffডিরেক্টরিতে পিডিএফ এর প্রতিটি পৃষ্ঠার জন্য একটি জেপিজি আউটপুট দেয় এবং অতিরিক্তভাবে দুটি পিডিএফের মধ্যে পৃথক পৃষ্ঠাগুলির সংখ্যা মুদ্রণ করে।
ব্রেচ্ট মাচিলস

12

আমি এখানে এটি দেখতে সক্ষম হতে পারে বলে মনে হয় না, সুতরাং এটি এখানে: সুপারইউজারের মাধ্যমে : দুটি পিডিএফ ফাইলের মধ্যে পার্থক্য কীভাবে তুলনা করবেন? (উত্তর # 229891, @ স্লাস্টাক দ্বারা) , আছে

https://github.com/vslavik/diff-pdf

(উবুন্টু নাট্টির জন্য পদক্ষেপগুলি get -diff-pdf.sh এ পাওয়া যাবে )

আমি যতদূর দেখতে পাচ্ছি, এটি মূলত পিডিএফ (গুলি) এর প্রতিটি পৃষ্ঠার পাঠ্য / গ্রাফিকগুলিকে ওভারলে করে, আপনাকে সহজেই দেখতে দেয় যে কোনও পরিবর্তন হয়েছে কিনা ...

চিয়ার্স!


9

আমরা পিডিএফএস এবং ডাব্লুডিফের তুলনা করার জন্য এএসসিআইআই সংস্করণ উত্পন্ন করতে পিডিফোটোটেক্সট (স্ক্লিভভিজের উত্তর দেখুন) ব্যবহার করেছি ।

পাঠ্যতা -layoutবাড়াতে এবং বিন্যাসে পরিবর্তনগুলি সম্পর্কে কিছু ধারণা পেতে পিডিফটেক্সটসের স্যুইচ ব্যবহার করুন ।

ডাব্লুডিডিফ থেকে সুন্দর রঙিন আউটপুট পেতে, এই মোড়ক স্ক্রিপ্টটি ব্যবহার করুন:

#!/bin/sh
RED=$'\e'"[1;31m"
GREEN=$'\e'"[1;32m"
RESET=$'\e'"[0m"
wdiff -w$RED -x$RESET -y$GREEN -z$RESET -n $1 $2

4

আমি মনে করি আপনার সর্বোত্তম পন্থা হ'ল শালীন রেজোলিউশনে পিডিএফগুলিকে চিত্রগুলিতে রূপান্তর করা এবং কোনও চিত্রের তুলনা করা।

পিডিএফ থেকে চিত্রগুলি তৈরি করতে আপনি অ্যাডোব পিডিএফ লাইব্রেরি বা পিডিএফ ফাইলগুলিকে টিফ ফাইলগুলিতে রূপান্তর করার সর্বোত্তম উপায়ে প্রস্তাবিত সমাধানটি ব্যবহার করতে পারেন ।

উত্পন্ন টিফ ফাইলে আমি গনুহ পাওয়া তুলনা করতে tiffcmp (জানালা অংশ জন্য GnuWin32 এক চুমুক মদ এবং) tiffinfo একটি ভাল কাজ করেছেন। টিফসিএমপি-এল ব্যবহার করুন এবং কোনও পার্থক্য খুঁজে পেতে আউটপুটের লাইনগুলির সংখ্যা গণনা করুন। আপনি যদি সামান্য পরিমাণে সামগ্রী পরিবর্তন করে খুশি হন (উদাঃ অ্যান্টি-এলিয়জিং পার্থক্য) তবে পিক্সেলের মোট সংখ্যা গণনা করতে টিফিনফো ব্যবহার করুন এবং তারপরে আপনি শতাংশের পার্থক্য মান তৈরি করতে পারবেন।

যে কেউ সহজ পিডিএফ তুলনা করছেন যেখানে কাঠামো পরিবর্তন হয়নি সেখানে কমান্ড লাইন ডিফ ব্যবহার এবং নির্দিষ্ট নিদর্শনগুলি উপেক্ষা করা সম্ভব, যেমন জিএনইউ ডিফ ২.7 সহ:

ডিফারফ - সংক্ষিপ্ত -I xap: -I xapmm: -I / CreationDate -I / বেসফন্ট -I / আইডি - বাইনারি - টেক্সট

এটিতে এখনও সমস্যা রয়েছে যে এটি সর্বদা উত্পন্ন ফন্টের নামগুলি পরিবর্তন করে না।


আমি মনে করি 2 টি চিত্রের তুলনা পিডিএফ ফাইলগুলির সাথে তুলনা করা আরও জটিল।
Horcrux7

চিত্রগুলির তুলনা GnuWin32 টিফসিএমপি দিয়ে করা যেতে পারে। আমি এই সম্পর্কে আমার উত্তর আপডেট করতে হবে।
ড্যানিও

1

আমাদের পণ্য, পিডিএফ তুলনাকারী - http://www.premediasystems.com/pdfc.html "- এটি বেশ মার্জিত এবং দক্ষতার সাথে করবে It's এটি নিখরচায় নয়, এবং এটি কেবলমাত্র ম্যাক ওএস এক্স application


এই সরঞ্জামটি পিক্সেল দ্বারা পিক্সেল তুলনা করে। এটি খুব সহজ। প্রশ্নটি একটি মানুষের তুলনায় একটি তুলনা ছিল।
Horcrux7

4
@ হরক্রাক্স:: তবে 'পিক্সেল বাই পিক্সেল' তুলনা করা ছাড়া আর কীভাবে মানুষের চোখ একই পৃষ্ঠার বিভিন্ন পৃষ্ঠাগুলির তুলনা করে?!?
কুর্ট ফেফিল

@ কার্টফেফিল - আমি বুঝতে পারি এটি একটি পুরানো মন্তব্য ... তবে মানুষেরা পিক্সেলের চিত্রগুলি পিক্সেলের ভিত্তিতে তুলনা করে না ; চিত্রসমূহের মধ্যে মানুষ যেভাবে পার্থক্যকে তুলনা করে তা বেশ জটিল তবে প্যাটার্ন স্বীকৃতি এবং তাত্পর্যপূর্ণতার উপর খুব বেশি নির্ভর করে।
সিবিআরএফ 23

@ সিবিআরএফ 23: সত্য, এবং আমি এটি সম্পর্কে অবগত রয়েছি - তবে শেষ পর্যন্ত এই সমস্ত হিউরিস্টিক্স এখনও "পিক্সেল বাই পিক্সেল" তুলনাতে শিকড় দেয়। কিছু অন্যের জন্য, উচ্চ স্তরের হিউরিস্টিকস, সাথে সম্পাদনা করা ImageMagick, আমার অন্যান্য উত্তরগুলি দেখুন: এক - দুই - তিনটি
কুর্ট ফিফেল

@ সিবিআরএফ 23: ... এবং আসল পোস্টার, (এ) হোকরাক্স 7 এমনকি তার প্রশ্নের "পিক্সেল" উল্লেখ করেছে, এবং স্পষ্টতই ফাইলগুলির "অভ্যন্তরীণ কাঠামো" তুলনা করতে চায় নি (যদিও তার মন্তব্য এখানে আবার এটির বিরোধিতা করে)।
কুর্ট ফেফেল

1

আপনার প্রয়োজনের ভিত্তিতে, পাঠ্য সমাধানে রূপান্তর করা সহজ এবং সর্বাধিক প্রত্যক্ষ। আমি মনে করি বিটম্যাপ ধারণাটি দুর্দান্ত ছিল।



0

টার্কওয়্যার পিডিএফ তুলনার সাথে আপনি পিডিএফ ফাইলগুলি তুলনা করতে পারেন । তবে এটি নিখরচায় নয় এবং এর জন্য অ্যাডোব অ্যাক্রোব্যাট দরকার।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.