আমি কোনও ডিফ সরঞ্জামের কথা বলছি না। আমি সত্যিই দেখতে চাইছি যে কোনও প্রকল্পে এমন কোনও কোড রয়েছে যা অন্য কোনও প্রকল্পের "রিফ্যাক্টর" হতে পারে। এটি সম্ভবত ফাংশন নাম, পরিবর্তনশীল নাম এবং কি নোট পরিবর্তন করা হবে। শর্তগুলি বিপরীত হতে পারে, ইত্যাদি
আমি কোনও ডিফ সরঞ্জামের কথা বলছি না। আমি সত্যিই দেখতে চাইছি যে কোনও প্রকল্পে এমন কোনও কোড রয়েছে যা অন্য কোনও প্রকল্পের "রিফ্যাক্টর" হতে পারে। এটি সম্ভবত ফাংশন নাম, পরিবর্তনশীল নাম এবং কি নোট পরিবর্তন করা হবে। শর্তগুলি বিপরীত হতে পারে, ইত্যাদি
উত্তর:
আমি যখন সফটওয়্যার ইঞ্জিনিয়ারিংয়ের পাঠদান করছিলাম, তখন স্ট্যানফোর্ডে এমওএসএস (সফটওয়্যার সাদৃশ্যতার পরিমাপ) নামক (ফ্রি) পরিষেবাটি ব্যবহার করি । এটি আমাকে খুব সহজেই ছাত্র প্রকল্পগুলির মধ্যে চৌর্যবৃত্তি সনাক্ত করতে দেয় allowed সিস্টেমটি আমাকে "জ্ঞাত ভাল" কোড উদাহরণগুলি প্রবেশ করার অনুমতিও দিয়েছিল যা আমি ক্লাসের সময় ব্যবহার করেছি যা উপেক্ষা করা উচিত ছিল।
ফিরে আসা ফলাফলগুলি সম্পর্কে দুর্দান্ত জিনিস (পুরোপুরি একটি পার্শ্ব ইস্যু) হ'ল আমরা বলতে পারি কোন শিক্ষার্থীরা একসাথে কাজ করেছিল --- তারা যদি কোডটি স্পষ্টভাবে অনুলিপি না করেও, তারা যথেষ্ট সমস্যাগুলি নিয়ে আলোচনা করেছিল যে তাদের কোডটি একই ছিল। দু: খজনক অংশটি অন্য কোনও কোডে কোনও সিমিলারিটির সাথে বিজোড় শিক্ষার্থীকে সন্ধান করছিল। তারা সাধারণত এত ভাল করে না।
আপনি যা খুঁজছেন তা পেতে আপনি পিএমডি সরঞ্জামটি ব্যবহার করতে সক্ষম হতে পারেন । এটি কোনও কোড বেসের মধ্যে কাটা এবং আটকানো বোঝানো হয়েছে তবে আপনি যদি সন্দেহযুক্ত উত্স প্রকল্পের উত্সটি অন্তর্ভুক্ত করেন তবে এটি আপনাকে কোডটি অনুলিপি করা হয়েছিল তা দেখতে সহায়তা করতে পারে।
আপনি যা সন্ধান করছেন তার সাথে আমি সবচেয়ে কাছের জিনিসটি জানি ক্লোন ডিটেকটিভ। এটি একটি ভিজ্যুয়াল স্টুডিও প্লাগ-ইন।
ক্লোন ডিটেক্টিভ একটি ভিজ্যুয়াল স্টুডিও সংহত যা আপনাকে অন্য কোথাও সদৃশ কোডের সোর্স কোডের জন্য সি # প্রকল্প বিশ্লেষণ করতে দেয়। সদৃশ থাকা সহজেই অসঙ্গতি সৃষ্টি করতে পারে এবং প্রায়শই দুর্বল ফ্যাক্টর কোডের একটি সূচক।
মনে হচ্ছে আপনি দুটি বিমূর্ত সিনট্যাক্স ট্রি (এএসটি) এর মধ্যে পার্থক্যটি গণনা করতে চান, সুতরাং আপনি স্মার্ট ডিফারেন্সার সরঞ্জামটিতে আগ্রহী হতে পারেন ।
Https://stackoverflow.com/questions/974855/eclipse-abstract-syntax-tree-diff এ পাওয়া গেছে ।
এমনকি আপনি কোনও ডিফার টুলের কথা না বললেও, আপনি এখনও এর জন্য একটি ব্যবহার করতে পারেন, কমপক্ষে কিছুটা হলেও। আমি যদি কোডের দুটি বিভাগ দেখতে দেখতে দেখতে দেখতে দেখতে একইরকম দেখতে পাই তবে উদাহরণস্বরূপ, আমি সাধারণ ক্রিয়াকলাপটি রিফ্যাক্টর করে এটিকে আরও সরল করার জন্য কতটা কাজ হবে তা দেখার জন্য আমি প্রায়শই উভয় বিয়ন্ডকম্পারে পেস্ট করি।
অন্যদিকে, যদি আপনি না জানেন যে অনুরূপ কোডটি কোথায় রয়েছে তবে আপনি কেবল ভাবছেন যে কোথাও কোথাও উপস্থিত রয়েছে ... আপনি কী খুঁজছেন? চৌর্যবৃত্তি সনাক্ত করার জন্য একটি স্বয়ংক্রিয় সরঞ্জাম? আমি নিশ্চিত নই যে এ জাতীয় কোনও জিনিস রয়েছে।
বিষয়টিতে উইকিপিডিয়ায় এই নিবন্ধটিতে বেশ কয়েকটি সরঞ্জামের লিঙ্কও অন্তর্ভুক্ত রয়েছে যা অনুরূপ বা সদৃশ কোড খুঁজতে ব্যবহৃত হতে পারে। আমাদের এটির জন্য একটি অভ্যন্তরীণ সরঞ্জাম রয়েছে, সুতরাং আমি নিবন্ধে উল্লিখিত বাহ্যিক সরঞ্জামগুলির সাথে পরিচিত নই।
আপনি যা করতে চান তা হ'ল দুটি প্রকল্পের জুড়ে কোড ক্লোনড (অনুলিপি করা হয়েছে) রয়েছে (উভয় প্রকল্পই সম্ভবত বড় আকারের ফাইল রয়েছে)। আপনি ক্লোন সনাক্তকরণ সরঞ্জাম চালিয়ে এটি করতে পারেন। উইকিপিডিয়া তাদের বিভিন্ন তালিকাবদ্ধ করে।
প্রচুর অনুলিপি রয়েছে কিনা তা স্থূলভাবে সিদ্ধান্ত নেওয়ার জন্য, আপনাকে কেবল উত্স রেখাগুলির সাথে মেলে নেওয়া দরকার এবং সেখানে বিভিন্ন উত্স-লাইন ক্লোন সনাক্তকারী রয়েছে। আমি বিশ্বাস করি পিএমডি তাদের মধ্যে একটি। এগুলি যা করবে না তা হ'ল কোডটি যা কপি-পেস্ট-সম্পাদিত; তারা বয়লারপ্লেট অনুলিপি-পেস্ট-অপরিবর্তিত কোড সম্ভবত কপি-অতীত সম্পাদিত স্টাফের চারপাশে মোড়ানো সম্ভবত পাবেন।
আপনি যদি অনুলিপি-অতীত সম্পাদনা কোডের অনুলিপিটির বিশদটি দেখতে চান তবে আপনার কাছে এমন একটি ক্লোন ডিটেক্টর দরকার যা "প্যারামিটারাইজড" ক্লোনগুলি খুঁজে পায়। টোকেন ভিত্তিক সনাক্তকারীরা সম্পাদনাগুলির জন্য এটি করেন যা কেবলমাত্র পরিবর্তনশীল নাম বা ধ্রুবক প্রতিস্থাপন করে।
অ্যাবস্ট্রাক্ট-সিনট্যাক্স ট্রি (এএসটি) ভিত্তিক ডিটেক্টরগুলি বৃহত্তর অংশগুলির সাথে জড়িত সম্পাদনাগুলির জন্য এটি করেন, যেমন অভিব্যক্তি, বিবৃতি, সন্নিবেশ, মোছা, ইত্যাদি। এই উত্তরোত্তরগুলি আরও ভাল উত্তর দেয়, কারণ টোকেন ডিটেক্টরগুলির বিপরীতে, তারা কম্পিউটার উত্স কোডের ভাষা কাঠামোকে গাইড হিসাবে ব্যবহার করতে পারে।
আমাদের ক্লোনডিআর সরঞ্জামটি এমন একটি ডিটেক্টর।
আমি এমন সরঞ্জামগুলি সম্পর্কে জানি না যা প্রকৃতপক্ষে "সমতুল্য" কোড (বিপরীত শর্তসাপেক্ষে) ইত্যাদি খুঁজে পাবে cl
আমি সত্যিই পছন্দ করি যে সিসিফিন্ডারএক্স কীভাবে সাদৃশ্যটি রূপায়িত করে , তাই আপনি এটিও পরীক্ষা করতে চাইতে পারেন। বেশ কয়েকটি ভাষার সমর্থন করে এটি সেটআপ করার জন্য নিখরচায় এবং মোটামুটি সহজ (পাইথন ২.6)।