আমি 2 টি কলামের ভিত্তিতে সদৃশ সারি চিহ্নিত করতে এবং চিহ্নিত করতে চাই। আমি প্রতিটি নকলের জন্য একটি অনন্য শনাক্তকারী তৈরি করতে চাই যাতে আমি জানি না যে সারিটি একটি সদৃশ, তবে এটি কোন সারিটির সাথে সদৃশ। আমার কাছে একটি ডেটাফ্রেম রয়েছে যা নীচে কিছু সদৃশ আইটেম জোড়া (ফিট এবং সিটে) এবং নকল নয় এমন অন্যান্য জোড়া রয়েছে। আইটেম জোড়াটি সদৃশ হওয়ার সময়, তাদের থাকা তথ্যগুলি অনন্য is মান 1 নয়)
বর্তমান তথ্য ফ্রেম
value1 value2 value3 fit sit
[1,] "1" NA NA "it1" "it2"
[2,] NA "3" "2" "it2" "it1"
[3,] "2" "3" "4" "it3" "it4"
[4,] NA NA NA "it4" "it3"
[5,] "5" NA NA "it5" "it6"
[6,] NA NA "2" "it6" "it5"
[7,] NA "4" NA "it7" "it9"
কোড উদাহরণস্বরূপ ডেটা ফ্রেম উত্পন্ন
value1<-c(1,NA,2,NA,5,NA,NA)
value2<-c(NA,3,3,NA,NA,NA, 4)
value3<-c(NA,2,4,NA,NA,2, NA)
fit<-c("it1","it2","it3","it4", "it5", "it6","it7")
sit<-c("it2","it1","it4","it3", "it6", "it5", "it9")
df.now<-cbind(value1,value2,value3, fit, sit)
আমি যা চাই তা হ'ল এটিকে এমন একটি ডেটাফ্রেমে রূপান্তর করা যা:
পছন্দসই ডেটাফ্রেম
val1 val2 val3 it1 it2
[1,] "1" "3" "2" "it1" "it2"
[2,] "2" "3" "4" "it3" "it4"
[3,] "5" NA "2" "it5" "it6"
[4,] NA "4" NA "it7" "it9"
আমি নিম্নলিখিত পদক্ষেপগুলি করার কথা ভাবছিলাম: ১. ফিট ব্যবহার করে নতুন ভেরিয়েবল তৈরি করুন এবং নকল জোড়া সনাক্ত করতে সবচেয়ে কম আইটেম এবং সর্বাধিক আইটেমের সাথে বসুন uplic. সদৃশ আইটেমের জোড়গুলি চিহ্নিত করুন ৩. অনন্য তথ্য নির্বাচন করতে এবং পূরণ করতে আইফেল ব্যবহার করুন।
আমি জানি কীভাবে 1 এবং 3 পদক্ষেপটি করা যায় তবে আমি দ্বিতীয় ধাপে আটকে আছি think আমার মনে হয় আমার যা করা দরকার তা হ'ল সত্য / মিথ্যা সদৃশ সনাক্তকরণ নয়, তবে প্রতিটি আইটেমের জোড়াটির জন্য একটি অনন্য সনাক্তকারী সহ একটি কলাম থাকতে পারে (সেখানে আমার পদক্ষেপ 1 এর কারণে 2 টি অতিরিক্ত সারি রয়েছে):
value1 value2 value3 fit sit lit hit dup
[1,] "1" NA NA "it1" "it2" "it1" "it2" 1
[2,] NA "3" "2" "it2" "it1" "it1" "it2" 1
[3,] "2" "3" "4" "it3" "it4" "it3" "it4" 2
[4,] NA NA NA "it4" "it3" "it3" "it4" 2
[5,] "5" NA NA "it5" "it6" "it5" "it6" 3
[6,] NA NA "2" "it6" "it5" "it5" "it6" 3
[7,] NA "4" NA "it7" "it9" "it7" "it9" NA
আমি কীভাবে এটি করব তা নিশ্চিত নই।
আমি যা জিজ্ঞাসা করছি তা হয় দ্বিতীয় ধাপে সহায়তা করা বা সম্ভবত আমি বর্ণিত পদক্ষেপগুলির চেয়ে এটি সমাধানের আরও ভাল উপায় হতে পারে।