ওরাকলে টেবিল থেকে সদৃশ সারিগুলি সরানো হচ্ছে


151

আমি ওরাকলে কিছু পরীক্ষা করছি এবং কিছু নমুনা ডেটা সহ একটি টেবিল তৈরি করেছি, তবে প্রক্রিয়াটিতে আমি দুর্ঘটনাক্রমে সদৃশ রেকর্ডগুলি লোড করেছি, তাই এখন আমি কয়েকটি কলাম ব্যবহার করে একটি প্রাথমিক কী তৈরি করতে পারছি না।

আমি কীভাবে সমস্ত সদৃশ সারিগুলি মুছব এবং তার মধ্যে কেবল একটিটি রেখে দেব?

উত্তর:


306

rowidসিউডোকলম ব্যবহার করুন ।

DELETE FROM your_table
WHERE rowid not in
(SELECT MIN(rowid)
FROM your_table
GROUP BY column1, column2, column3);

যেখানে column1, column2এবং column3প্রতিটি রেকর্ডের জন্য সনাক্তকারী কী তৈরি করুন। আপনি আপনার সমস্ত কলাম তালিকাভুক্ত করতে পারেন।


6
+1 আমাকে 12,000+ রেকর্ডে সমাহিত দুটি সদৃশ ফোন নম্বর খুঁজে পেতে হয়েছিল। নির্বাচনকে মোছার জন্য ডিলিট পরিবর্তন করে এবং এটি সেটিকে কয়েক সেকেন্ডে খুঁজে পেয়েছে। আমাকে অনেক সময় বাঁচিয়েছে, ধন্যবাদ
শিমোনেক

3
এই পদ্ধতিটি আমার পক্ষে কার্যকর হয়নি। কেন জানি না। আমি যখন "নির্বাচন" এর সাথে "মুছে ফেলুন" প্রতিস্থাপন করেছি, এটি মুছে ফেলতে চাইছে এমন সারিটি ফিরিয়ে দিয়েছিল, কিন্তু যখন আমি "মুছে ফেলুন" দিয়ে মৃত্যুদন্ড কার্যকর করেছি তখন এটি অনির্দিষ্টকালের জন্য ঝুলছিল।
অ্যার_বিজ

খনিটি হয় হয় খুব দীর্ঘ সময় ঝুলন্ত বা কার্যকর হয়। প্রায় 22 ঘন্টা চালানো হয়েছে এবং এখনও চলছে। সারণীতে 21M রেকর্ড রয়েছে।
ক্যামেরন কাস্টিলো

আমি যদি আপনার কাছে খুব বড় ডেটা সেট করে থাকে এবং যদি সম্ভব হয় তবে WHERE স্টেটমেন্টে আরও ফিল্টারিং যুক্ত করার পরামর্শ দিচ্ছি, এটি দীর্ঘ চলমান অনুসন্ধানগুলির সাথে লোকদের সহায়তা করতে পারে।
রিকার্ডো সানচেজ

2
নির্বাচনটি যদি কাজ করে তবে ডিলিটটি কাজ করে না, এটি ফলাফলের সাবকিউরিটির আকারের কারণে হতে পারে। সাব-কোয়েরি ফলাফলের সাথে প্রথমে একটি তৈরি টেবিল করা আকর্ষণীয় হতে পারে, মিনিটের (রোড) কলামে একটি সূচক তৈরি করুন এবং তারপরে মুছুন বিবৃতিটি চালান run
ওয়াউটার

15

জিজ্ঞাসা টম থেকে

delete from t
 where rowid IN ( select rid
                    from (select rowid rid, 
                                 row_number() over (partition by 
                         companyid, agentid, class , status, terminationdate
                                   order by rowid) rn
                            from t)
                   where rn <> 1);

(অনুপস্থিত প্রথম বন্ধনী সংশোধন)


বিবৃতিতে প্যারেন্টেসিস নিখোঁজ। আমি ধরে নিলাম শেষ হওয়া উচিত?
ক্যামেরন কাস্টিলো

12

ডেভএক্স.কম থেকে :

DELETE FROM our_table
WHERE rowid not in
(SELECT MIN(rowid)
FROM our_table
GROUP BY column1, column2, column3...) ;

যেখানে কলাম 1, কলাম 2 ইত্যাদি আপনি কী ব্যবহার করতে চান তা।


12
DELETE FROM tablename a
      WHERE a.ROWID > ANY (SELECT b.ROWID
                             FROM tablename b
                            WHERE a.fieldname = b.fieldname
                              AND a.fieldname2 = b.fieldname2)

1
উপরে ভোট দেওয়া উত্তরের উপরে আমার মন্তব্যটি পুনরায় করুন, এটিই এই অনুরোধ যা আমার সমস্যাটি আসলেই সমাধান করেছিল।
অ্যার_বিজ

2
এটি বিলের সমাধানের চেয়ে বিশাল টেবিলগুলিতে ধীরে ধীরে ধীরে ধীরে হবে।
ওয়াউটার

8

সমাধান 1)

delete from emp
where rowid not in
(select max(rowid) from emp group by empno);

সমাধান 2)

delete from emp where rowid in
               (
                 select rid from
                  (
                    select rowid rid,
                      row_number() over(partition by empno order by empno) rn
                      from emp
                  )
                where rn > 1
               );

সমাধান 3)

delete from emp e1
         where rowid not in
          (select max(rowid) from emp e2
           where e1.empno = e2.empno ); 

6

টি 1 টি থেকে টি 1 থেকে আলাদা আলাদা নির্বাচন করুন;


কোনও উত্তর নয় - distinct *প্রতিটি রেকর্ড গ্রহণ করবে যা 1 কলামে কমপক্ষে 1 চিহ্নের চেয়ে পৃথক হবে। আপনার যা দরকার তা হল কেবলমাত্র প্রাথমিক কীগুলি তৈরি করতে চান এমন কলামগুলি থেকে স্বতন্ত্র মানগুলি নির্বাচন করা - বিলের উত্তর এই পদ্ধতির দুর্দান্ত উদাহরণ।
নোগার্ড

1
এটি আমার প্রয়োজন (সম্পূর্ণ অভিন্ন লাইনগুলি সরিয়ে ফেলুন)। ধন্যবাদ!
এমমানুয়েল

এই পদ্ধতির আর একটি অসুবিধা হ'ল আপনাকে আপনার টেবিলের একটি অনুলিপি তৈরি করতে হবে। বিশাল টেবিলগুলির জন্য, এটি অতিরিক্ত টেবিল স্পেস সরবরাহ করে এবং অনুলিপি বা অনুলিপিটির পরে টেবিল স্পেস সঙ্কুচিত করে। বিলের পদ্ধতিতে আরও সুবিধা রয়েছে এবং কোনও অতিরিক্ত অসুবিধা নেই।
ওয়াউটার

3

লুপের জন্য কার্সার ব্যবহার করে আপনার একটি ছোট্ট pl / sQL ব্লক করা উচিত এবং আপনি যে সারিগুলি রাখতে চান না তা মুছুন। এই ক্ষেত্রে:

declare
prev_var my_table.var1%TYPE;

begin

for t in (select var1 from my_table order by var 1) LOOP

-- if previous var equal current var, delete the row, else keep on going.
end loop;

end;

আমি বিশ্বাস করি যে ডাউনভোটটি হ'ল কারণ আপনি যখন পিএল / এসকিউএল ব্যবহার করছেন যখন আপনি এসকিউএল এ এটি করতে পারেন, যদি আপনি ভাবছেন।
ডাব্লুডাব্লু

7
আপনি এটি এসকিউএল এ করতে পারবেন বলেই এর একমাত্র সমাধানটি বোঝায় না। এসকিউএল-কেবলমাত্র সমাধানটি দেখার পরে আমি এই সমাধানটি পোস্ট করেছি posted আমি ভেবেছিলাম ভোটগুলি ভুল উত্তরের জন্য।
নিক

3

সদৃশগুলি নির্বাচন করতে কেবল ক্যোয়ারী বিন্যাসটি হতে পারে:

SELECT GroupFunction(column1), GroupFunction(column2),..., 
COUNT(column1), column1, column2...
FROM our_table
GROUP BY column1, column2, column3...
HAVING COUNT(column1) > 1

সুতরাং অন্যান্য পরামর্শ অনুসারে সঠিক প্রশ্নটি হ'ল:

DELETE FROM tablename a
      WHERE a.ROWID > ANY (SELECT b.ROWID
                             FROM tablename b
                            WHERE a.fieldname = b.fieldname
                              AND a.fieldname2 = b.fieldname2
                              AND ....so on.. to identify the duplicate rows....)

এই কোয়েরিটি নির্বাচিত মানদণ্ডগুলির জন্য ডাটাবেসের মধ্যে প্রাচীনতম রেকর্ড রাখবে WHERE CLAUSE

ওরাকল সার্টিফাইড সহযোগী (২০০৮)


2

সত্যিই বড় টেবিলগুলির দ্রুততম উপায়

  1. নীচে কাঠামো সহ ব্যতিক্রম টেবিল তৈরি করুন: ব্যতিক্রম_সামান্য

    ROW_ID ROWID
    OWNER VARCHAR2(30)
    TABLE_NAME VARCHAR2(30)
    CONSTRAINT VARCHAR2(30)
    
  2. একটি অনন্য বাধা বা প্রাথমিক কী তৈরির চেষ্টা করুন যা সদৃশ দ্বারা লঙ্ঘিত হবে। আপনার সদৃশ হওয়ার কারণে আপনি একটি ত্রুটি বার্তা পাবেন। ব্যতিক্রম সারণীতে সদৃশ সারিগুলির জন্য সারিগুলি থাকবে।

    alter table add constraint
    unique --or primary key
    (dupfield1,dupfield2) exceptions into exceptions_table;
    
  3. সারণী দ্বারা মুছে ফেলা এবং ডুপগুলি মুছে ফেলা ব্যতিক্রমগুলি সহ আপনার টেবিলটিতে যোগ দিন

    delete original_dups where rowid in (select ROW_ID from exceptions_table);
  4. যদি মুছে ফেলার সারিগুলির পরিমাণটি বড় হয় তবে একটি নতুন টেবিল তৈরি করুন (সমস্ত মঞ্জুরি এবং সূচক সহ) অ্যান্টি-জয়েনিং-এ ব্যতিক্রমী_সামগ্রী দ্বারা সারণী এবং মূল টেবিলটির নাম অরিজিনাল_ডপস টেবিলের নামকরণ করুন এবং নতুন_সারণযোগ্য_নথ_নো_ডুপগুলি মূল টেবিলের মধ্যে নামকরণ করুন

    create table new_table_with_no_dups AS (
        select field1, field2 ........ 
        from original_dups t1
        where not exists ( select null from exceptions_table T2 where t1.rowid = t2.row_id )
    )
    

2

সারি

delete from emp
 where rowid not in
 (select max(rowid) from emp group by empno);

স্ব-যোগদান- ব্যবহার করা

delete from emp e1
 where rowid not in
 (select max(rowid) from emp e2
 where e1.empno = e2.empno );

হাই টান্ডলে, পাঠের ক্ষমতা বৃদ্ধি পাওয়ায় উত্তর জমা দেওয়ার সময় দয়া করে কোড বিন্যাসকরণ সরঞ্জামটি ব্যবহার করুন।
এনএসনব

2

সমাধান 4)

 delete from emp where rowid in
            (
             select rid from
                (
                  select rowid rid,
                  dense_rank() over(partition by empno order by rowid
                ) rn
             from emp
            )
 where rn > 1
);

আপনি কিছুটা ব্যাখ্যা করতে পারেন?
ডিয়েটার মীমকেন

পার্টিশনের সাথে ঘন র‌্যাঙ্কটি একই সংখ্যার সাথে সদৃশ সারিগুলির জন্য র‌্যাঙ্ক দেয় উদাহরণস্বরূপ তিনটি সারি র‌্যাঙ্ক 1, 1, 1 রয়েছে এবং রোউইড প্রতিটি সারির জন্য ইউনিক হিসাবে তৈরি করে এবং আমরা সেই সারিগুলিকে মুছে ফেলার চেষ্টা করছি যা মিলছে না।
ডুআরডি

আমরা র‌্যাঙ্ক এবং ঘন_ক্র্যাঙ্ক উভয় ফাংশন ব্যবহার করতে পারি তবে আমার ধারণা র‌্যাঙ্ক এই দৃশ্যে পুরোপুরি কাজ করে।
ডুরডি

2

1. সমাধান

delete from emp
    where rowid not in
    (select max(rowid) from emp group by empno);

2. sloution

delete from emp where rowid in
               (
                 select rid from
                  (
                    select rowid rid,
                      row_number() over(partition by empno order by empno) rn
                      from emp
                  )
                where rn > 1
               );

3.solution

delete from emp e1
         where rowid not in
          (select max(rowid) from emp e2
           where e1.empno = e2.empno ); 

4. সমাধান

 delete from emp where rowid in
            (
             select rid from
                (
                  select rowid rid,
                  dense_rank() over(partition by empno order by rowid
                ) rn
             from emp
            )
 where rn > 1
);

2

5. সমাধান

delete from emp where rowid in 
    (
      select  rid from
       (
         select rowid rid,rank() over (partition by emp_id order by rowid)rn from emp     
       )
     where rn > 1
    );

2
DELETE from table_name where rowid not in (select min(rowid) FROM table_name group by column_name);

এবং আপনি নকল রেকর্ড অন্য উপায়ে মুছতে পারেন

DELETE from table_name a where rowid > (select min(rowid) FROM table_name b where a.column=b.column);

2
create table abcd(id number(10),name varchar2(20))

insert into abcd values(1,'abc')

insert into abcd values(2,'pqr')


insert into abcd values(3,'xyz')

insert into abcd values(1,'abc')

insert into abcd values(2,'pqr')

insert into abcd values(3,'xyz')


select * from abcd
id  Name
1   abc
2   pqr
3   xyz
1   abc
2   pqr
3   xyz

Delete Duplicate record but keep Distinct Record in table 

DELETE 
FROM abcd a
WHERE ROWID > (SELECT MIN(ROWID) FROM abcd b
WHERE b.id=a.id
);

run the above query 3 rows delete 

select * from abcd

id  Name 
1   abc
2   pqr
3   xyz

1
DELETE FROM tableName  WHERE ROWID NOT IN (SELECT   MIN (ROWID) FROM table GROUP BY columnname);

বিল দ্য টিকটিকিটির আরও বিস্তৃত উত্তর হিসাবে একই উত্তর।
ওয়াওটার

1
delete from dept
where rowid in (
     select rowid
     from dept
     minus
     select max(rowid)
     from dept
     group by DEPTNO, DNAME, LOC
);

আপনি কি আপনার উপায় সম্পর্কে আরও তথ্য যুক্ত করতে পারেন? ধন্যবাদ।
প্রতিবেদক

1

সেরা পারফরম্যান্সের জন্য, আমি এখানে যা লিখেছি:
(কার্যকর করার পরিকল্পনা দেখুন)

DELETE FROM your_table
WHERE rowid IN 
  (select t1.rowid from your_table  t1
      LEFT OUTER JOIN (
      SELECT MIN(rowid) as rowid, column1,column2, column3
      FROM your_table 
      GROUP BY column1, column2, column3
  )  co1 ON (t1.rowid = co1.rowid)
  WHERE co1.rowid IS NULL
);

1

স্ক্রিপ্টগুলির নীচে চেক করুন -

1।

Create table test(id int,sal int); 

2।

    insert into test values(1,100);    
    insert into test values(1,100);    
    insert into test values(2,200);    
    insert into test values(2,200);    
    insert into test values(3,300);    
    insert into test values(3,300);    
    commit;

3।

 select * from test;    

আপনি এখানে 6-রেকর্ড দেখতে পাবেন।
4. কোয়েরি নীচে চালানো -

delete from 
   test
where rowid in
 (select rowid from 
   (select 
     rowid,
     row_number()
    over 
     (partition by id order by sal) dup
    from test)
  where dup > 1)
  1. select * from test;

আপনি দেখতে পাবেন যে সদৃশ রেকর্ডগুলি মুছে ফেলা হয়েছে।
আশা করি এটি আপনার প্রশ্নের সমাধান করে। ধন্যবাদ :)


1

সাধারণ কোনও টেবিল এক্সপ্রেশন এবং উইন্ডো ফাংশন ব্যবহার করে এমন কোনও উত্তর আমি দেখিনি। এটিই আমি কাজ করতে সবচেয়ে সহজ খুঁজে পাই।

DELETE FROM
 YourTable
WHERE
 ROWID IN
    (WITH Duplicates
          AS (SELECT
               ROWID RID, 
               ROW_NUMBER() 
               OVER(
               PARTITION BY First_Name, Last_Name, Birth_Date)
                  AS RN
               SUM(1)
               OVER(
               PARTITION BY First_Name, Last_Name, Birth_Date
               ORDER BY ROWID ROWS BETWEEN UNBOUNDED PRECEDING 
                                       AND UNBOUNDED FOLLOWING)
                   AS CNT
              FROM
               YourTable
              WHERE
               Load_Date IS NULL)
     SELECT
      RID
     FROM
      duplicates
     WHERE
      RN > 1);

কিছু দ্রষ্টব্য:

1) আমরা কেবল পার্টিশন ধারাটিতে ক্ষেত্রগুলিতে সদৃশ পরীক্ষা করছি।

২) অন্যের তুলনায় আপনার যদি একটি সদৃশ বাছাই করার কিছু কারণ থাকে তবে আপনি ধারাটির মাধ্যমে একটি অর্ডারটি ব্যবহার করতে পারেন যে সারিটিতে সারি_ সংখ্যা () = 1 থাকবে

3) আপনি চূড়ান্ত পরিবর্তন করে সংরক্ষিত নম্বরটির নকলটি পরিবর্তন করতে পারবেন যেখানে এন> = 1 দিয়ে "হ্যাঁ আরএন> এন" এ ধারাটি রয়েছে (আমি ভাবছিলাম যে এন = 0 নকল আছে এমন সমস্ত সারি মুছে ফেলবে, তবে এটি কেবল সমস্ত সারি মুছে ফেলবে) ।

4) যোগ পার্টিশনের ক্ষেত্রটি সিটিই কোয়েরি যোগ করেছে যা প্রতিটি সারিটিকে গ্রুপের নম্বর সারি দিয়ে ট্যাগ করবে। সুতরাং ডুপ্লিকেট সহ সারি নির্বাচন করতে প্রথম আইটেমটি "WHERE cnt> 1" ব্যবহার করুন।


0
create or replace procedure delete_duplicate_enq as
    cursor c1 is
    select *
    from enquiry;
begin
    for z in c1 loop
        delete enquiry
        where enquiry.enquiryno = z.enquiryno
        and rowid > any
        (select rowid
        from enquiry
        where enquiry.enquiryno = z.enquiryno);
    end loop;
 end delete_duplicate_enq;

এই পদ্ধতির একটি বড় অসুবিধা হ'ল অভ্যন্তরীণ যোগদান। বড় টেবিলগুলির জন্য এটি বিলের পদ্ধতির চেয়ে অনেক ধীর হবে। এছাড়াও, এটি করার জন্য পিএল / এসকিউএল ব্যবহার করা ওভারকিল, আপনি কেবল এসকিউএল ব্যবহার করে এটি ব্যবহার করতে পারেন।
ওয়াউটার

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.