从sqlite数据库删除重复的行

我在SQLite3中有一个巨大的表-3600万行。在这个很大的表中,有两列:


hash -文字

d -真实

一些行是重复的。也就是说,两者hash和d具有相同的值。如果两个哈希值相同,则的值也相同d。但是,两个相同的d'并不意味着两个相同hash'。


我想删除重复的行。我没有主键列。


最快的方法是什么?


绝地无双
浏览 1006回答 3
3回答

www说

您需要一种区分行的方法。根据您的评论,您可以为此使用特殊的rowid列。要通过保持最低的删除重复rowid每(hash,d):delete   from YourTablewhere    rowid not in         (         select  min(rowid)         from    YourTable         group by                 hash         ,       d         )

狐的传说

如果添加主键不是一种选择,则一种方法是将重复的DISTINCT存储在临时表中,从现有表中删除所有重复的记录,然后将记录从临时表中添加回原始表中。例如(为SQL Server 2008编写的,但是该技术对于任何数据库都是相同的):DECLARE @original AS TABLE([hash] varchar(20), [d] float)INSERT INTO @original VALUES('A', 1)INSERT INTO @original VALUES('A', 2)INSERT INTO @original VALUES('A', 1)INSERT INTO @original VALUES('B', 1)INSERT INTO @original VALUES('C', 1)INSERT INTO @original VALUES('C', 1)DECLARE @temp AS TABLE([hash] varchar(20), [d] float)INSERT INTO @tempSELECT [hash], [d] FROM @original GROUP BY [hash], [d]HAVING COUNT(*) > 1DELETE OFROM @original OJOIN @temp T ON T.[hash] = O.[hash] AND T.[d] = O.[d]INSERT INTO @originalSELECT [hash], [d] FROM @tempSELECT * FROM @original我不确定sqlite是否具有ROW_NUMBER()类型函数,但是如果这样做,您还可以尝试此处列出的一些方法:从没有主键的SQL表中删除重复的记录
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

SQL Server