由于数据隐式转换造成执行计划不准确,从而造成了死锁。那如果在事情出现之前发现了这类潜在的风险岂不是更好?
那么我们来看一个简单的例子,如代码清单1所示。
1: SELECT *
2: FROM HumanResources.Employee
3: WHERE NationalIDNumber = 243322160
4:
5: SELECT *
6: FROM HumanResources.Employee
7: WHERE NationalIDNumber = '243322160'
代码清单1.
NationalIDNumber列定义是Nvarchar,而参数第一个为INT类型,第二个为Varchar类型。那么就存在隐式转换,由高继伟提到的数据类型转换优先级(https://msdn.microsoft.com/zh-cn/library/ms190309.aspx)可以看到,第一列Nvarchar和INT属性类型,INT数据类型优先级高,需要把列NationalIDNumber转换为INT类型,因此涉及到需要把所有该列值转换为INT,因此只能通过扫描操作,从而影响性能。
而代码清单1中第二个查询,NationalIDNumber列为Nvarchar类型,而参数为varchar类型,根据数据类型优先级,需要将Varchar转换为Navrchar,因此仅仅需要对参数进行隐式转换,因此不影响性能。
如何在出现问题之前找到出问题的查询?
在SQL Server中,执行计划会被缓存起来,以便后续进行复用。SQL Server提供了一系列DMV可以查看这些执行计划。由于执行计划的本质是XML,因此通过XQUERY查询特定的执行计划变为可能。
在执行计划中,存在隐式转换的节点会存在类似如代码清单2所示的字段:
1: <Convert DataType="int" Style="0" Implicit="true">
2: <ScalarOperator>
3: <Identifier>
4: <ColumnReference Database="[AdventureWorks2012]" Schema="[HumanResources]" Table="[Employee]" Column="NationalIDNumber" />
5: </Identifier>
6: </ScalarOperator>
7: </Convert>
代码清单2.对列进行转换的执行计划片段
前面提到,只有对列而不是参数进行隐式转换时,才会影响性能。而在代码清单2中对列进行隐式转换的执行计划会引用具体的数据库名称、架构名称、表名称、列名称。而对参数进行隐式转换的仅仅是引用参数,如代码清单3所示。
1: <Convert DataType="nvarchar" Length="8000" Style="0" Implicit="true">
2: <ScalarOperator>
3: <Identifier>
4: <ColumnReference Column="@1" />
5: </Identifier>
6: </ScalarOperator>
7: </Convert>
代码清单3.对参数进行转换的执行计划片段
既然我们已经知道产生问题的执行计划特征,那么我们就可以利用DMV和Xquery找出这些执行计划,代码如代码清单4所示:
1: SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED
2: DECLARE @dbname SYSNAME
3: SET @dbname = QUOTENAME(DB_NAME());
4: WITH XMLNAMESPACES
5: (DEFAULT 'http://schemas.microsoft.com/sqlserver/2004/07/showplan')
6: SELECT stmt.value('(@StatementText)[1]', 'varchar(max)') AS SQL_Text ,
7: t.value('(ScalarOperator/Identifier/ColumnReference/@Schema)[1]',
8: 'varchar(128)') AS SchemaName ,
9: t.value('(ScalarOperator/Identifier/ColumnReference/@Table)[1]',
10: 'varchar(128)') AS TableName ,
11: t.value('(ScalarOperator/Identifier/ColumnReference/@Column)[1]',
12: 'varchar(128)') AS ColumnName ,
13: ic.DATA_TYPE AS ConvertFrom ,
14: ic.CHARACTER_MAXIMUM_LENGTH AS ConvertFromLength ,
15: t.value('(@DataType)[1]', 'varchar(128)') AS ConvertTo ,
16: t.value('(@Length)[1]', 'int') AS ConvertToLength ,
17: query_plan
18: FROM sys.dm_exec_cached_plans AS cp
19: CROSS APPLY sys.dm_exec_query_plan(plan_handle) AS qp
20: CROSS APPLY query_plan.nodes('/ShowPlanXML/BatchSequence/Batch/Statements/StmtSimple')
21: AS batch ( stmt )
22: CROSS APPLY stmt.nodes('.//Convert[@Implicit="1"]') AS n ( t )
23: JOIN INFORMATION_SCHEMA.COLUMNS AS ic ON QUOTENAME(ic.TABLE_SCHEMA) = t.value('(ScalarOperator/Identifier/ColumnReference/@Schema)[1]',
24: 'varchar(128)')
25: AND QUOTENAME(ic.TABLE_NAME) = t.value('(ScalarOperator/Identifier/ColumnReference/@Table)[1]',
26: 'varchar(128)')
27: AND ic.COLUMN_NAME = t.value('(ScalarOperator/Identifier/ColumnReference/@Column)[1]',
28: 'varchar(128)')
29: WHERE t.exist('ScalarOperator/Identifier/ColumnReference[@Database=sql:variable("@dbname")][@Schema!="[sys]"]') = 1
代码清单4.找出隐式转换的执行计划
小结
本篇文章提供了通过执行计划缓存找出对性能影响的隐式转换,在出现问题之前进行调优。对于开发人员来讲,注意书写T-SQL的数据类型可以在后续避免很多问题。