SQL Server – Performance | Blog - Fabiano Neves Amorim

Arquivo

Archive for the ‘SQL Server – Performance’ Category

Azure Premium Storage… Testes com SQLIO

29 de maio de 2015 Fabiano Amorim 5 comentários

Fala galera, faz tempo eim?

Bom, semana passada fiz uns testes em um cliente acho que a informação vai ser útil pra vocês.

Esse é um cliente que sofria demais com a péssima performance dos discos do Azure, todo a sua infra-estrutura de banco de dados está em VMs.

Depois de aplicar várias técnicas para minimizar o custo e melhorar a performance das operações de I/O, finalmente o storage premium ficou disponível (só pra País de primeiro mundo, adivinha se tem no Brasil?…) para compra, e conseguimos migrar tudo para o novo storage. Porém ficávamos sempre com aquela dúvida, e ai, vai melhorar mesmo? Quantos %? Qual a diferença de performance dos discos? … Para responder essas nossas dúvidas e ter certeza de que o novo storage está melhor, fiz alguns testes com SQLIO e criei alguns gráficos.

Antes de te mostrar os gráficos, deixa eu mencionar algumas técnicas que usamos que ajudam a minimizar o I/O pra caso você tenha tenha tempo (a.k.a. money) de migrar para o novo storage que é claro, custa mais caro.

Segue uma lista de itens que você pode rever no seu ambiente para otimizar o I/O:

· Use minimum Standard Tier A2 for SQL Server VMs.
· Keep the storage account and SQL Server VM in the same region.
· Disable Azure geo-replication on the storage account.
· Avoid using operating system or temporary disks for database storage or logging.
· Avoid using Azure data disk caching options (caching policy = None).
· Stripe multiple Azure data disks to get increased IO throughput.
· Format with documented allocation sizes.
· Separate data and log file I/O paths to obtain dedicated IOPs for data and log.
· Enable database page compression.
· Enable instant file initialization for data files.
· Limit or disable autogrow on the database.
· Disable autoshrink on the database.
· Move all databases to data disks, including system databases.
· Move SQL Server error log and trace file directories to data disks.
· Apply SQL Server performance fixes.
· Setup default locations.
· Enable locked pages.
· Backup directly to blob storage.

Sorry o inglês, fiquei com preguiça de traduzir… ;P Peguei a lista acima do seguinte link: https://msdn.microsoft.com/en-us/library/azure/dn133149.aspx

Bom, se mesmo assim você não conseguir a performance desejada, então vai precisar migrar para os novos discos com premier. A performance foi realmente surpreendente e fez o que prometeu.

Seguem os gráficos que são bem auto-explicativos, em laranja servidor novo, em azul servidor velho:

IPOS foi lindo de ver… Conseguimos bater 15k por segundo, contra ridículos 1400 que estávamos executando no servidor antigo.

Como podemos ver, a latência ficou entre 1ms e 34ms o que é MUITO melhor que o tempo resposta de 33ms a 182ms nos discos velhos.

MBs por segundo também melhorou demais… Agora consigo ler até 252mbs por segundo, contra 47mb…

Espero que seja útil…

Abs.

Fabiano Amorim

Categorias:Azure, SQL Server - Performance, Virtual PASS BR

Novo artigo simple-talk–Sort warnings…

20 de março de 2015 Fabiano Amorim 2 comentários

Depois de quase 1 ano sem escrever pro Simple-Talk… here we go com um novo artigo !

https://www.simple-talk.com/sql/performance/never-ignore-a-sort-warning-in-sql-server/

Abs.

Fabiano

Categorias:SQL Server, SQL Server - Performance, Virtual PASS BR

Arquivos, SQLSat284 e Fórum Tecnico MS Brasil

28 de abril de 2014 Fabiano Amorim 3 comentários

Fala galera, os últimos dias foram corridos porém extremamente prazerosos.

Fiz duas apresentações, uma na MS Brasil onde falei sobre Otimizador de Consultas do SQL2014 e outra no SQLSat284 em POA onde falei sobre Tuning do Início ao Fim.

Segue o link para download dos arquivos utilizados nas minhas sessões:

Fórum Tecnico na MS Brasil “Novidades para otimização e performance no SQL Server 2014”: http://1drv.ms/1fmpsuI

SQLSat284 – “Tuning do Início ao Fim”: http://1drv.ms/1m2Hv7z

Algumas imagens dos ppts:

Fórum técnico na Microsoft Brasil:

SQLSat284 em POA:

Categorias:Evento, PPT, SQL Server, SQL Server - Performance, Virtual PASS BR

Pensar set-based, porque é tão difícil?

20 de setembro de 2012 Fabiano Amorim 11 comentários

Cá estou, no avião voltando pra casa depois de mais um trabalho de Tuning no SQL Server, processo que demorava 10 horas agora demora 24 minutos, cliente feliz e eu voltando pra casa pra curtir filho lindo e esposa maravilhosa. #SrNimbusRocks

Estou lendo um livro do Joe Celko chamado “Thinking in Sets” (pensando em sets) e eu gostaria de falar um pouco sobre isso.

Uma das dificuldades mais comuns para desenvolvedores que querem escrever códigos SQL que tenham boa performance, é abandonar o pensamento de linguagens procedurais (onde você diz tudo o que quer fazer) e começar a pensar em códigos declarativos (onde você apenas diz o que quer).

Desde pequenos (no meu caso com 16 anos) aprendemos que em programação devemos fazer tudo passo a passo. Quem lembra de quando seu professor de lógica de programação (se é que existe lógica nessa bagaça) disse: – “Boa noite turma, hoje vamos escrever nosso primeiro código!” e ele continuou dizendo: “- Quero que você pegue uma folha e escreva todos os passos necessários para trocar um pneu, ou fritar um ovo (no meu caso foi a do fritar o ovo)”. Eu tive essa aulinha no curso técnico de processamento de dados, lembro que escrevi algo parecido com:

1. Pegar o ovo

2. Abrir o ovo

3. Colocar na frigideira

4. Fritar o ovo

5. Pegar o ovo da frigideira

6. Colocar no prato

Escrevemos estes passos e achamos que estamos abafando… Dai o professor pega o papel e diz… ué, mas vai pegar o ovo da onde? Tá na geladeira? O ovo tá onde? Dai você diz… aaa … é verdade, vou corrigir me da ai… dai você adiciona:

1. Pegar o ovo da geladeira

2. …

Dai o professor pega a folha e diz… ué, na sua casa você deixa a geladeira aberta?… Dai você diz… caramba (já começando a ficar irritado) é verdade.

1. Abrir a geladeira

2. Pegar o ovo da geladeira

3. …

Dai o professor pega a folha e diz… ué, e se não tiver mais ovo na geladeira? E se a geladeira estiver quebrada e o ovo estragado, e se a geladeira tiver um cadeado? E se você estiver com a mão ocupada com alguma coisa? Como vai pegar o ovo? … Dai você diz… Professor, na boa, vai a merda! Smile with tongue out E aprende a lição! Tem que prever TUDO, e dizer passo a passo o que deve ser feito.

É assim que aprendemos a programar, linha a linha, passo a passo! Porém, quando estamos falando de banco de dados, precisamos pensar que vamos trabalhar com um set, ou seja, um conjunto de linhas (melhor dizendo, um conjunto de elementos). É de responsabilidade do banco de dados decidir qual será a melhor maneira para ler os dados. Ainda que eles serão lidos linha a linha, quem decide a melhor maneira de fazer isso é o banco, não você. Por exemplo, o SQL Server pode optar por fazer uma soma, utilizando um algoritmo de hash, ou um join utilizando um merge e etc…

Lembre-se de que cada instrução (comando SQL) enviada para o banco de dados passa por uma série de validações (parse, binding, optimize…) e isso tem um custo. Por isso cursores e loops são tão ruims em relação a performance. Uma frase sensacional do Celko sobre cursores é a seguinte:

“A melhor técnica que você pode utilizar para melhorar a performance de um cursor é não usar cursor.”

Sarcastic smile Sensacional.

Quando você vê uma tabela chamada População você acha que nela existem populações, mas na verdade existem pessoas. Uma tabela de Floresta não contem florestas contem árvores… Temos que pensar em um todo, não no individuo. Ao invés de criar uma tabela chamada Abelhas para armazenar dados sobre abelhas, crie uma tabela chamada Colmeia! (é sério esse foi o único coletivo que eu conhecia quando estava escrevendo este artigo kkk Smile with tongue out )

Quer exemplos de como nós programadores pensamos em código procedural e não em sets? Vejamos…

Se eu disser, nesta mesa eu tenho 8 caixas de ovos (de galinha e codorna) fechadas e de tamanhos variados, quero que você olhe cada caixa e me entregue todas as caixas que contêm a mesma quantidade de ovos.

O que pensamos em fazer?

· Contar quantos ovos tem em cada caixa, separar as caixas que tem a mesma quantidade e me entregar.

O que seria mais eficiente?

· Olhar a quantidade exibida na embalagem, separar as caixas que tem a mesma quantidade e me entregar.

Reparou na diferença? … Uma solução conta todos os ovos, e a outra usa uma agregação… Uma solução vê os ovos e outra vê as caixas (um todo).

Vejamos outro exemplo que usa o caso clássico das tabelas de Pedidos e Itens de Pedidos.

Se eu disser, quero uma consulta que retorne todos os pedidos em que a quantidade de itens comprados é igual para todos os itens.

Uma alternativa seria escrever uma consulta que varre a tabela de “Itens de Pedidos” e executa uma subquery para verificar se existe algum item de pedido diferente da quantidade do item lido… Algo mais ou menos assim:

select a.CodigoPedido from itens_pedidos a

where not exists (select * from itens_pedidos b

where a.CodigoPedido = b.CodigoPedido

and a.quantidade <> b.quantidade)

Ou seja, se existir algum pedido com quantidade diferente, ele será desconsiderado da consulta. Eu poderia escrever um cursor para responder a consulta, mas não vou fazer isso Smile .

Outra forma mais interessante seria o seguinte:

select CodigoPedido from itens_pedidos

group by CodigoPedido

having min(quantidade) = max(quantidade)

Repararam na diferença?… Eu sei que é mais difícil pensar assim, encontrar soluções deste tipo não é fácil, mas acreditem, é possível.

Estudem e entendam as “window functions” no SQL Server, entendam como usar funções de agregação e evitem cursores, sempre.

Outra coisa interessante que sempre falo, é em relação a formatação de dados via SQL e ordenação.

Não faça formatação no SQL, please, deixe para formatar alguma coisa, na aplicação, banco de dados sofre para incluir uma “mascara” no CNPJ, faça isso na aplicação e não no banco.

Para ordenação eu digo o mesmo. Ordenação é na aplicação e não no banco! Você sabia que a clausula ORDER BY não faz parte do SELECT ? Pois é, no padrão ANSI/ISO da linguagem SQL (structured query language) não existe order by no select, no ISO o order by faz parte da sintaxe de cursores. Os fabricantes de bancos de dados criam uma extensão dessa opção para que você a utilize nos selects. Fica a dica, quase sempre podemos ordenar do lado da aplicação com pouquíssimo trabalho.

Fecho o artigo com um ditado Turco bem interessante:

“Não importa o quão longe você foi por uma estrada errada, volte!”

Abraços e bom código!

Categorias:SQL Server - Performance, T-SQL, Virtual PASS BR

Hypothetical indexes, making it easy to use…

31 de maio de 2012 Fabiano Amorim Deixe um comentário

Hi there, yes, I know, it’s being a while since I wrote something here… So, sorry about that.

Yesterday the guy I’m a big fan (if you already join one of my SQL trainings you know that Smile ) Query Optimizer Guru Paul White (blog|twitter) answered a question on twitter (#sqlhelp hash tag) and he mentioned a post I wrote some time ago about hypothetical indexes on SQL Server. That is a very nice feature but unfortunately is not pretty to use because it requires you to use DBCC AUTOPILOT and set AUTOPILOT to ON…

The parameters you have to use are not straightforward to find and may discourage you to use it… I’ve created a procedure to make it a little easier to use.

Originally I created this procedure after a student question about how to make it easier to use hypothetical indexes on SQL Server. So I thought you may like it.

Unfortunately it relies on a CLR stored procedure to SET the AUTOPILOT, but if you don’t mind to use it in a develop environment (which is something normal to do) then you can use it, following is the CLR code, and if you are interested you can download the project code here:

-- CLR Proc
/*
using System;
using System.Data;
using System.Data.SqlClient;
using System.Data.SqlTypes;
using Microsoft.SqlServer.Server;

public partial class StoredProcedures
{
    [Microsoft.SqlServer.Server.SqlProcedure]
    public static void CLR_GetAutoPilotShowPlan
    (
         SqlString SQL,
         out SqlXml PlanXML
    )
    {
        //Prep connection
        SqlConnection cn = new SqlConnection("Context Connection = True");

        //Set command texts
        SqlCommand cmd_SetAutoPilotOn = new SqlCommand("SET AUTOPILOT ON", cn);
        SqlCommand cmd_SetAutoPilotOff = new SqlCommand("SET AUTOPILOT OFF", cn);
        SqlCommand cmd_input = new SqlCommand(SQL.ToString(), cn);

        if (cn.State != ConnectionState.Open)
        {
            cn.Open();
        }

        //Run AutoPilot On
        cmd_SetAutoPilotOn.ExecuteNonQuery();

        //Run input SQL
        SqlDataAdapter da = new SqlDataAdapter();
        DataSet ds = new DataSet();

        da.SelectCommand = cmd_input;
        ds.Tables.Add(new DataTable("Results"));

        ds.Tables[0].BeginLoadData();
        da.Fill(ds, "Results");
        ds.Tables[0].EndLoadData();

        //Run AutoPilot Off
        cmd_SetAutoPilotOff.ExecuteNonQuery();

        if (cn.State != ConnectionState.Closed)
        {
            cn.Close();
        }

        //Package XML as output
        System.Xml.XmlDocument xmlDoc = new System.Xml.XmlDocument();
        //XML is in 1st Col of 1st Row of 1st Table
        xmlDoc.InnerXml = ds.Tables[0].Rows[0][0].ToString();
        System.Xml.XmlNodeReader xnr = new System.Xml.XmlNodeReader(xmlDoc);
        PlanXML = new SqlXml(xnr);
    }
};
*/

Following is the code to compile it on SQL Server and to create another procedure to simulate the hypothetical indexes:

-- Publishing Assembly
IF EXISTS(SELECT * FROM sys.assemblies WHERE name = 'CLR_ProjectAutoPilot')
BEGIN
  IF OBJECT_ID('st_CLR_GetAutoPilotShowPlan') IS NOT NULL
    DROP PROC st_CLR_GetAutoPilotShowPlan

  DROP ASSEMBLY CLR_ProjectAutoPilot
END
GO
CREATE ASSEMBLY CLR_ProjectAutoPilot FROM 'C:\ProjectAutoPilot\ProjectAutoPilot\bin\Release\ProjectAutoPilot.dll' WITH PERMISSION_SET = SAFE
GO

CREATE PROCEDURE st_CLR_GetAutoPilotShowPlan (@Query NVarChar(MAX), @ShowPlan XML OUTPUT)
AS
  EXTERNAL NAME CLR_ProjectAutoPilot.StoredProcedures.CLR_GetAutoPilotShowPlan
GO

IF OBJECT_ID('st_TestHipotheticalIndexes', 'p') IS NOT NULL
  DROP PROC dbo.st_TestHipotheticalIndexes
GO
CREATE PROCEDURE dbo.st_TestHipotheticalIndexes (@SQLIndex NVarChar(MAX), @Query NVarChar(MAX))
AS
BEGIN
  SET NOCOUNT ON;
  BEGIN TRY
    BEGIN TRAN
    DECLARE @CreateIndexCommand NVarChar(MAX),
            @IndexName NVarChar(MAX),
            @TableName NVarChar(MAX),
            @SQLIndexTMP NVarChar(MAX),
            @SQLDropIndex NVarChar(MAX),
            @SQLDbccAutoPilot NVarChar(MAX),
            @i Int,
            @QuantityIndex Int,
            @Xml XML

    IF SubString(@SQLIndex, LEN(@SQLIndex), 1) <> ';'
    BEGIN
      RAISERROR ('Last caracter in the index should be ;', -- Message text.
                 16, -- Severity.
                 1 -- State.
                 );
    END

    SET @SQLDropIndex = '';
    SET @QuantityIndex = LEN(@SQLIndex) - LEN(REPLACE(@SQLIndex, ';', ''))
    SELECT @SQLIndexTMP = SUBSTRING(@SQLIndex, 0, CharIndex(';', @SQLIndex))

    SET @i = 0
    WHILE @i < @QuantityIndex
    BEGIN
      SET @SQLIndexTMP = SUBSTRING(@SQLIndex, 0, CharIndex(';', @SQLIndex))
      SET @CreateIndexCommand = SUBSTRING(@SQLIndexTMP, 0, CharIndex(' ON ',@SQLIndexTMP))
      SET @IndexName = REVERSE(SubString(REVERSE(@CreateIndexCommand), 0, CharIndex(' ', REVERSE(@CreateIndexCommand))))
      SET @TableName = SUBSTRING(REPLACE(@SQLIndexTMP, @CreateIndexCommand + ' ON ', ''), 0, CharIndex(' ', REPLACE(@SQLIndexTMP, @CreateIndexCommand + ' ON ', '')))
      IF ISNULL(@TableName,'') = ''
        SET @TableName = SUBSTRING(REPLACE(@SQLIndexTMP, @CreateIndexCommand + ' ON ', ''), 0, CharIndex('(', REPLACE(@SQLIndexTMP, @CreateIndexCommand + ' ON ', '')))
      SET @SQLIndex = REPLACE(@SQLIndex, @SQLIndexTMP + ';', '')
      --SELECT @SQLIndex, @SQLIndexTMP, @CreateIndexCommand, @TableName, @IndexName

      -- Creating hypotetical index
      IF CharIndex('WITH STATISTICS_ONLY =', @SQLIndexTMP) = 0
      BEGIN
        SET @SQLIndexTMP = @SQLIndexTMP + ' WITH STATISTICS_ONLY = -1'
      END
      -- PRINT @SQLIndexTMP
      EXEC (@SQLIndexTMP)

      -- Creating query to drop the hypotetical index
      SELECT @SQLDropIndex = @SQLDropIndex + 'DROP INDEX ' + @TableName + '.' + @IndexName + '; '
      -- PRINT @SQLDropIndex

      -- Executing DBCC AUTOPILOT
      SET @SQLDbccAutoPilot = 'DBCC AUTOPILOT (0, ' + 
                                               CONVERT(VarChar, DB_ID()) + ', '+ 
                                               CONVERT(VarChar, OBJECT_ID(@TableName),0) + ', ' +
                                               CONVERT(VarChar, INDEXPROPERTY(OBJECT_ID(@TableName), @IndexName, 'IndexID')) + ')'

      EXEC (@SQLDbccAutoPilot)
      --PRINT @SQLDbccAutoPilot

      SET @i = @i + 1
    END

    -- Executing Query
    DECLARE @PlanXML xml

    EXEC st_CLR_GetAutoPilotShowPlan @Query = @Query, 
                                     @ShowPlan = @PlanXML OUT
    SELECT @PlanXML

    -- Droping the indexes
    EXEC (@SQLDropIndex)

    COMMIT TRAN
  END TRY
  BEGIN CATCH
    ROLLBACK TRAN
    -- Execute error retrieval routine.
    SELECT ERROR_NUMBER()    AS ErrorNumber,
           ERROR_SEVERITY()  AS ErrorSeverity,
           ERROR_STATE()     AS ErrorState,
           ERROR_PROCEDURE() AS ErrorProcedure,
           ERROR_LINE()      AS ErrorLine,
           ERROR_MESSAGE()   AS ErrorMessage;
  END CATCH;
END
GO

The proc st_TestHipotheticalIndexes expect two input parameters:

@SQLIndex: Here you should specify the command to create the index you and to try (the hypothetical indexes), if you want to try more than one index, just call it separating many “create index” commands by coma. For instance:

@SQLIndex = 'CREATE INDEX ix_12 ON Products (Unitprice, CategoryID, SupplierID) INCLUDE(ProductName);CREATE INDEX ix_Quantity ON Order_Details (Quantity);',

@Query: Here you should write the query you want to try.

Here is a sample of how to call it on :

-- Sample 1
EXEC dbo.st_TestHipotheticalIndexes @SQLIndex = 'CREATE INDEX ix ON Order_Details(Quantity);', 
@Query = 'SELECT * FROM Order_Details WHERE Quantity < 1'

The results of the query above is an XML with the query plan considering the suggested index:

Another sample:

— Sample 2

-- Sample 2
EXEC dbo.st_TestHipotheticalIndexes @SQLIndex = 'CREATE INDEX ix_12 ON Products (Unitprice, CategoryID, SupplierID) INCLUDE(ProductName);CREATE INDEX ix_Quantity ON Order_Details (Quantity);', 
                                    @Query = 'SELECT p.ProductName, p.UnitPrice, s.CompanyName, s.Country, od.quantity FROM Products as P INNER JOIN Suppliers as S ON P.SupplierID = S.SupplierID INNER JOIN order_details as od ON p.productID = od.productid WHERE P.CategoryID in (1,2,3) AND P.Unitprice < 20 AND S.Country = ''uk'' AND od.Quantity < 90'

Yep, now it is easier… Let me know what do you think and please don’t mind on the crappy code in the proc to get the tablename, indexname…

Have fun…

Categorias:CLR, hypothetical indexes, SQL Server - Performance, T-SQL, Virtual PASS BR

O que é melhor? Um Index Seek ou Clustered Index Scan?

9 de setembro de 2008 Fabiano Amorim 8 comentários

O que você acha, Um Index Seek é melhor ou pior que um Index Scan?

A reposta é depende, existem casos onde com certeza fazer um Index Scan é a melhor opção. Vamos a um exemplo que criei.

— Script para criação da base de teste.

USE master

IF DB_ID(‘INSIDE’) IS NULL

CREATE DATABASE INSIDE

USE INSIDE

ALTER DATABASE INSIDE SET AUTO_UPDATE_STATISTICS ON

IF OBJECT_ID(‘TabTeste’) IS NOT NULL

DROP TABLE TabTeste

CREATE TABLE TabTeste (ID INT IDENTITY(1,1) PRIMARY KEY,

Nome VarChar(200),

Nome2 VarChar(250) DEFAULT NEWID())

Abaixo vamos alimentar a tabela TabTeste que criamos com o código acima, irei incluir 10000 mil registros com o valor A e apenas 10 com o valor B.

SET NOCOUNT ON

DECLARE @i Int

SET @i = 0

— Vamos inserir 10000 registros com o valor A

WHILE @i < 10000

BEGIN

INSERT INTO TabTeste (nome) VALUES(‘A’)

SET @i = @i + 1;

END

SET @i = 0;

— Agora vamos inserir apenas 10 registros com o valor B

WHILE @i < 10

BEGIN

INSERT INTO TabTeste (nome) VALUES(‘B’)

SET @i = @i + 1;

END

Ao efetuar um select na tabela TabTeste o SQL só tem uma opção de acesso ao seus dados

fazer um Clustered Index Scan, ou seja, ler toda a sua tabela e verificar quais as linhas

onde o nome é igual a ‘A’ e então retornar somente estas linhas.

SELECT * FROM TabTeste

WHERE Nome = ‘A’

Mas e se tivermos um indice na coluna Nome?

Neste caso o SQL terá 2 opções de acesso aos dados da tabela.

1º – Optar por ler os dados dados utilizando o indice gerando assim um Index Seek mais um

bookmark lookup já que estou querendo todas as colunas da tabela(*).

2º – Fazer o Clustered Index Scan.

— Vamos criar o indice e ver como ele se comporta.

CREATE NONCLUSTERED INDEX ix_Nome ON TabTeste(Nome)

Um mesmo assim ele não usou o indice? Ok isso porque não vale a pena fazer o bookmark

para saber porque ele optou em não usar o indice leia o artigo "Indice / Lookup / Recompile"

http://fabianosqlserver.spaces.live.com/Blog/cns!52EFF7477E74CAA6!230.entry

Na consulta abaixo o SQL verificar quantas páginas serão necessárias

SELECT * FROM TabTeste

WHERE Nome = ‘A’

Se eu fizer um select passando o valor ‘B’ o SQL irá validar quantas linhas meu select

irá retornar e verificar se vale a pena fazer o bookmark ou clustered scan para

retornar os dados da minha coluna Nome2.

SELECT * FROM TabTeste

WHERE Nome = ‘B’

Agora ele fez um Index Seek

Vamos entender o que aconteceu aqui:

O SQL foi nas estatisticas e verificou que seriam retornadas aproximadamente 10 linhas

na consulta portanto valia a pena fazer o bookmark para o indice cluster.

DBCC SHOW_STATISTICS (TabTeste, ix_Nome)

Mas e se as estatisticas estiverem desatualizadas o que vai acontecer?

Pois é, dai o SQL Server irá fazer pensar que vale a pena fazer um bookmark

pois serão retornados poucos dados mas isso não vai acontecer porque irei incluir

mais dados na tabela com o valor ‘B’. Vamos aos testes.

— Vamos desabilitar o AUTO_UPDATE_STATISTICS para fazer as estatisticas

— ficarem desatualizadas

ALTER DATABASE INSIDE SET AUTO_UPDATE_STATISTICS OFF

— Vamos inserir mais 1000 mil registros com o valor B

DECLARE @i Int

SET @i = 0

WHILE @i < 100

BEGIN

INSERT INTO TabTeste (nome) VALUES(‘B’)

SET @i = @i + 1;

END

O que acontece abaixo é que o SQL continua achando que o valor ‘B’ irá retornar apenas

10 linhas, vamos rodar o DBCC SHOW_STATISTICS para confirmarmos.

DBCC SHOW_STATISTICS (TabTeste, ix_Nome)

Nas consultas abaixo fiz um select igual ao anterior, e outro select forcando o uso

do clustered index scan repare que o número de IOs necessários para o select com o

Index Seek é BEM maior que o Clustered Scan.

SET STATISTICS IO ON

SELECT * FROM TabTeste

WHERE Nome = ‘B’

— Table ‘TabTeste’. Scan count 1, logical reads 222, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

SELECT * FROM TabTeste WITH(INDEX=0)

WHERE Nome = ‘B’

–Table ‘TabTeste’. Scan count 1, logical reads 73, physical reads 0, read-ahead reads 16, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

SET STATISTICS IO OFF

Podemos terminar com 2 conclusões.

1º Nem sempre um Index Seek será melhor que um Index Scan.

2º Atualize as estatisticas de suas tabelas.

Categorias:SQL Server - Performance

10 pontos que devem ser observados quanto a performance de uma consulta Parte – 4

8 de agosto de 2008 Fabiano Amorim 3 comentários

6. Substituir o uso de CURSOR pelo comando WHILE + tabelas temporárias ou Variáveis do tipo table.

DECLARE @VendorID Int,

@Name VarChar(80)

DECLARE Cur_Vendor CURSOR FOR

SELECT VendorID, Name

FROM Purchasing.Vendor

OPEN Cur_Vendor

FETCH NEXT FROM Cur_Vendor

INTO @VendorID, @Name

WHILE @@FETCH_STATUS = 0

BEGIN

PRINT @Name

FETCH NEXT FROM Cur_Vendor

INTO @VendorID, @Name

END

CLOSE Cur_Vendor

DEALLOCATE Cur_Vendor

DECLARE @ROWID Int,

@Name VarChar(80)

SET @ROWID = 0;

SELECT TOP 1

@ROWID = VendorID,

@Name = Name

FROM Purchasing.Vendor

WHERE VendorID > @ROWID

ORDER BY VendorID

WHILE @@ROWCOUNT > 0

BEGIN

PRINT @Name

SELECT TOP 1

@ROWID = VendorID,

@Name = Name

FROM Purchasing.Vendor

WHERE VendorID > @ROWID

ORDER BY VendorID

END

7. Verificar se as variáveis no WHERE são do mesmo DataType que a coluna da tabela.

DECLARE @TMP TABLE(Nome VarChar(80) PRIMARY KEY)

DECLARE @Nome NVarChar(80)

SET @Nome = ‘Teste’

— Gera FULL SCAN

SELECT * FROM @TMP

WHERE Nome = @Nome

DECLARE @TMP TABLE(Nome VarChar(80) PRIMARY KEY)

DECLARE @Nome VarChar(80)

SET @Nome = ‘Teste’

— Gera SEEK

SELECT * FROM @TMP

WHERE Nome = @Nome

8. Verificar se existe uso de variáveis do tipo Table para grande volume de dados, pois isso pode causar problema de performance já que variáveis do tipo table não usam proveito de paralelismo e não criam estatísticas com os dados da tabela.

9. Verificar se é possível usar o conceito de Hash Index usando o CheckSum para gerar o número HASH, Caso existam colunas com valores muito grandes as vezes compensa usar o CheckSum para gerar o Hash e depois indexar a coluna hash.

— Create a checksum index.

SET ARITHABORT ON;

USE AdventureWorks;

ALTER TABLE Production.Product

ADD cs_Pname AS CHECKSUM(Name);

CREATE INDEX Pname_index ON Production.Product (cs_Pname);

/*Use the index in a SELECT query. Add a second search

condition to catch stray cases where checksums match,

but the values are not the same.*/

SELECT *

FROM Production.Product

WHERE CHECKSUM(N’Bearing Ball’) = cs_Pname

AND Name = N’Bearing Ball’;

10. Evite usar a clausula IN.

IF OBJECT_ID(‘tempdb.dbo.#TMP’) IS NOT NULL

BEGIN

DROP TABLE #TMP

END

CREATE TABLE #TMP (ID Int IDENTITY(1,1) PRIMARY KEY)

INSERT INTO #TMP DEFAULT VALUES

SET STATISTICS PROFILE ON

SET STATISTICS IO ON

SELECT * FROM #TMP

WHERE ID IN (1,2,3,4,5)

Coluna argument

OBJECT:([tempdb].[dbo].[#TMP]),

SEEK:(

[tempdb].[dbo].[#TMP].[ID]=(1) OR

[tempdb].[dbo].[#TMP].[ID]=(2) OR

[tempdb].[dbo].[#TMP].[ID]=(3) OR

[tempdb].[dbo].[#TMP].[ID]=(4) OR

[tempdb].[dbo].[#TMP].[ID]=(5)

)

ORDERED FORWARD

Repare no argument que o SQL gerou, ou seja irá acessar uma vez a tabela #TMP para cada opção do IN

podemos confirmar isso no Scan Count do statistics io

— IO

Scan count 5, logical reads 10, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

SELECT * FROM #TMP

WHERE ID BETWEEN 1 AND 5

OBJECT:([tempdb].[dbo].[#TMP]),

SEEK:(

[tempdb].[dbo].[#TMP].[ID] >= (1) AND

[tempdb].[dbo].[#TMP].[ID] <= (5)

)

ORDERED FORWARD

Scan count 1, logical reads 2, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

Repare na diferença de IO.

Espero que tenham gostado, eu adorei J, gostei tanto que vou começar a escrever uma série de artigos sobre o Query Optimizer, fiquem de olho…

Categorias:SQL Server - Performance

10 pontos que devem ser observados quanto a performance de uma consulta Parte 3

8 de agosto de 2008 Fabiano Amorim Deixe um comentário

Seguindo a série de boas práticas em relação a performance…

4. É muito comum durante o desenvolvimento de um código SQL necessitarmos zerar o valor das variáveis que serão utilizadas no código.

Uma dica em relação a performance é que o comando SELECT é mais rápido do que o SET, porém está regra só se aplica quando podemos substituir um bloco de SET por um SELECT por ex:

— Executa um loop zerando o valor de 10 variáveis utilizando SET

— Gere o plano de execução e repare que no plano de execução que no Loop o SQL gera um SELECT para cada comando SET.

DECLARE @i Int, @Test1 int, @Start datetime

DECLARE @V1 Char(6),

@V2 Char(6),

@V3 Char(6),

@V4 Char(6),

@V5 Char(6),

@V6 Char(6),

@V7 Char(6),

@V8 Char(6),

@V9 Char(6),

@V10 Char(6);

SET @Test1 = 0

SET @i = 0

SET @Start = GetDate()

WHILE @i < 50000

BEGIN

SET @V1 = ”

SET @V2 = ”

SET @V3 = ”

SET @V4 = ”

SET @V5 = ”

SET @V6 = ”

SET @V7 = ”

SET @V8 = ”

SET @V9 = ”

SET @V10 = ”

SET @i = @i + 1

END

SET @Test1 = DATEDIFF(ms, @Start, GetDate())

SELECT @test1

— Executa um loop zerando o valor de 10 variáveis utilizando SELECT

— Diferente do primeiro plano de execução o SQL gerou apenas 1 instrução para setar os valores para as 10 variáveis.

DECLARE @i Int, @Test1 int, @Start datetime

DECLARE @V1 Char(6),

@V2 Char(6),

@V3 Char(6),

@V4 Char(6),

@V5 Char(6),

@V6 Char(6),

@V7 Char(6),

@V8 Char(6),

@V9 Char(6),

@V10 Char(6);

SET @Test1 = 0

SET @i = 0

SET @Start = GetDate()

WHILE @i < 50000

BEGIN

SELECT @V1 = ”,

@V2 = ”,

@V3 = ”,

@V4 = ”,

@V5 = ”,

@V6 = ”,

@V7 = ”,

@V8 = ”,

@V9 = ”,

@V10 = ”,

@i = @i + 1;

END

SET @Test1 = DATEDIFF(ms, @Start, GetDate())

SELECT @test1

5. Pequenas dicas para procedures..

a. Sempre que uma procedure é executada o server envia para o client o número de linhas afetadas pela procedure, normalmente esta informação não é necessária. Desabilitando este comportamento poderemos reduzir o trafego gerado pelo Server e o Client. Portanto sempre que possível inclua o SET NOCOUNT ON no início de suas procedures. Pode ser que isso não gere muita diferença em uma proc que efetua 1 insert mas quando estamos falando de um loop que efetua 1000000 de inserts daí com certeza vai ser um grade ganho de trafego desnecessário que estaria rolando na rede.

b. Só use a opção WITH ENCRYPTION e WITH RECOMPILE caso seja realmente necessário. Lembre-se de que existem programas que conseguem descriptogravar um proc que está criptografada no banco.

c. Não inicie o nome de suas procedure com sp… este prefixo é reservado para procedures do sistema, sempre que você executa uma procedure que inicia com sp… o SQL irá procurar a proc no banco Master e se ela não estiver lá então ele irá resolver o nome da proc no banco atual. Evite este passo adicional simplesmente renomeando as procedures para por exemplo usp ou st.

d. Caso tenha que rodar algum código TSQL no meio da proc evite utilizar o EXEC ao invés disso use a sp_ExecuteSQL pois ao contrário do EXEC a sp_ExecuteSQL irá compilar o SQL para gerar um plano de execução para sua consulta, o quer dizer que caso o plano já tenha sido gerado na próxima execução do código ele irá utilizar o plano que ficou em cachê, evitando a recompilação do código a cada execução.

Categorias:SQL Server - Performance

10 pontos que devem ser observados quanto a performance de uma consulta Parte 2

27 de junho de 2008 Fabiano Amorim 3 comentários

3. Sempre que possível substituir condições com OR por UNION ALL, por ex:

SET NOCOUNT ON

IF OBJECT_ID(‘Teste ‘) IS NOT NULL

DROP TABLE Teste

CREATE TABLE Teste (ID Int Identity(1,1),

CPF Char(11),

Nome VarChar(200),

Sobrenome VarChar(200),

Endereco VarChar(200),

Bairro VarChar(200),

Cidade VarChar(200))

— Inclui 1000 mil de linhas na tabela

INSERT INTO Teste(CPF, Nome, SobreNome, Endereco, Bairro, Cidade)

VALUES(‘11111111111’, NEWID(), ‘Neves Amorim’, NEWID(), NEWID(), NEWID())

GO 1000

CREATE CLUSTERED INDEX ix_ID ON Teste(ID)

CREATE INDEX ix_Nome ON Teste(Nome)

Seleciona todos os registros onde ID = 10 ou então o Nome inicia com 38.

Esta consulta irá gerar um Scan na tabela pois o OR impede que o SQL use

o ix_ID ou o ix_Nome.

SELECT *

FROM Teste

WHERE ID = 10

OR Nome Like ‘38%’

A instrução acima deve ser trocada por a consulta abaixo que utiliza o UNION ALL

SELECT Tab.*

FROM (SELECT *

FROM Teste

WHERE ID = 10

UNION ALL

SELECT *

FROM Teste

WHERE Nome Like ‘38%’) AS Tab

Obs.: Sempre que possível utilize “UNION ALL” ao invés de “UNION” pois o “UNION” gera um distinct que geralmente gera um order by o que irá gerar um custo desnecessário comparado a concatenação do “UNION ALL”.

Continua…

Categorias:SQL Server - Performance

10 pontos que devem ser observados quanto a performance de uma consulta Parte 1

27 de junho de 2008 Fabiano Amorim 2 comentários

Performance de querys é sem dúvida uma das maiores causadoras de dor de cabeça em DBAs e afins(J), se vocês já leram algum post neste blog devem ter percebido que gosto muito deste assunto, trato diariamente com problemas deste tipo e tem alguns pontos que acho importantes de serem analisados quando falamos em análise de consultas, vou tentar explicar melhor abaixo.

Primeiro vou falar um pouco da empresa onde trabalho a, CNP-M, graças a Deus somos uma empresa certificada MPS.BR pois os processos que foram implantados nos ajudam a diminuir e MUITO possíveis problemas de performance que teríamos e que não deixamos chegar nos clientes pois param no processo de validação. Os pontos que vou mencionar abaixo servem como base para procurar possíveis problemas de performance, bom chega de conversa mole e vamos para a melhor parte(você já sabe, TSQL).

Todas as consultas abaixo foram executadas no banco AdventureWorks / SQL Server 2005.

1. Sempre verificar o plano de execução de cada select existente no código SQL, e analisar o uso ou não uso dos índices de cada tabela pertencente a query.

2. Verificar o uso de Functions. Caso exista alguma function envolvida no SQL analise bem a consulta e verifique se é possível alterar a consulta para fazer um join com a própria tabela ou então até mesmo tabelas temporárias, vamos ver alguns exemplos para ficar mais fácil de entender o que estou querendo dizer.

IF OBJECT_ID(‘VendaPorCliente’) IS NOT NULL

DROP FUNCTION dbo.VendaPorCliente

CREATE FUNCTION dbo.VendaPorCliente(@CustomerID Int)

RETURNS Decimal(18,2)

BEGIN

DECLARE @Total Decimal(18,2)

SELECT @Total = SUM(OrderQty * UnitPrice)

FROM AdventureWorks.Sales.SalesOrderHeader a

INNER JOIN AdventureWorks.Sales.SalesOrderDetail b

ON a.SalesOrderID = b.SalesOrderID

WHERE a.CustomerID = @CustomerID

RETURN @Total

END

Seleciona o total de venda por Customer

Aqui temos um problema, pois para cada linha na tabela Customer o SQL Server irá

executar a Function VendaPorCliente, ou seja se minha tabela Customer tiver

50000 linhas o SQL irá acessar as tabelas de header e Detail 50000 vezes.

SELECT AccountNumber, dbo.VendaPorCliente(CustomerID) as Total

FROM AdventureWorks.Sales.Customer

Para resolver o problema da consuta acima poderiamos fazer o seguinte

Criar uma nova function do tipo "multi-statement table-valued"

IF OBJECT_ID(‘VendaTotalClientes’) IS NOT NULL

DROP FUNCTION dbo.VendaTotalClientes

CREATE FUNCTION dbo.VendaTotalClientes()

RETURNS @tb_result TABLE

(

CustomerID Int,

Total Decimal(18,2),

PRIMARY KEY(CustomerID)

)

BEGIN

INSERT INTO @tb_result

SELECT a.CustomerID, SUM(OrderQty * UnitPrice) Total

FROM AdventureWorks.Sales.SalesOrderHeader a

INNER JOIN AdventureWorks.Sales.SalesOrderDetail b

ON a.SalesOrderID = b.SalesOrderID

GROUP BY a.CustomerID

RETURN

END

Seleciona o total de venda por Customer

Desta vez ao invés de acessar a function para cada linha da tabela Customer

o SQL Server irá ler os dados das tabelas Header e Detail apenas 1 vez pois a function

irá retornar todos os dados em uma tabela.

SELECT AccountNumber, b.Total

FROM AdventureWorks.Sales.Customer a

INNER JOIN dbo.VendaTotalClientes() b

ON a.CustomerID = b.CustomerID

Agora chegamos onde eu queria!, imagine que eu queria retornar o total de venda apenas do

Customer ‘AW00000001’, eu iriá escrever o seguinte select.

O que acontece abaixo é que o SQL irá primeiro retornar todos os dados da function, ou seja,

todas as vendas por customer e depois aplicar o filtro de AccountNumber = ‘AW00000001’

SELECT AccountNumber, b.Total

FROM AdventureWorks.Sales.Customer a

INNER JOIN dbo.VendaTotalClientes() b

ON a.CustomerID = b.CustomerID

WHERE a.AccountNumber = ‘AW00000001’

O ideal neste caso seria usar:

SELECT AccountNumber, dbo.VendaPorCliente(CustomerID) as Total

FROM AdventureWorks.Sales.Customer

WHERE AccountNumber = ‘AW00000001’

Ou então simplesmente não utilizar a function e fazer o select direto nas tabelas

SELECT a.AccountNumber, SUM(OrderQty * UnitPrice) AS Total

FROM AdventureWorks.Sales.Customer a

INNER JOIN AdventureWorks.Sales.SalesOrderHeader b

ON a.CustomerID = b.CustomerID

INNER JOIN AdventureWorks.Sales.SalesOrderDetail c

ON b.SalesOrderID = c.SalesOrderID

WHERE a.AccountNumber = ‘AW00000001’

GROUP BY a.AccountNumber

Obs.: Atenção, o comando SET STATISTICS IO ON não leva em consideração as leituras efetuadas nas suas functions, o que certas vezes acaba gerando uma má interpretação do comando, portanto fique ligado nisso.

Continua…

Categorias:SQL Server - Performance

Older Entries