Arquivo
Boas práticas na definição de Primary Keys
Depois de ler um post no fórum do MSDN, resolvi escrever um pouco sobre índice, especialmente sobre o Índice Cluster que na maioria das vezes acaba sendo nossa primary key.
Vou começar com os 3 pontos que sempre são vistos em ppts de WebCasts e apresentações de boas práticas em criação de índices.
Índices cluster devem ser:
· Únicos
o Quando uma tabela possui um índice cluster ele servirá como referência(lookup) para todos os índices non-cluster, isso significa que quando você faz uma consulta que utiliza seu índice non-cluster e ele necessita de alguma informação que não está no próprio índice(colunas informadas na criação do índice) ele irá para o índice cluster ler esta informação, por isso ele grava o valor do seu índice cluster no índice non-cluster para conseguir fazer este lookup. É importante dizer que o SQL Server não obriga que seu índice cluster seja único, porém caso ele não seja único o SQL irá “unificar” sua chave incluindo uma informação integer de 4 bytes afim de que ele se torne único. Portanto se o SQL tiver que incluir esta informação de 4 bytes alem de consumir recurso para gerar esta informação(para cada insert ou update ele terá que verificar se esta informação já existe para saber se ele tem que incluir os 4 bytes ou não) complementar ao seu índice, ele irá ocupar mais espaço por conta dos 4 bytes para cada linha duplicada. Seus updates e inserts irão sofrer as conseqüências de uma má escolha do índice cluster.
· Pequenos
o Sabendo que a chave do índice cluster é salvo em todos índices non-cluster significa que quanto menor ele for menos espaço você irá utilizar para guardar esta informação no índice non-clustered. Por exemplo imagine que você possui uma tabela com uma chave primária com as colunas ID, Ano, Mes, Dia e possúi vários índices non-cluster em outras colunas, o SQL irá gravar os dados de ID, Ano, Mês, Dia em cada índice non-clustered de sua tabela. Então se ele for muito grande você terá uma grande perda de espaço e custo para seus selects(pois ele terá que ler mais páginas de dados para retornar sua informação), inserts e updates…
o Quanto maior for seu índice cluster mais espaço seus índices non-clusters irão ocupar.
· Estáticos
o Deve ser estático porque se você alterar seu valor ele terá que alem de alterar o valor na tabela alterar todos os índices non-clustered lembra que ele também fica gravado nos índices non-clustered?. Outra coisa importante é que como o índice está ordenado pela chave caso o valor mude ele irá causar fragmentação na sua tabela.
Bom com base nestas informações eu tento sempre utilizar o seguinte padrão, colunas Identity para minha chave primária, elas definitivamente são Unicas, Pequenas(Integer = 4 bytes), e estáticas. Algumas vezes o máximo que tenho que fazer é mudar meu índice cluster para outra coluna que também será um identity por exemplo uma foreign key, e então definir minha chave primária como non-clustered.
Algumas pessoas podem dizer que colunas identity como primary key podem causar hot-spot, um hot-spot acontece quando existe um GRANDE número de inserts no final de uma tabela, isso pode causar Page Level Lock porque existem vários usuários tentando acessar a mesma página(final da tabela) para inserir seus dados. Sinceramente eu nunca vi isso acontecer e imagino que você vai ter que efetuar MUITOS inserts ao mesmo tempo para ver isso acontecer, portanto esse contra muitas vezes pode ser ignorado visto os benefícios do identity.
Como sempre, gosto de ver na prática(código) o que escrevo portanto vamos a parte legal da coisa, scripts.
USE Master
— Caso exista um banco chamado Teste, apaga ele.
IF
(SELECT DB_ID(‘Teste’)) IS NOT NULL
BEGIN
USE Master
ALTER DATABASE Teste SET SINGLE_USER WITH ROLLBACK IMMEDIATE
DROP DATABASE Teste
END
GO
— Criar um banco de dados chamado Teste no C:\
IF
(SELECT DB_ID(‘Teste’)) IS NULL
BEGIN
CREATE DATABASE Teste ON PRIMARY
(NAME = N’teste’, FILENAME = N’C:\teste.mdf’ , SIZE = 51200KB , FILEGROWTH = 1024KB)
LOG ON
(NAME = N’teste_log’, FILENAME = N’C:\teste_log.ldf’ , SIZE = 51200KB , FILEGROWTH = 10%)
END
GO
USE
Teste
— Cria uma tabela de teste com uma chave composta colunas ID Int, CPF Char(11) Primary Key
CREATE
TABLE Teste (ID Int Identity(1,1),
CPF Char(11),
Nome VarChar(200),
Sobrenome VarChar(200),
Endereco VarChar(200),
Bairro VarChar(200),
Cidade VarChar(200),
Primary Key(ID, CPF, Nome))
— Cria uma tabela de teste com uma coluna ID Identity e Primary Key
CREATE
TABLE TesteIdentity (ID Int Identity(1,1) Primary Key,
CPF Char(11),
Nome VarChar(200),
Sobrenome VarChar(200),
Endereco VarChar(200),
Bairro VarChar(200),
Cidade VarChar(200))
SET
NOCOUNT ON
— Inclui 50000 mil de linhas nas tabelas
INSERT
INTO Teste(CPF, Nome, SobreNome, Endereco, Bairro, Cidade)
VALUES(‘11111111111’, NEWID(), ‘Neves Amorim’, NEWID(), NEWID(), NEWID())
GO
50000
INSERT
INTO TesteIdentity(CPF, Nome, SobreNome, Endereco, Bairro, Cidade)
SELECT
CPF, Nome, SobreNome, Endereco, Bairro, Cidade
FROM Teste
— Vamos criar alguns indices nonclustered para cada tabela
CREATE
NONCLUSTERED INDEX ix_NomeSobrenome ON Teste(Nome, SobreNome)
CREATE
NONCLUSTERED INDEX ix_Sobrenome ON Teste(SobreNome)
CREATE
NONCLUSTERED INDEX ix_Endereco ON Teste(Endereco)
CREATE NONCLUSTERED INDEX ix_NomeSobrenome ON TesteIdentity(Nome, SobreNome)
CREATE
NONCLUSTERED INDEX ix_Sobrenome ON TesteIdentity(SobreNome)
CREATE
NONCLUSTERED INDEX ix_Endereco ON TesteIdentity(Endereco)
— PEQUENO
— Ao comparar o tamanho das tabelas já podemos observar que a tabela Teste
— é maior que a tabela TesteIdentity justamente por causa do index_size.
sp_spaceUsed
Teste
GO
sp_spaceUsed
TesteIdentity
— A tabela teste é maior porque nos indices non-cluster é incluido os dados do indice cluster
— para comprovar isso podemos utilizar o comando abaixo.
— Repare que é exibida a informação das colunas Endereco, ID, CPF e Nome
DBCC
SHOW_STATISTICS(‘Teste’, ix_Endereco)
— ESTÁTICOS
— Agora vamos ver quantas leituras de páginas são necessárias para atualizar
— 2000 linhas das tabelas, Vamos ligar as estatiscitas de IO para ver o resultado
— se você exibir o Plano de execução repare que o update na tabela Teste
— irá atualizar os indices non-cluster da tabela.
SET
STATISTICS IO ON
update
Teste set Nome = ‘Fabio’
where
ID < 2000
/*
Table ‘Teste’. Scan count 1, logical reads 50377, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table ‘Worktable’. Scan count 4, logical reads 12544, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
*/
GO
update TesteIdentity set Nome = ‘Fabio’
where
ID < 2000
/*
Table ‘TesteIdentity’. Scan count 1, logical reads 51, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
*/
SET
STATISTICS IO OFF
/*
Para vizualizar a funcionalidade de incluir mais um valor de 4 bytes nos registros duplicados afim
de torná-los únicos vamos alterar a primary key da tabela teste.
*/
— Pega o nome da primary key
exec
sp_pkeys Teste
— Apaga a primary key para recria-la como não cluster.
ALTER
TABLE Teste DROP CONSTRAINT PK__Teste__3E52440B
— Recria a primary key como não cluster
ALTER
TABLE Teste ADD CONSTRAINT PK__Teste PRIMARY KEY NONCLUSTERED(ID, CPF, Nome)
— Cria um indice cluster com base na coluna CPF
CREATE
CLUSTERED INDEX ix_CPF ON Teste(CPF)
/*
Para vizualizar o valor que o SQL incluiu em cada valor duplicado vamos utilizar o comando
DBCC PAGE
*/
— Pega o endereço físico do Nivel raiz do indice coluna Root da tabela SysIndexes
SELECT
*
FROM SysIndexes
WHERE ID = Object_id(‘Teste’)
AND Name = ‘ix_CPF’
— Resultado 0x300D00000100
— 0x0D30
— Transforma o HexaDecimal em Inteiro
SELECT
CAST(0x0D30 AS INT)
— Pega o ID do banco
SELECT
DB_ID(DB_Name())
DBCC
TRACEON(3604)
GO
DBCC
PAGE(8,1,3376,3)
/* Resultado
FileId |PageId |Row |Level |ChildFileId |ChildPageId |CPF (key) |UNIQUIFIER (key) |KeyHashValue
1 |2738 |0 |2 |1 |2736 |NULL |NULL |(1d0151a9cf2f)
1 |2738 |1 |2 |1 |2737 |11111111111 |11894 |(930152642c7b)
1 |2738 |2 |2 |1 |2739 |11111111111 |23454 |(bd0117b642ad)
1 |2738 |3 |2 |1 |2740 |11111111111 |35014 |(e601bd2493e9)
1 |2738 |4 |2 |1 |2741 |11111111111 |46574 |(0f021bded106)
*/– Podemos ver que foi gerada uma coluna "UNIQUIFIER (key)", Bunito esse nome né? Uniquifier 🙂 /*
Vídeo WebCast SQL 2008
Já está disponível para download o Vídeo da WebCast.
Basta clicar no link e seguir os passos de inscrição.
https://msevents.microsoft.com/cui/r.aspx?t=5&c=pt-br&r=1297386063
WebCast SQL 2008
Hoje fiz a WebCast de Caminhos para SQL Serve 2008, apesar de ter ficado nervoso no inicio foi um prazer e espero que seja a primeira de muitas.
Obrigado ao Luciano Moreira pelo apoio, Daniel pelo Convite e Leandro pelo suporte.
Segue o link para download do PPT que usei na WebCast de hoje. Assim que o vídeo estiver disponível coloco o link aqui no Blog.
God bless!
NoCheck Constraint
Ontem um amigo daqui da empresa foi rodar um delete e para sua surpresa recebeu a seguinte mensagem.
delete from tabela where ID = 3
Msg 8630, Level 17, State 34, Line 1
Internal Query Processor Error: The query processor encountered an unexpected error during execution.
Ou seja o otimizador não agüentou o tranco, tudo bem que a tabela tem apenas 418 foreign keys, ou seja, para poder efetuar o delete o SQL terá que ler nas 418 tabelas se o ID = 3 existe pois senão ele não pode deixar o delete acontecer.
Como eu tenho certeza de que não existe nenhuma referencia com as outras tabelas para resolver o problema tive que desabilitar todas constraints das tabelas e efetuar o delete e depois habilitar as constraints.
— Executei este comando para ver as foreign keys
sp_fKeys corcc002
Copiei a coluna fkTable_Name e criei um comando para desabilitar e outro para habilitar todas as constraints desta tabelas. Segue um exemplo do comando
— Comando para desabilitar foreign key
ALTER TABLE TabelaB NOCHECK CONSTRAINT ALL
— Comando para habilitar foreign key
ALTER TABLE TabelaB CHECK CONSTRAINT ALL
Humor – Man on The Street
Hahaha fantástico esses vídeos falando sobre SQL Server.
http://images.video.msn.com/flash/soapbox1_1.swf
Video: Man on the Street What is SQL Server 2008
http://images.video.msn.com/flash/soapbox1_1.swf
Video: Man on the Street Why Upgrade to SQL Server2008
http://images.video.msn.com/flash/soapbox1_1.swf
Video: SQL Server vs. Oracle 11g
WebCast – Caminhos de Upgrade para SQL Server 2008
Pessoal é com prazer com convido a todos para participar da WebCast que a convite da Microsoft estarei apresentando na quarta-feira as 12:00 dia 04/06/2008.
Segue o resumo do que será discutido na WebCast e o link para inscrição do evento.
|
Caminhos de Upgrade para o SQL Server 2008 Visão Geral do Evento |
|
Palestrante: Fabiano Neves Amorim.
O SQL Server 2008 é a nova plataforma de banco de dados da Microsoft, entenda neste WebCast quais os caminhos para migrar seu banco de dados para a versão 2008. Serão respondidas perguntas como "Porque migrar para SQL Server 2008?" e "Atualizar de 2000 para 2005? Ou direto para 2008?". Também serão apresentadas ferramentas que auxiliam no processo de atualização como Upgrade Advisor 2008 e SQL Server Upgrade Assistant 2008, tópicos importantes como Upgrade In-place ou migração Side by Side. |
Conto com a presença de todos.
Versão SQL Server
Para saber qual Service Pack o seu servidor SQL Server está rodando execute o comando abaixo:
SELECT SERVERPROPERTY(‘ProductLevel’)
Existem outros comandos que retornam mais informações sobre a instance SQL instalada, segue alguns.
Retornar
— Retorna os dados da versão do SQL Server, Service pack e mais…
SELECT @@Version
Para identificar o que o número retornado significa, veja na lista abaixo.
Tabela de versão do SQL Server:
|
Versão |
Sem SP (RTM or Golden) |
SP1 |
SP2 |
SP3 / SP3a |
SP4 |
SP5 |
SP5a |
|
SQL Server 6.0 |
6.00.121 |
6.00.124 |
6.00.139 |
6.00.151 | |||
|
SQL Server 6.5 (Hydra) |
6.50.201 |
6.50.213 |
6.50.240 |
6.50.258 |
6.50.281 |
6.50.415 |
6.50.416 |
|
SQL Server 7.0 (Sphinx) |
7.00.623 |
7.00.699 |
7.00.842 |
7.00.961 |
7.00.1063 | ||
|
SQL Server 2000 (Shiloh) |
8.00.194 |
8.00.384 |
8.00.534 |
8.00.760 |
8.00.2039 | ||
|
SQL Server 2005 (Yukon) |
9.00.1399.06 |
9.00.2047 |
9.00.3042 | ||||
|
SQL Server 2008 (Katmai) |
10.0.1300.13 CTP June |
Outro comando:
— Retorna várias informações sobre o servidor
EXEC master.dbo.xp_msver
Compression na prática
Compression é sem dúvida umas das melhores features do SQL Server 2008, fiz alguns testes para ver como isso funciona na prática e fiquei bem contente com o resultado.
Clique no link abaixo para baixar o script que utilizei para teste.
|
Tabela |
CPU |
Writes |
Duration |
Tamanho |
Pages |
|
Tmp_Row_Compression |
10656 |
1617 |
45809 |
12 MB |
1613 |
|
Tmp_Page_Compression |
11359 |
1142 |
44118 |
8 MB |
1133 |
|
Tmp_Sem_Compression |
10032 |
5914 |
46873 |
46 MB |
5883 |
Baseados nos resultados acima, podemos observar 3 pontos importantes, CPU, Writes e Tamanho da tabela.
CPU – Como era de se esperar o algoritmo de nossos amigos Lempel e Ziv utilizados na compactação por página consome mais recurso de CPU, por outro lado, no nosso exemplo teve o melhor desempenho em relação a compactação dos dados consumindo apenas 1133 páginas.
Writes – Em relação ao número de writes confesso que fiquei admirado, mesmo sabendo que o SQL vai compactar os dados e tal, ao comparar o número de writes da tabela sem compression com as tabelas com compression é de se espantar.
Tamanho – Podemos observar que a compressão dos dados foi fantástica, tanto para compression por Row quanto por Page. Show de bola.
Obs.: Rodei o SQL na minha máquina e durante a execução continuei trabalhando, acessando disco, compilando projeto e por ai vai, ou seja, os resultados podem mudar bastante caso você repita os testes em uma máquina mais “tranqüila“ 🙂 Se você fizer os testes me mande o resultado…
2 Índices em Variáveis do tipo Table
Muitas vezes temos a necessidade de criar 2 índices em variáveis do tipo table, mas o comando CREATE INDEX @TMP… não roda pois não são permitidos comandos DDL em variáveis do tipo table, porém é possível definir 2 índices no comando de create da tabela, segue um exemplo bem prático.
SET STATISTICS PROFILE ON
DECLARE @Tmp TABLE(ID Int IDENTITY(1,1) PRIMARY KEY,
Nome VarChar(200))
SELECT * FROM @Tmp
WHERE ID = 10
/*
SELECT * FROM @Tmp WHERE ID = 10
|–Clustered Index Seek(OBJECT:(@Tmp), SEEK:([ID]=(10)) ORDERED FORWARD)
*/
SELECT * FROM @Tmp
WHERE Nome = ‘Teste’
/*
SELECT * FROM @Tmp WHERE Nome = ‘Teste’
|–Clustered Index Scan(OBJECT:(@Tmp), WHERE:([Nome]=’Teste’))
*/
GO
— Exemplo de UNIQUE
DECLARE @Tmp TABLE(ID Int IDENTITY(1,1) PRIMARY KEY,
Nome VarChar(200) UNIQUE)
SELECT * FROM @Tmp
WHERE ID = 10
/*
SELECT * FROM @Tmp WHERE ID = 10
|–Clustered Index Seek(OBJECT:(@Tmp), SEEK:([ID]=(10)) ORDERED FORWARD)
*/
SELECT * FROM @Tmp
WHERE Nome = ‘Teste’
/*
SELECT * FROM @Tmp WHERE Nome = ‘Teste’
|–Index Seek(OBJECT:(@Tmp), SEEK:([Nome]=’Teste’) ORDERED FORWARD)
*/
Mais IsNumeric
Mais IsNumeric, esse IsNumeric da o que falar, olha isso…
SELECT ISNUMERIC(‘+100’),
ISNUMERIC(‘–100’)
+100 é número e -100 não é, definitivamente… no comments





