advanced-sql-concepts

Window function chiamate anche analytical function , sono un tipo di funzioni di sql che permettono di eseguire calcoli sui dati in differenti gruppi di righe.

In SQL, la termine "window function" si riferisce a una categoria di funzioni che eseguono un calcolo su un set di righe, chiamato finestra, che sono in qualche modo correlate alla riga corrente. Queste funzioni possono essere utilizzate per eseguire operazioni che sono normalmente troppo complesse per essere realizzate con aggregazioni standard o operazioni di raggruppamento.

Le window functions non restituiscono un singolo valore per l'intero set di righe, ma piuttosto un valore per ogni riga, basato sulla finestra di righe correlata. Le righe incluse nella finestra possono essere definite in vari modi, ad esempio, possono essere tutte le righe in una partizione, o un range di righe che circondano la riga corrente.

Per utilizzare una window function in SQL, si utilizza la sintassi OVER, che può includere le clausole PARTITION BY e ORDER BY. PARTITION BY è utilizzato per dividere il set di righe in partizioni sulle quali la window function opera, mentre ORDER BY determina l'ordine delle righe all'interno di ciascuna partizione.

Esempio di una window function in SQL:

SELECT
    name,
    salary,
    AVG(salary) OVER (PARTITION BY department) AS avg_salary_by_department
FROM
    employees;

In questo esempio, la funzione AVG è una window function che calcola la media degli stipendi per dipartimento. La clausola OVER con PARTITION BY department indica che il calcolo deve essere fatto separatamente per ciascun dipartimento.

Esempio :

Creiamo la nostra window function :

SELECT
order_id,
order_date,
order_total.

SUM ( order_total ) OVER (
  ORDER BY order_id ASC
) AS running_total
FROM orders
ORDER BY Order_id ASC;

FUNZIONE DI RIPARTIZIONE NELLE WINDOW FUNCTION :

DEFINIZIONE DI PARTIZIONE :

"partizione" implica una suddivisione o segmentazione di un insieme o di una struttura in parti più piccole o in sottoinsiemi.

una partizione di un insieme è una suddivisione di quell'insieme in sottoinsiemi non vuoti, in modo tale che ogni elemento dell'insieme appartenga esattamente a uno dei sottoinsiemi. Per esempio, una partizione dell'insieme {1, 2, 3} potrebbe essere {{1, 2}, {3}}.

una partizione è un sottoinsieme di righe all'interno di un set di dati su cui una window function può operare. La clausola PARTITION BY viene utilizzata per dividere il set di righe in gruppi o partizioni in base ai valori in una o più colonne. Per esempio, se si hanno dati su dipendenti e si vuole calcolare la media dello stipendio per dipartimento, si può partizionare i dati in base al dipartimento e poi applicare la window function ad ogni partizione separatamente.

ANDIAMO A PARTIZIONARE SECONDO UN CRITERIO:

SELECT
order_id,
order_date,
order_total.

SUM ( order_total ) OVER (
  PARTITION BY order_date
  ORDER BY order_id ASC
) AS running_total
FROM orders
ORDER BY Order_id ASC;

Possiamo notare cge ordinando per id il risultato non è chiaro quindi modifichiamo il campo nel seguente modo :

SELECT
order_id,
order_date,
order_total.

SUM ( order_total ) OVER (
  PARTITION BY order_date
  ORDER BY order_id ASC
) AS running_total
FROM orders
ORDER BY order_date ASC;

Esercizio 1: Calcola la somma totale degli importi degli ordini per ogni cliente. Soluzione:

SELECT CustomerID, SUM(TotalDue) OVER (PARTITION BY CustomerID) AS TotalAmount
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione di aggregazione SUM con la clausola OVER per calcolare la somma totale degli importi degli ordini per ogni cliente.

Esercizio 2: Trova il numero totale di ordini effettuati da ogni cliente e mostra anche la somma cumulativa dei totali degli ordini. Soluzione:

SELECT CustomerID, COUNT(*) OVER (PARTITION BY CustomerID) AS TotalOrders,
       SUM(TotalDue) OVER (PARTITION BY CustomerID ORDER BY OrderDate) AS CumulativeTotal
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo le funzioni di aggregazione COUNT e SUM con la clausola OVER per calcolare il numero totale di ordini per ogni cliente e la somma cumulativa dei totali degli ordini.

Esercizio 3: Calcola la media degli importi degli ordini per ogni cliente e mostra anche la media cumulativa degli importi. Soluzione:

SELECT CustomerID, TotalDue,
       AVG(TotalDue) OVER (PARTITION BY CustomerID) AS AverageAmount,
       AVG(TotalDue) OVER (PARTITION BY CustomerID ORDER BY OrderDate) AS CumulativeAverage
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione di aggregazione AVG con la clausola OVER per calcolare la media degli importi degli ordini per ogni cliente e la media cumulativa degli importi.

Esercizio 4: Trova il valore massimo e minimo degli importi degli ordini per ogni cliente. Soluzione:

SELECT CustomerID, TotalDue,
       MAX(TotalDue) OVER (PARTITION BY CustomerID) AS MaxAmount,
       MIN(TotalDue) OVER (PARTITION BY CustomerID) AS MinAmount
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo le funzioni di aggregazione MAX e MIN con la clausola OVER per trovare il valore massimo e minimo degli importi degli ordini per ogni cliente.

Esercizio 5: Calcola la differenza tra l'importo di ciascun ordine e la media degli importi degli ordini per ogni cliente. Soluzione:

SELECT CustomerID, TotalDue,
       TotalDue - AVG(TotalDue) OVER (PARTITION BY CustomerID) AS AmountDifference
FROM Sales.SalesOrderHeader;

In questo esempio, sottraiamo la media degli importi degli ordini per ogni cliente dall'importo di ciascun ordine utilizzando la funzione AVG con la clausola OVER.

Esercizio 6: Calcola la percentuale dell'importo di ciascun ordine rispetto all'importo totale degli ordini per ogni cliente. Soluzione:

SELECT CustomerID, TotalDue,
       (TotalDue / SUM(TotalDue) OVER (PARTITION BY CustomerID)) * 100 AS

 AmountPercentage
FROM Sales.SalesOrderHeader;

In questo esempio, calcoliamo la percentuale dell'importo di ciascun ordine rispetto all'importo totale degli ordini per ogni cliente utilizzando la funzione SUM con la clausola OVER.

Esercizio 7: Trova il valore massimo dell'importo di ciascun ordine per ogni anno. Soluzione:

SELECT OrderDate, TotalDue,
       MAX(TotalDue) OVER (PARTITION BY YEAR(OrderDate)) AS MaxAmount
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione MAX con la clausola OVER per trovare il valore massimo dell'importo di ciascun ordine per ogni anno utilizzando la funzione YEAR per estrarre l'anno dalla colonna OrderDate.

Esercizio 8: Calcola la differenza tra l'importo di ciascun ordine e l'importo massimo degli ordini per ogni anno. Soluzione:

SELECT OrderDate, TotalDue,
       TotalDue - MAX(TotalDue) OVER (PARTITION BY YEAR(OrderDate)) AS AmountDifference
FROM Sales.SalesOrderHeader;

In questo esempio, sottraiamo l'importo massimo degli ordini per ogni anno dall'importo di ciascun ordine utilizzando la funzione MAX con la clausola OVER.

Esercizio 9: Trova il numero di ordini effettuati da ogni cliente e ordina i risultati in base al numero di ordini in ordine decrescente. Soluzione:

SELECT CustomerID, COUNT(*) OVER (PARTITION BY CustomerID) AS TotalOrders
FROM Sales.SalesOrderHeader
ORDER BY TotalOrders DESC;

In questo esempio, utilizziamo la funzione di aggregazione COUNT con la clausola OVER per calcolare il numero di ordini effettuati da ogni cliente e quindi ordiniamo i risultati in base al numero di ordini in ordine decrescente.

Esercizio 10: Calcola la somma cumulativa degli importi degli ordini per ogni cliente. Soluzione:

SELECT CustomerID, TotalDue,
       SUM(TotalDue) OVER (PARTITION BY CustomerID ORDER BY OrderDate) AS CumulativeAmount
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione di aggregazione SUM con la clausola OVER per calcolare la somma cumulativa degli importi degli ordini per ogni cliente, ordinata per la colonna OrderDate.

Questi esempi mostrano come utilizzare le Window Function con la clausola OVER per risolvere diversi tipi di problemi analitici utilizzando AdventureWorks 2014 come database di esempio.

Esercizio 1: Trova il numero di ordini effettuati in ogni anno e calcola la percentuale rispetto al numero totale di ordini. Soluzione:

SELECT YEAR(OrderDate) AS OrderYear,
       COUNT(*) OVER (PARTITION BY YEAR(OrderDate)) AS TotalOrders,
       (COUNT(*) OVER (PARTITION BY YEAR(OrderDate)) / CAST(COUNT(*) OVER () AS FLOAT)) * 100 AS Percentage
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione COUNT con la clausola OVER per calcolare il numero di ordini effettuati in ogni anno e la funzione COUNT senza la clausola OVER per calcolare il numero totale di ordini. Quindi calcoliamo la percentuale dividendo il numero di ordini in ogni anno per il numero totale di ordini.

Esercizio 2: Calcola il saldo cumulativo degli ordini per ogni cliente. Soluzione:

SELECT CustomerID, OrderDate, TotalDue,
       SUM(TotalDue) OVER (PARTITION BY CustomerID ORDER BY OrderDate ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS CumulativeBalance
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione SUM con la clausola OVER e la clausola ROWS BETWEEN per calcolare il saldo cumulativo degli ordini per ogni cliente. La clausola ROWS BETWEEN specifica che la somma deve essere calcolata dalla riga di partenza (UNBOUNDED PRECEDING) fino alla riga corrente (CURRENT ROW).

Esercizio 3: Trova il numero di giorni trascorsi tra l'ordine corrente e l'ultimo ordine effettuato da ogni cliente. Soluzione:

SELECT CustomerID, OrderDate,
       DATEDIFF(DAY, LAG(OrderDate) OVER (PARTITION BY CustomerID ORDER BY OrderDate), OrderDate) AS DaysSinceLastOrder
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione LAG con la clausola OVER per ottenere la data dell'ultimo ordine effettuato da ogni cliente. Quindi utilizziamo la funzione DATEDIFF per calcolare il numero di giorni trascorsi tra l'ordine corrente e l'ultimo ordine.

Esercizio 4: Calcola la media mobile degli importi degli ordini per ogni cliente considerando gli ultimi 3 ordini. Soluzione:

SELECT CustomerID, OrderDate, TotalDue,
       AVG(TotalDue) OVER (PARTITION BY CustomerID ORDER BY OrderDate ROWS BETWEEN 2 PRECEDING AND CURRENT ROW) AS MovingAverage
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione AVG con la clausola OVER e la clausola ROWS BETWEEN per calcolare la media mobile degli importi degli ultimi 3 ordini per ogni cliente. La clausola ROWS BETWEEN specifica che la media deve essere calcolata considerando le 2 righe precedenti (2 PRECEDING) oltre alla riga corrente (CURRENT ROW).

Esercizio 5: Trova il cliente con l'import

o totale più alto degli ordini. Soluzione:

SELECT CustomerID, SUM(TotalDue) AS TotalAmount
FROM Sales.SalesOrderHeader
GROUP BY CustomerID
HAVING SUM(TotalDue) = (SELECT MAX(TotalAmount) FROM (SELECT SUM(TotalDue) AS TotalAmount FROM Sales.SalesOrderHeader GROUP BY CustomerID) AS subquery);

In questo esempio, utilizziamo la funzione SUM con la clausola OVER per calcolare l'importo totale degli ordini per ogni cliente. Quindi utilizziamo una subquery per trovare il massimo importo totale e confrontarlo con l'importo totale di ciascun cliente nella clausola HAVING per selezionare il cliente corrispondente.

Esercizio 6: Trova il cliente con il numero massimo di ordini effettuati. Soluzione:

SELECT CustomerID, COUNT(*) AS TotalOrders
FROM Sales.SalesOrderHeader
GROUP BY CustomerID
HAVING COUNT(*) = (SELECT MAX(TotalOrders) FROM (SELECT COUNT(*) AS TotalOrders FROM Sales.SalesOrderHeader GROUP BY CustomerID) AS subquery);

In questo esempio, utilizziamo la funzione COUNT con la clausola OVER per calcolare il numero di ordini effettuati per ogni cliente. Quindi utilizziamo una subquery per trovare il massimo numero di ordini e confrontarlo con il numero di ordini di ciascun cliente nella clausola HAVING per selezionare il cliente corrispondente.

Esercizio 7: Trova la data dell'ultimo ordine effettuato per ogni cliente. Soluzione:

SELECT CustomerID, MAX(OrderDate) OVER (PARTITION BY CustomerID) AS LastOrderDate
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione MAX con la clausola OVER per trovare la data dell'ultimo ordine effettuato per ogni cliente.

Esercizio 8: Trova la data dell'ordine più vecchio effettuato per ogni cliente. Soluzione:

SELECT CustomerID, MIN(OrderDate) OVER (PARTITION BY CustomerID) AS OldestOrderDate
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione MIN con la clausola OVER per trovare la data dell'ordine più vecchio effettuato per ogni cliente.

Esercizio 9: Trova il numero di ordini consecutivi effettuati da ogni cliente. Soluzione:

SELECT CustomerID, OrderDate,
       ROW_NUMBER() OVER (PARTITION BY CustomerID ORDER BY OrderDate) AS ConsecutiveOrderNumber
FROM Sales.SalesOrderHeader;

In questo esempio, utilizziamo la funzione ROW_NUMBER con la clausola OVER per assegnare un numero sequenziale ai record di ogni cliente, ordinati per data dell'ordine. Questo numero rappresenta il numero di ordine consecutivo per ogni cliente.

Esercizio 10: Calcola la differenza in giorni tra la data dell'ordine corrente e la data dell'ordine successivo per ogni cliente. Soluzione:

SELECT CustomerID, OrderDate,
       DATEDIFF(DAY, OrderDate, LEAD(OrderDate) OVER (PARTITION BY CustomerID ORDER BY OrderDate)) AS DaysToNextOrder
FROM Sales.SalesOrderHeader;

In questo esempio,

utilizziamo la funzione LEAD con la clausola OVER per ottenere la data dell'ordine successivo per ogni cliente. Quindi utilizziamo la funzione DATEDIFF per calcolare il numero di giorni tra la data dell'ordine corrente e la data dell'ordine successivo.

ESERCIZI DI OTTIMIZZAZIONE

Creare query SQL ottimizzate è molto importante per garantire un utilizzo efficiente delle risorse del database e velocizzare il recupero dei dati. Si noti che per ottimizzare le query, ci si concentra su diverse strategie come l'uso di indici, evitando l'uso di funzioni negli operatori WHERE, la riduzione delle chiamate a tabelle di grandi dimensioni, l'uso di operatori di confronto più efficienti e l'uso di clausole EXISTS anziché IN quando possibile.

Esercizio:

Query originale:

SELECT * FROM Sales.SalesOrderDetail
WHERE ProductID = (SELECT ProductID FROM Production.Product WHERE Name = 'Road-650 Red, 48');

Ottimizzazione:

Questa query può essere ottimizzata eliminando la subquery e utilizzando un JOIN.

Query ottimizzata:

SELECT sod.* 
FROM Sales.SalesOrderDetail sod
JOIN Production.Product p ON sod.ProductID = p.ProductID
WHERE p.Name = 'Road-650 Red, 48';

Esercizio:

Query originale:

SELECT * FROM Sales.Customer 
WHERE TerritoryID IN (SELECT TerritoryID FROM Sales.SalesTerritory WHERE Name = 'Northwest');

Ottimizzazione:

Invece di utilizzare la clausola IN, possiamo utilizzare un JOIN per ottimizzare la query.

Query ottimizzata:

SELECT c.*
FROM Sales.Customer c
JOIN Sales.SalesTerritory st ON c.TerritoryID = st.TerritoryID
WHERE st.Name = 'Northwest';

Esercizio:

Query originale:

SELECT * FROM Production.Product 
WHERE ListPrice > (SELECT AVG(ListPrice) FROM Production.Product);

Ottimizzazione:

Possiamo migliorare l'efficienza calcolando la media una volta e memorizzandola in una variabile.

Query ottimizzata:

DECLARE @average_price DECIMAL(18, 2);
SELECT @average_price = AVG(ListPrice) FROM Production.Product;
SELECT * FROM Production.Product WHERE ListPrice > @average_price;

Esercizio:

Query originale:
```
SELECT * FROM Production.Product
WHERE Name LIKE '%Road%';
```
Ottimizzazione:

Utilizzare l'operatore LIKE con un jolly all'inizio può essere costoso. Se possibile, limitare l'uso dei jolly.

Query ottimizzata:
```
SELECT * FROM Production.Product
WHERE Name LIKE 'Road%';
```

Esercizio:

Query originale:

SELECT * FROM Sales.SalesOrderHeader
WHERE YEAR(OrderDate) = 2014 AND MONTH(OrderDate) = 7;

Ottimizzazione:

Utilizzare funzioni sugli attributi nella clausola WHERE può impedire l'uso degli indici. E' meglio utilizzare una range query.

Query ottimizzata:

SELECT * FROM Sales.SalesOrderHeader
WHERE OrderDate >= '2014-07-01' AND OrderDate < '2014-08-01';

Nota : l'ottimizzazione delle query può dipendere da vari fattori, tra cui l'architettura del database, gli indici esistenti, le dimensioni delle tabelle, ecc. Questi esempi sono intesi come linee guida generali e potrebbero non applicarsi a tutti i casi o a tutte le configurazioni del database.

Certo, ecco altri dieci esempi di query SQL che potrebbero essere ottimizzate:

Esercizio:

Query originale:

SELECT * FROM Sales.Customer 
WHERE PersonID IN (SELECT BusinessEntityID FROM Person.Person WHERE FirstName = 'John');

Ottimizzazione:

Possiamo eliminare la subquery utilizzando un JOIN.

Query ottimizzata:

SELECT c.*
FROM Sales.Customer c
JOIN Person.Person p ON c.PersonID = p.BusinessEntityID
WHERE p.FirstName = 'John';

Esercizio:

Query originale:

SELECT * FROM Production.Product 
WHERE ProductID = (SELECT ProductID FROM Sales.SalesOrderDetail WHERE OrderQty = (SELECT MAX(OrderQty) FROM Sales.SalesOrderDetail));

Ottimizzazione:

Possiamo ridurre la subquery nidificata utilizzando un JOIN.

Query ottimizzata:

SELECT p.*
FROM Production.Product p
JOIN Sales.SalesOrderDetail sod ON p.ProductID = sod.ProductID
WHERE sod.OrderQty = (SELECT MAX(OrderQty) FROM Sales.SalesOrderDetail);

Esercizio:

Query originale:

SELECT * FROM Sales.Customer 
WHERE TerritoryID IN (SELECT TerritoryID FROM Sales.SalesTerritory WHERE CountryRegionCode = 'US' AND Group = 'North America');

Ottimizzazione:

Possiamo sostituire la clausola IN con un JOIN.

Query ottimizzata:

SELECT c.*
FROM Sales.Customer c
JOIN Sales.SalesTerritory st ON c.TerritoryID = st.TerritoryID
WHERE st.CountryRegionCode = 'US' AND st.Group = 'North America';

Esercizio:

Query originale:

SELECT * FROM Production.Product 
WHERE ListPrice > (SELECT AVG(ListPrice) FROM Production.Product WHERE Color = 'Black');

Ottimizzazione:

Possiamo migliorare l'efficienza calcolando la media una volta e memorizzandola in una variabile.

Query ottimizzata:

DECLARE @average_black_price DECIMAL(18, 2);
SELECT @average_black_price = AVG(ListPrice) FROM Production.Product WHERE Color = 'Black';
SELECT * FROM Production.Product WHERE ListPrice > @average_black_price;

Esercizio:

Query originale:

SELECT * FROM Sales.SalesOrderHeader
WHERE YEAR(OrderDate) = 2014 AND DAY(OrderDate) = 15;

Ottimizzazione:

Utilizzare funzioni sugli attributi nella clausola WHERE può impedire l'uso degli indici. E' meglio utilizzare una range query.

Query ottimizzata:

SELECT * FROM Sales.SalesOrderHeader
WHERE OrderDate >= '2014-01-15' AND OrderDate < '2014-01-16';

Esercizio:

Query originale:
```
SELECT * FROM Sales.SalesOrderHeader
WHERE YEAR(OrderDate) = 2013 AND MONTH(OrderDate) = 6;
```
Ottimizzazione:

Si può migliorare utilizzando un range di date.

Query ottimizzata

: sql SELECT * FROM Sales.SalesOrderHeader WHERE OrderDate >= '2013-06-01' AND OrderDate < '2013-07-01';

Esercizio:

Query originale:
```
SELECT * FROM HumanResources.Employee 
WHERE JobTitle LIKE '%Marketing%';
```
Ottimizzazione:

Utilizzare l'operatore LIKE con un jolly all'inizio può essere costoso. Se possibile, limitare l'uso dei jolly.

Query ottimizzata:
```
SELECT * FROM HumanResources.Employee
WHERE JobTitle LIKE 'Marketing%';
```

Esercizio:

Query originale:

SELECT * FROM Production.Product 
WHERE ListPrice > ALL (SELECT ListPrice FROM Production.Product WHERE Color = 'Black');

Ottimizzazione:

Si può utilizzare MAX() invece di ALL per migliorare le prestazioni.

Query ottimizzata:

DECLARE @max_black_price DECIMAL(18, 2);
SELECT @max_black_price = MAX(ListPrice) FROM Production.Product WHERE Color = 'Black';
SELECT * FROM Production.Product WHERE ListPrice > @max_black_price;

Esercizio:

Query originale:

SELECT * FROM Production.Product 
WHERE ProductID = ANY (SELECT ProductID FROM Sales.SalesOrderDetail WHERE OrderQty > 10);

Ottimizzazione:

Possiamo eliminare la subquery utilizzando un JOIN.

Query ottimizzata:

SELECT p.*
FROM Production.Product p
JOIN Sales.SalesOrderDetail sod ON p.ProductID = sod.ProductID
WHERE sod.OrderQty > 10;

Esercizio:

Query originale:

SELECT * FROM Sales.SalesOrderDetail 
WHERE UnitPrice < ANY (SELECT ListPrice FROM Production.Product WHERE Color = 'Red');

Ottimizzazione:

Possiamo migliorare l'efficienza utilizzando MIN() invece di ANY.

Query ottimizzata:

DECLARE @min_red_price DECIMAL(18, 2);
SELECT @min_red_price = MIN(ListPrice) FROM Production.Product WHERE Color = 'Red';
SELECT * FROM Sales.SalesOrderDetail WHERE UnitPrice < @min_red_price;

Le ottimizzazioni specifiche possono dipendere da molti fattori, come la struttura del database, l'hardware su cui il database è ospitato, la dimensione dei dati e così via. Alcune delle ottimizzazioni proposte potrebbero non essere applicabili in ogni situazione, ma forniscono un punto di partenza per pensare a come migliorare le prestazioni delle query SQL.

Esercizio:

Query originale:

SELECT * FROM Sales.Customer
WHERE TerritoryID = (SELECT TerritoryID FROM Sales.SalesTerritory WHERE Name = 'Southeast');

Ottimizzazione:

Possiamo sostituire la subquery con un JOIN.

Query ottimizzata:

SELECT c.*
FROM Sales.Customer c
JOIN Sales.SalesTerritory st ON c.TerritoryID = st.TerritoryID
WHERE st.Name = 'Southeast';

Esercizio:

Query originale:

SELECT * FROM Production.Product
WHERE ProductID = (SELECT ProductID FROM Sales.SalesOrderDetail WHERE LineTotal = (SELECT MAX(LineTotal) FROM Sales.SalesOrderDetail));

Ottimizzazione:

Possiamo ridurre la subquery nidificata utilizzando un JOIN.

Query ottimizzata:

SELECT p.*
FROM Production.Product p
JOIN Sales.SalesOrderDetail sod ON p.ProductID = sod.ProductID
WHERE sod.LineTotal = (SELECT MAX(LineTotal) FROM Sales.SalesOrderDetail);

Esercizio:

Query originale:

SELECT * FROM Sales.Customer
WHERE TerritoryID IN (SELECT TerritoryID FROM Sales.SalesTerritory WHERE CountryRegionCode = 'CA' AND Group = 'North America');

Ottimizzazione:

Possiamo sostituire la clausola IN con un JOIN.

Query ottimizzata:

SELECT c.*
FROM Sales.Customer c
JOIN Sales.SalesTerritory st ON c.TerritoryID = st.TerritoryID
WHERE st.CountryRegionCode = 'CA' AND st.Group = 'North America';

Esercizio:

Query originale:

SELECT * FROM Production.Product
WHERE ListPrice > (SELECT AVG(ListPrice) FROM Production.Product WHERE Color = 'Blue');

Ottimizzazione:

Possiamo migliorare l'efficienza calcolando la media una volta e memorizzandola in una variabile.

Query ottimizzata:

DECLARE @average_blue_price DECIMAL(18, 2);
SELECT @average_blue_price = AVG(ListPrice) FROM Production.Product WHERE Color = 'Blue';
SELECT * FROM Production.Product WHERE ListPrice > @average_blue_price;

Esercizio:

Query originale:

SELECT * FROM Sales.SalesOrderHeader
WHERE YEAR(OrderDate) = 2015 AND DAY(OrderDate) = 31;

Ottimizzazione:

Utilizzare funzioni sugli attributi nella clausola WHERE può impedire l'uso degli indici. E' meglio utilizzare una range query.

Query ottimizzata:

SELECT * FROM Sales.SalesOrderHeader
WHERE OrderDate >= '2015-01-31' AND OrderDate < '2015-02-01';

Esercizio:

Query originale:

SELECT * FROM Sales.SalesOrderHeader
WHERE YEAR(OrderDate) = 2015 AND MONTH(OrderDate) = 7;

Ottimizzazione:

Possiamo migliorare utilizzando un range

di date.

Query ottimizzata:
```sql
SELECT * FROM Sales.SalesOrderHeader
WHERE OrderDate >= '2015-07-01' AND OrderDate < '2015-08-01';
```

Esercizio:

Query originale:
```
SELECT * FROM HumanResources.Employee
WHERE JobTitle LIKE '%Engineer%';
```
Ottimizzazione:

Utilizzare l'operatore LIKE con un jolly all'inizio può essere costoso. Se possibile, limitare l'uso dei jolly.

Query ottimizzata:
```
SELECT * FROM HumanResources.Employee
WHERE JobTitle LIKE 'Engineer%';
```

Esercizio:

Query originale:

SELECT * FROM Production.Product
WHERE ListPrice > ALL (SELECT ListPrice FROM Production.Product WHERE Color = 'Yellow');

Ottimizzazione:

Possiamo utilizzare MAX() invece di ALL per migliorare le prestazioni.

Query ottimizzata:

DECLARE @max_yellow_price DECIMAL(18, 2);
SELECT @max_yellow_price = MAX(ListPrice) FROM Production.Product WHERE Color = 'Yellow';
SELECT * FROM Production.Product WHERE ListPrice > @max_yellow_price;

Esercizio:

Query originale:

SELECT * FROM Production.Product
WHERE ProductID = ANY (SELECT ProductID FROM Sales.SalesOrderDetail WHERE OrderQty > 20);

Ottimizzazione:

Possiamo eliminare la subquery utilizzando un JOIN.

Query ottimizzata:

SELECT p.*
FROM Production.Product p
JOIN Sales.SalesOrderDetail sod ON p.ProductID = sod.ProductID
WHERE sod.OrderQty > 20;

Esercizio:

Query originale:

SELECT * FROM Sales.SalesOrderDetail
WHERE UnitPrice < ANY (SELECT ListPrice FROM Production.Product WHERE Color = 'Green');

Ottimizzazione:

Possiamo migliorare l'efficienza utilizzando MIN() invece di ANY.

Query ottimizzata:

DECLARE @min_green_price DECIMAL(18, 2);
SELECT @min_green_price = MIN(ListPrice) FROM Production.Product WHERE Color = 'Green';
SELECT * FROM Sales.SalesOrderDetail WHERE UnitPrice < @min_green_price;

Certo, ecco altri dieci esercizi di query SQL con un livello di difficoltà crescente:

Esercizio:

Query originale:

SELECT * FROM Production.Product 
WHERE ProductID IN (SELECT ProductID FROM Production.ProductReview WHERE Rating > 3);

Ottimizzazione:

Possiamo utilizzare un JOIN per eliminare la subquery.

Query ottimizzata:

SELECT p.*
FROM Production.Product p
JOIN Production.ProductReview pr ON p.ProductID = pr.ProductID
WHERE pr.Rating > 3;

Esercizio:

Query originale:

SELECT * FROM Production.Product 
WHERE ListPrice > (SELECT AVG(ListPrice) FROM Production.Product WHERE Size = 'M');

Ottimizzazione:

Possiamo precalcolare l'AVG per migliorare le prestazioni.

Query ottimizzata:

DECLARE @avg_price DECIMAL(18, 2);
SELECT @avg_price = AVG(ListPrice) FROM Production.Product WHERE Size = 'M';
SELECT * FROM Production.Product WHERE ListPrice > @avg_price;

Esercizio:

Query originale:

SELECT * FROM Sales.SalesOrderHeader
WHERE SalesPersonID = (SELECT BusinessEntityID FROM HumanResources.Employee WHERE JobTitle = 'Sales Representative');

Ottimizzazione:

Possiamo eliminare la subquery utilizzando un JOIN.

Query ottimizzata:

SELECT soh.*
FROM Sales.SalesOrderHeader soh
JOIN HumanResources.Employee e ON soh.SalesPersonID = e.BusinessEntityID
WHERE e.JobTitle = 'Sales Representative';

Esercizio:

Query originale:

SELECT * FROM Sales.SalesOrderDetail
WHERE ProductID IN (SELECT ProductID FROM Production.Product WHERE Color = 'Red' OR Color = 'Blue');

Ottimizzazione:

Possiamo eliminare la subquery utilizzando un JOIN.

Query ottimizzata:

SELECT sod.*
FROM Sales.SalesOrderDetail sod
JOIN Production.Product p ON sod.ProductID = p.ProductID
WHERE p.Color IN ('Red', 'Blue');

Esercizio:

Query originale:

SELECT * FROM Sales.SalesOrderHeader soh
WHERE EXISTS (SELECT * FROM Sales.SalesOrderDetail sod WHERE soh.SalesOrderID = sod.SalesOrderID AND sod.OrderQty > 10);

Ottimizzazione:

Possiamo eliminare l'uso di EXISTS utilizzando un JOIN.

Query ottimizzata:

SELECT DISTINCT soh.*
FROM Sales.SalesOrderHeader soh
JOIN Sales.SalesOrderDetail sod ON soh.SalesOrderID = sod.SalesOrderID
WHERE sod.OrderQty > 10;

Esercizio:

Query originale:

SELECT * FROM HumanResources.Employee e
WHERE NOT EXISTS (SELECT * FROM HumanResources.EmployeePayHistory eph WHERE e.BusinessEntityID = eph.BusinessEntityID AND RateChangeDate > '2015-01-01');

Ottimizzazione:

Possiamo utilizzare un LEFT JOIN e controllare le righe NULL per eliminare l'uso di NOT

EXISTS.

Query ottimizzata:
```sql
SELECT e.*
FROM HumanResources.Employee e
LEFT JOIN HumanResources.EmployeePayHistory eph ON e.BusinessEntityID = eph.BusinessEntityID AND eph.RateChangeDate > '2015-01-01'
WHERE eph.BusinessEntityID IS NULL;
```

Esercizio:

Query originale:

SELECT * FROM Production.Product p
WHERE (SELECT AVG(Rating) FROM Production.ProductReview pr WHERE p.ProductID = pr.ProductID) > 4;

Ottimizzazione:

Possiamo eliminare la subquery utilizzando un JOIN e GROUP BY.

Query ottimizzata:

SELECT p.*
FROM Production.Product p
JOIN (SELECT ProductID, AVG(Rating) as AverageRating FROM Production.ProductReview GROUP BY ProductID) pr ON p.ProductID = pr.ProductID
WHERE pr.AverageRating > 4;

Esercizio:

Query originale:

SELECT (SELECT Name FROM Production.Product WHERE ProductID = sod.ProductID) as ProductName, (SELECT Name FROM Sales.SalesTerritory WHERE TerritoryID = soh.TerritoryID) as TerritoryName
FROM Sales.SalesOrderDetail sod
JOIN Sales.SalesOrderHeader soh ON sod.SalesOrderID = soh.SalesOrderID;

Ottimizzazione:

Possiamo eliminare le subquery utilizzando dei JOIN.

Query ottimizzata:

SELECT p.Name as ProductName, st.Name as TerritoryName
FROM Sales.SalesOrderDetail sod
JOIN Sales.SalesOrderHeader soh ON sod.SalesOrderID = soh.SalesOrderID
JOIN Production.Product p ON sod.ProductID = p.ProductID
JOIN Sales.SalesTerritory st ON soh.TerritoryID = st.TerritoryID;

Esercizio:

Query originale:

SELECT (SELECT AVG(Rating) FROM Production.ProductReview WHERE ProductID = p.ProductID) as AverageRating
FROM Production.Product p
WHERE (SELECT COUNT(*) FROM Production.ProductReview WHERE ProductID = p.ProductID) > 5;

Ottimizzazione:

Possiamo eliminare le subquery utilizzando un JOIN, GROUP BY, e HAVING.

Query ottimizzata:

SELECT p.ProductID, AVG(pr.Rating) as AverageRating
FROM Production.Product p
JOIN Production.ProductReview pr ON p.ProductID = pr.ProductID
GROUP BY p.ProductID
HAVING COUNT(*) > 5;

Esercizio:

Query originale:

SELECT (SELECT MAX(OrderQty) FROM Sales.SalesOrderDetail WHERE ProductID = p.ProductID) as MaxOrderQty
FROM Production.Product p
WHERE (SELECT SUM(OrderQty) FROM Sales.SalesOrderDetail WHERE ProductID = p.ProductID) > 100;

Ottimizzazione:

Possiamo eliminare le subquery utilizzando un JOIN, GROUP BY, e HAVING.

Query ottimizzata:

SELECT p.ProductID, MAX(sod.OrderQty) as MaxOrderQty
FROM Production.Product p
JOIN Sales.SalesOrderDetail sod ON p.ProductID = sod.ProductID
GROUP BY p.ProductID
HAVING SUM(sod.OrderQty) > 100;

SQL DINAMICO

SQL dinamico è un tipo di SQL in cui le stringhe SQL vengono generate dinamicamente, permettendo una flessibilità che non è disponibile nell'SQL statico. Tuttavia, è necessario utilizzarlo con cautela per evitare rischi di sicurezza, come l'iniezione SQL.

Ecco un esempio di come potrebbe essere utilizzato in SQL Server:

DECLARE @nomeTabella AS NVARCHAR(128)
DECLARE @sql AS NVARCHAR(MAX)

SET @nomeTabella = N'MiaTabella'

SET @sql = N'SELECT * FROM ' + QUOTENAME(@nomeTabella)

EXEC sp_executesql @sql

In questo esempio, stiamo creando una stringa SQL per selezionare tutti i record da una tabella il cui nome è immagazzinato nella variabile @nomeTabella. Utilizziamo la funzione QUOTENAME per garantire che il nome della tabella sia correttamente quotato, evitando così potenziali problemi di iniezione SQL.

Una volta che abbiamo generato la nostra stringa SQL, utilizziamo la stored procedure di sistema sp_executesql per eseguirla.

L'utilizzo di SQL dinamico può rendere le tue query più difficili da leggere e da mantenere, e può presentare problemi di sicurezza se non gestito correttamente. Dovresti cercare di limitare il suo utilizzo ai casi in cui è strettamente necessario.

Ecco come utilizzare il SQL dinamico con parametri:

DECLARE @nomeTabella AS NVARCHAR(128)
DECLARE @nomeColonna AS NVARCHAR(128)
DECLARE @valore AS NVARCHAR(128)
DECLARE @sql AS NVARCHAR(MAX)

SET @nomeTabella = N'MiaTabella'
SET @nomeColonna = N'MiaColonna'
SET @valore = N'MioValore'

SET @sql = N'SELECT * FROM ' + QUOTENAME(@nomeTabella) + ' WHERE ' + QUOTENAME(@nomeColonna) + ' = @pValore'

EXEC sp_executesql @sql, N'@pValore NVARCHAR(128)', @pValore = @valore

In questo esempio, utilizziamo la stored procedure sp_executesql con parametri. Questo permette di evitare i problemi di iniezione SQL quando si utilizza SQL dinamico.

PARAMETER SNIFFING

Il fenomeno del "parameter sniffing" si verifica nelle stored procedure di database quando un parametro di input viene utilizzato per determinare il piano di esecuzione della query. Questo può portare a problemi di prestazioni quando i dati iniziali utilizzati per creare il piano di esecuzione non sono rappresentativi dei dati effettivi utilizzati in seguito.

Quando viene eseguita una stored procedure per la prima volta, il database crea un piano di esecuzione basato sui valori dei parametri di input forniti. Questo piano di esecuzione viene quindi memorizzato nella cache per le successive esecuzioni della stessa stored procedure. Tuttavia, se i valori dei parametri successivi sono molto diversi da quelli utilizzati per generare il piano di esecuzione memorizzato nella cache, potrebbe essere scelto un piano di esecuzione non ottimale per i nuovi valori dei parametri, il che potrebbe influire negativamente sulle prestazioni.

Ad esempio, supponiamo di avere una stored procedure che restituisce un elenco di ordini in base a un determinato stato. Se la stored procedure viene eseguita per la prima volta con uno stato "in attesa" e viene generato un piano di esecuzione che utilizza un indice specifico per recuperare rapidamente i risultati, il piano di esecuzione verrà memorizzato nella cache. Tuttavia, se la stored procedure viene eseguita successivamente con uno stato diverso, ad esempio "completato", e l'indice utilizzato nel piano di esecuzione memorizzato non è efficace per questo stato, le prestazioni potrebbero essere degradate.

Per mitigare il problema del parameter sniffing, ci sono diverse possibili soluzioni:

Utilizzare l'opzione di ricompilazione: è possibile utilizzare l'opzione di ricompilazione per generare un nuovo piano di esecuzione ad ogni esecuzione della stored procedure. Questo garantisce che il piano di esecuzione venga creato in base ai valori dei parametri specifici di ogni esecuzione. Tuttavia, potrebbe comportare un sovraccarico di compilazione per stored procedure complesse o frequentemente utilizzate.
Utilizzare l'opzione di ottimizzazione FORCEREORDER: questa opzione consente di forzare l'ordine di valutazione delle tabelle nella query. Può essere utile quando si ha la certezza che un determinato ordine di valutazione delle tabelle produce un piano di esecuzione ottimale indipendentemente dai valori dei parametri.
Utilizzare istruzioni SQL dinamiche: invece di utilizzare direttamente i parametri di input nella query, è possibile costruire un'istruzione SQL dinamica all'interno della stored procedure utilizzando i valori dei parametri. In questo modo, il piano di esecuzione viene creato in base alla query specifica e non ai valori dei parametri.
Aggiornare le statistiche: assicurarsi che le statistiche delle tabelle coinvolte nella query siano aggiornate regolarmente. Le statistiche forniscono informazioni sulle distribuzioni dei dati all'interno delle tabelle e sono utilizzate dal motore di database per generare piani di esecuzione ottimali.
Utilizzare hint di query: è possibile

utilizzare hint di query per specificare un piano di esecuzione specifico per la stored procedure. Tuttavia, l'uso eccessivo di hint potrebbe rendere il codice più difficile da mantenere e potrebbe non essere la soluzione ottimale a lungo termine.

Ogni soluzione ha i suoi pro e contro, e la scelta dipende dal contesto specifico e dalle esigenze del sistema. È consigliabile effettuare test e monitorare le prestazioni per determinare quale soluzione funziona meglio nel proprio ambiente.

Esempi che illustrano come affrontare il problema del parameter sniffing nelle stored procedure:

Utilizzo dell'opzione di ricompilazione:

CREATE PROCEDURE GetOrdersByStatus
    @Status varchar(10)
AS
BEGIN
    OPTION (RECOMPILE) -- Forza la ricompilazione ad ogni esecuzione
    SELECT * FROM Orders WHERE Status = @Status
END

Utilizzo dell'opzione di ottimizzazione FORCEREORDER:

CREATE PROCEDURE GetOrdersByStatus
    @Status varchar(10)
AS
BEGIN
    SELECT *
    FROM Orders
    WHERE Status = @Status
    OPTION (FORCE ORDER) -- Forza un particolare ordine di valutazione delle tabelle
END

Utilizzo di istruzioni SQL dinamiche:

CREATE PROCEDURE GetOrdersByStatus
    @Status varchar(10)
AS
BEGIN
    DECLARE @SQL nvarchar(MAX)
    SET @SQL = N'SELECT * FROM Orders WHERE Status = @Status'

    EXEC sp_executesql @SQL, N'@Status varchar(10)', @Status = @Status
END

Aggiornamento delle statistiche:

CREATE PROCEDURE GetOrdersByStatus
    @Status varchar(10)
AS
BEGIN
    UPDATE STATISTICS Orders -- Aggiorna le statistiche della tabella Orders
    SELECT * FROM Orders WHERE Status = @Status
END

Utilizzo di hint di query:

CREATE PROCEDURE GetOrdersByStatus
    @Status varchar(10)
AS
BEGIN
    SELECT *
    FROM Orders WITH (INDEX(Orders_StatusIndex)) -- Utilizza un indice specifico
    WHERE Status = @Status
END

Ricorda che la scelta della soluzione dipende dalle caratteristiche del tuo sistema e dai requisiti specifici. Assicurati di effettuare test e monitorare le prestazioni per determinare quale soluzione funzioni meglio nel tuo contesto.

conoscere i vari metodi per risolvere il paramter sniffing

panoramica dei vari metodi comunemente utilizzati per risolvere il problema del parameter sniffing nelle stored procedure:

Opzione di ricompilazione: Utilizzare l'opzione OPTION (RECOMPILE) all'interno della stored procedure forza la ricompilazione della query ad ogni esecuzione. In questo modo, il piano di esecuzione viene generato in base ai valori dei parametri specifici di ogni esecuzione. Tuttavia, questa opzione può comportare un sovraccarico di compilazione, specialmente per le stored procedure complesse o frequentemente utilizzate.
Ottimizzazione FORCEREORDER: Utilizzare l'opzione OPTION (FORCE ORDER) all'interno della stored procedure forza un particolare ordine di valutazione delle tabelle nella query. Questo può essere utile quando si conosce un ordine di valutazione che produce un piano di esecuzione ottimale indipendentemente dai valori dei parametri.
Utilizzo di istruzioni SQL dinamiche: Costruire un'istruzione SQL dinamica all'interno della stored procedure utilizzando i valori dei parametri. In questo modo, il piano di esecuzione viene creato in base alla query specifica e non ai valori dei parametri. L'utilizzo di istruzioni SQL dinamiche può fornire una maggiore flessibilità nel generare piani di esecuzione ottimali.
Aggiornamento delle statistiche: Assicurarsi che le statistiche delle tabelle coinvolte nella query siano aggiornate regolarmente. Le statistiche forniscono informazioni sulle distribuzioni dei dati all'interno delle tabelle e sono utilizzate dal motore di database per generare piani di esecuzione ottimali. L'aggiornamento delle statistiche può aiutare a garantire che i piani di esecuzione siano adatti ai valori dei parametri correnti.
Utilizzo di hint di query: Utilizzare hint di query per specificare un piano di esecuzione specifico per la stored procedure. Gli hint di query forniscono istruzioni esplicite al motore di database su come eseguire una query. Tuttavia, l'uso eccessivo di hint può rendere il codice più difficile da mantenere e potrebbe non essere la soluzione ottimale a lungo termine.
Utilizzo di pianificazione automatica: A partire da versioni recenti di alcuni database, come SQL Server, è disponibile la "pianificazione automatica avanzata". Questa funzionalità consente al motore di database di adattare automaticamente i piani di esecuzione in base ai valori dei parametri, fornendo una soluzione integrata per il problema del parameter sniffing.

La scelta del metodo dipende dal contesto specifico e dalle esigenze del sistema. È importante effettuare test e monitorare le prestazioni per determinare quale soluzione funziona meglio nel proprio ambiente.

opzione with recompile

L'opzione WITH RECOMPILE viene utilizzata all'interno di una stored procedure per forzare la ricompilazione della query ad ogni esecuzione. Ciò significa che ogni volta che la stored procedure viene chiamata, il piano di esecuzione viene generato dinamicamente in base ai valori dei parametri forniti in quella specifica esecuzione. Di seguito sono riportati gli effetti principali dell'utilizzo dell'opzione WITH RECOMPILE:

Pianificazione dinamica: Quando viene utilizzata l'opzione WITH RECOMPILE, il motore di database genera un nuovo piano di esecuzione per la stored procedure ad ogni esecuzione. Questo consente di adattare il piano di esecuzione in base ai valori dei parametri specifici di ogni chiamata. Pertanto, il piano di esecuzione sarà ottimizzato per i valori dei parametri correnti, potenzialmente migliorando le prestazioni.
Riduzione dell'uso della cache: L'utilizzo dell'opzione WITH RECOMPILE evita che il piano di esecuzione venga memorizzato nella cache del database. Poiché il piano viene generato dinamicamente ad ogni esecuzione, non verrà riutilizzato per le chiamate successive. Questo comporta una riduzione dell'utilizzo della cache, ma allo stesso tempo può comportare un aumento del carico di lavoro sulla CPU e un potenziale ritardo nelle prestazioni dovuto alla necessità di ricompilare la query ad ogni esecuzione.
Adattabilità ai cambiamenti dei dati: Poiché il piano di esecuzione viene generato in base ai valori dei parametri specifici di ogni esecuzione, l'utilizzo dell'opzione WITH RECOMPILE consente alla stored procedure di adattarsi ai cambiamenti dei dati nel database. Se i dati cambiano notevolmente tra le diverse esecuzioni, questo può evitare l'uso di un piano di esecuzione non ottimale basato su dati precedenti.
Overhead di compilazione: L'utilizzo dell'opzione WITH RECOMPILE comporta un overhead di compilazione aggiuntivo ad ogni esecuzione della stored procedure. La generazione dinamica del piano di esecuzione richiede tempo e risorse della CPU. Pertanto, se la stored procedure viene chiamata frequentemente o se è complessa, l'utilizzo di WITH RECOMPILE potrebbe causare un sovraccarico significativo e influire sulle prestazioni complessive del sistema.

In generale, l'opzione WITH RECOMPILE è utile quando si desidera adattare il piano di esecuzione in base ai valori dei parametri specifici di ogni esecuzione. Tuttavia, è importante valutare attentamente gli effetti sull'overhead di compilazione e le prestazioni complessive del sistema prima di utilizzarla.

Ecco alcuni esempi che illustrano l'utilizzo dell'opzione WITH RECOMPILE all'interno di una stored procedure:

Esempio 1: Utilizzo di WITH RECOMPILE per forzare la ricompilazione di una query ad ogni esecuzione:

CREATE PROCEDURE GetOrdersByStatus
    @Status varchar(10)
AS
BEGIN
    SELECT * FROM Orders WHERE Status = @Status
    OPTION (RECOMPILE)
END

In questo esempio, la stored procedure GetOrdersByStatus restituisce gli ordini in base a uno stato specifico. L'opzione OPTION (RECOMPILE) è utilizzata per forzare la ricompilazione della query ad ogni esecuzione, consentendo al piano di esecuzione di adattarsi ai valori dei parametri specifici di ogni chiamata.

Esempio 2: Utilizzo di WITH RECOMPILE con una stored procedure complessa:

CREATE PROCEDURE GetCustomerOrders
    @CustomerId int
AS
BEGIN
    -- Query complessa che coinvolge più tabelle e condizioni
    SELECT o.OrderId, o.OrderDate, c.CustomerName
    FROM Orders o
    INNER JOIN Customers c ON o.CustomerId = c.CustomerId
    WHERE o.CustomerId = @CustomerId
    OPTION (RECOMPILE)
END

In questo esempio, la stored procedure GetCustomerOrders restituisce gli ordini di un determinato cliente. La query coinvolge più tabelle e condizioni complesse. L'utilizzo di OPTION (RECOMPILE) garantisce che il piano di esecuzione venga generato dinamicamente ad ogni esecuzione, adattandosi ai valori del parametro @CustomerId specifico di ogni chiamata.

Ricorda che l'utilizzo di WITH RECOMPILE deve essere valutato attentamente in base alle esigenze specifiche del sistema. Sebbene possa consentire un adattamento ottimale del piano di esecuzione, potrebbe comportare un sovraccarico di compilazione significativo, soprattutto per le stored procedure complesse o frequentemente utilizzate.

pivotare i dati tramite pivot

Pivotare i dati tramite l'operatore PIVOT in SQL Server è un'operazione utile quando si desidera trasformare righe di dati in colonne, aggregando e organizzando le informazioni in base a determinate condizioni. Questo processo di pivotaggio può semplificare l'analisi dei dati e rendere più leggibili i risultati ottenuti.

L'operatore PIVOT di SQL Server consente di specificare una colonna di input dalla quale estrarre i valori unici e di definire le colonne di output che verranno create in base a questi valori unici. Inoltre, è possibile specificare le operazioni di aggregazione da applicare sui dati durante la trasformazione.

Quando si utilizza l'operatore PIVOT, è comune avere una colonna di input che rappresenta le categorie o i fattori su cui si desidera pivotare i dati, ad esempio una colonna di anni, di regioni geografiche o di tipi di prodotti. Le righe corrispondenti a queste categorie diventeranno le nuove colonne nel risultato pivotato.

Per eseguire un'operazione di pivotaggio, è necessario specificare la colonna di input e le colonne di output desiderate. È anche possibile applicare funzioni di aggregazione, come SUM, COUNT o AVG, per calcolare i valori delle nuove colonne basate sui dati di input corrispondenti.

L'operatore PIVOT è disponibile in SQL Server ed è particolarmente utile quando si desidera analizzare i dati in modo più intuitivo e comprensibile, fornendo una visione riassuntiva delle informazioni presenti nella tabella di origine.

Tuttavia, è importante notare che l'operatore PIVOT è supportato solo nelle edizioni di SQL Server che lo consentono. Pertanto, assicurati di utilizzare un'edizione che supporti questa funzionalità quando esegui le operazioni di pivotaggio sui tuoi dati.

In conclusione, pivotare i dati tramite l'operatore PIVOT in SQL Server offre un modo efficace per trasformare, aggregare e organizzare le informazioni, semplificando l'analisi dei dati e migliorando la comprensione dei risultati ottenuti.

Esempio pratico :

Per pivotare i dati utilizzando SQL Server, puoi utilizzare l'operatore PIVOT. L'operatore PIVOT ti consente di trasformare righe in colonne, aggregando i dati in base a determinate condizioni.

Ecco un esempio di come puoi utilizzare l'operatore PIVOT in SQL Server:

Supponiamo di avere una tabella chiamata "Sales" con i seguenti dati:

Product	Category	Year	SalesAmount
A	X	2019	1000
A	X	2020	1500
A	Y	2019	2000
A	Y	2020	2500
B	X	2019	3000
B	X	2020	3500
B	Y	2019	4000
B	Y	2020	4500

Se vogliamo pivotare i dati sulla colonna "Year" e visualizzare le vendite totali per ogni combinazione di "Product" e "Category", possiamo utilizzare il seguente codice SQL:

SELECT Product, Category, [2019], [2020]
FROM
(
  SELECT Product, Category, Year, SalesAmount
  FROM Sales
) AS SourceTable
PIVOT
(
  SUM(SalesAmount)
  FOR Year IN ([2019], [2020])
) AS PivotTable;

Il risultato ottenuto sarà il seguente:

Product	Category	2019	2020
A	X	1000	1500
A	Y	2000	2500
B	X	3000	3500
B	Y	4000	4500

Come puoi vedere, i dati sono stati pivotati in modo da avere una colonna separata per ogni anno, mostrando le vendite totali corrispondenti.

Puoi personalizzare ulteriormente l'operazione di pivotaggio aggiungendo altre clausole come ORDER BY o WHERE per filtrare o ordinare i risultati secondo le tue esigenze.

Ricorda che l'operatore PIVOT è disponibile solo nelle edizioni di SQL Server che supportano la funzionalità.

-_____________

Ottimizzare la Query di Join

Query Originale:

SELECT * 
FROM Sales.SalesOrderHeader SOH
JOIN Sales.SalesOrderDetail SOD 
ON SOH.SalesOrderID = SOD.SalesOrderID

Ottimizzazione: seleziona solo i campi richiesti invece di tutti i campi (*)

Rimuovere Subquery Inutili

Query Originale:

SELECT SalesOrderID, OrderDate
FROM Sales.SalesOrderHeader
WHERE SalesOrderID IN (SELECT SalesOrderID FROM Sales.SalesOrderDetail)

Ottimizzazione: sostituisci la subquery con un INNER JOIN.

Evitare l'Uso di Operatori di Confronto Inefficaci
- Query Originale:
```
SELECT * 
FROM HumanResources.Employee 
WHERE (JobTitle NOT LIKE '%Marketing%')
```
- Ottimizzazione: se possibile, evita di utilizzare operatori LIKE con wildcard ad entrambi i lati.
Evitare SELECT DISTINCT Quando Non Necessario
- Query Originale:
```
SELECT DISTINCT FirstName, LastName
FROM Person.Person
```
- Ottimizzazione: usa GROUP BY invece di DISTINCT se stai facendo operazioni di aggregazione.
Sostituire UNION con UNION ALL quando sia appropriato
- Query Originale:
```
SELECT City FROM Person.Address
UNION
SELECT City FROM Person.AddressType
```
- Ottimizzazione: usa UNION ALL se non ci sono duplicati o se i duplicati non sono un problema. UNION ALL è più veloce perché non richiede un'operazione di distinzione.

Ridurre l'Uso di OR

Query Originale:

SELECT * 
FROM Sales.SalesOrderHeader
WHERE SalesOrderID = 500 OR SalesOrderID = 600

Ottimizzazione: usa IN al posto di OR se possibile.

Rimuovere Funzioni dalla Clausola WHERE
- Query Originale:
```
SELECT * 
FROM Sales.SalesOrderHeader
WHERE YEAR(OrderDate) = 2014
```
- Ottimizzazione: se possibile, evita di utilizzare funzioni in WHERE.
Utilizzare l'Indice su Colonne Utilizzate nelle Clausole JOIN
- Query Originale:
```
SELECT * 
FROM Sales.SalesOrderHeader SOH
JOIN Sales.SalesOrderDetail SOD 
ON SOH.SalesOrderID = SOD.SalesOrderID
```
- Ottimizzazione: assicurati che SalesOrderID sia indicizzato.
Evitare l'Uso di IS NULL
- Query Originale:
```
SELECT * 
FROM Sales.SalesOrderHeader
WHERE SalesPersonID IS NULL
```
- Ottimizzazione: se possibile, evita l'uso di IS NULL nelle clausole WHERE.
Utilizzare l'Indice su Colonne Ordinate
- Query Originale:
```
SELECT * 
FROM Sales.SalesOrderHeader
ORDER BY OrderDate
```
- Ottimizzazione: assicurati che OrderDate sia indicizzato.
Evitare Conversioni Implicite di Tipo
- Query Originale:
```
SELECT * 
FROM Sales.SalesOrderDetail
WHERE ProductID = '680'
```
- Ottimizzazione: assicurati che il tipo di dati della colonna corrisponda al tipo di dati della tua clausola WHERE.
Ottimizzare la Clausola TOP
- Query Originale:
```
SELECT TOP 100 * 
FROM Sales.SalesOrderDetail
ORDER BY OrderQty DESC
```
- Ottimizzazione: utilizza la clausola WHERE per filtrare i risultati prima di utilizzare TOP.
Ottimizzare le Query Aggregative
- Query Originale:
```
SELECT AVG(OrderQty) 
FROM Sales.SalesOrderDetail
```
- Ottimizzazione: se possibile, riduci il set di dati su cui viene eseguita l'aggregazione.
Ottimizzare l'Uso di BETWEEN
- Query Originale:
```
SELECT * 
FROM Sales.SalesOrderHeader
WHERE OrderDate BETWEEN '2005-07-01' AND '2005-07-31'
```
- Ottimizzazione: l'uso di BETWEEN può essere inefficiente con i tipi di dati datetime a causa della precisione ai millisecondi. Potrebbe essere meglio utilizzare >= e < con il primo giorno del mese successivo.

Ottimizzare le Query con Clausola EXISTS

Query Originale:

SELECT * 
FROM Sales.SalesOrderHeader SOH
WHERE EXISTS (SELECT 1 FROM Sales.SalesOrderDetail SOD WHERE SOH.SalesOrderID = SOD.SalesOrderID AND SOD.OrderQty > 100)

Ottimizzazione: considera l'uso di JOIN invece di EXISTS se appropriato.

Ridurre l'Uso di Funzioni Non Deterministiche
- Query Originale:
```
SELECT * 
FROM Sales.SalesOrderHeader
WHERE OrderDate = GETDATE()
```
- Ottimizzazione: se possibile, evita di utilizzare funzioni non deterministiche nelle clausole WHERE.

Utilizzare JOIN invece di IN

Query Originale:

SELECT * 
FROM Sales.SalesOrderHeader
WHERE SalesOrderID IN (SELECT SalesOrderID FROM Sales.SalesOrderDetail)

Ottimizzazione: considera l'uso di JOIN invece di IN.

Ottimizzare l'Uso di Funzioni Scalar
- Query Originale:
```
SELECT dbo.MyFunction(ProductID) 
FROM Production.Product
```
- Ottimizzazione: se possibile, evita di utilizzare funzioni scalar nella SELECT.
Ridurre l'Uso di Clausola HAVING
- Query Originale:
```
SELECT ProductID, SUM(OrderQty)
FROM Sales.SalesOrderDetail
GROUP BY ProductID
HAVING SUM(OrderQty) > 100
```
- Ottimizzazione: se possibile, riduci l'uso della clausola HAVING filtrando i dati prima dell'ag

gregazione.

Ottimizzare l'Uso di LEFT JOIN
- Query Originale:
```
SELECT * 
FROM Sales.SalesOrderHeader SOH
LEFT JOIN Sales.SalesOrderDetail SOD 
ON SOH.SalesOrderID = SOD.SalesOrderID
```
- Ottimizzazione: considera se un INNER JOIN potrebbe essere più appropriato. Inoltre, evita di utilizzare SELECT * quando utilizzi JOIN.

mrmagicalsoftware / advanced-sql-concepts Goto Github PK