數據連接是任何數據分析的常見要求。可能需要在單個源中連接來自不同表的數據,或者從多個源連接數據。
Tableau提供了使用“Data”菜單中提供的數據窗格來連接表的功能。
連接意味著組合關係資料庫中一個或多個表的列。它還創建一個可以保存為表的集合,或者可以按原樣使用它。
連接指定有五種類型:
- 交叉連接。
- 內部連接。
- 自然連接。
- 外連接。
- 左外連接。
- 右外連接。
- 完全外連接。
- 自連接。
1. 連接類型概述
連接部分用於組合來自兩個或多個表的行,基於它們之間的相關列。
1.交叉連接:交叉連接生成的行將第一個表中的每一行與第二個表中的每一行組合在一起。
2.內部聯接:內部聯接返回正在連接的表中的匹配行。
3.自然連接: 自然連接不使用任何比較運算符。它沒有連接方式。
如果兩個關係之間至少存在一個共同屬性,則只能執行自然連接。此外,屬性必須具有相同的名稱和域。自然連接適用於那些匹配屬性,其中兩個關係中的屬性值相同。
4.外連接:外連接是內連接的擴展形式。它返回正在連接的表的匹配行和非匹配行。
外連接的類型如下:
4.1.左外連接:左外連接返回正在連接的表中的匹配行,以及結果中左表的不匹配行,並將NULL值放在來自右表的屬性中。
4.2.右外連接:右外連接操作返回正在連接的表中的匹配行,以及結果中右表中的不匹配行,並將NULL值放在來自左表的屬性中。
4.3.全外聯接:完整外部聯接用於組合表。因此,它包含兩個表中的所有值。當表中的值與另一個表不匹配時,它將在數據網格中返回NULL值。
5.1.自聯接: 自聯接用於將表連接到自身。這意味著表的每一行都與自身以及表的每一行組合在一起。
2. 在Tableau中創建聯接
我們假設一個數據源Sample-superstore 來創建兩個表(如Orders和Returns)之間的連接。
- 轉到Data菜單,然後選擇連接下麵的Microsoft Excel選項。
- 然後選擇sample-superstore作為數據源,並單擊“Open”按鈕。
- 將數據源工作表中的Orders和Returns表拖到數據窗格中。然後,Tableau將自動在Orders和Returns表之間創建一個連接,以後可以根據所需的連接進行更改。
下麵的螢幕截圖顯示了使用Order id
字段在Orders和Returns表之間建立內部連接。
3. 在Tableau中編輯聯接類型
Tableau會自動在兩個表之間創建一種連接類型,但可以根據需要進行更改。
- 單擊顯示自動創建的連接的兩個圓圈的中間。
- 單擊後,將出現一個彈出窗口,其中顯示了所有四種類型的連接。
- 在下面的螢幕截圖中,可以看到所有連接,例如:
inner join
,left outer join
,right outer join
和full outer join
。
4. 如何在Tableau中編輯連接字段
可以通過單擊“數據源”選項來更改字段,以添加連接彈出窗口中可用的新連接子句。
選擇字段時,可以使用搜索文本框搜索字段。