许虎虎 开发者工具集

HTML 转 TSV

在此处输入您的 html:
结果:
HTML 转 TSV

将 HTML 表格 转换为 TSV(Tab-Separated Values) 格式的过程,可以通过以下步骤进行:

1. 理解 HTML 表格结构
HTML 表格通常由 <table>, <tr>, <td> 标签组成:

html

<table>
<tr>
<th>Name</th>
<th>Age</th>
</tr>
<tr>
<td>John</td>
<td>25</td>
</tr>
<tr>
<td>Jane</td>
<td>30</td>
</tr>
</table>
2. 目标格式
TSV 格式是由 Tab 键分隔的值,每行代表表格的一行。例如,以上表格转换为 TSV 格式后应该是:

nginx

Name Age
John 25
Jane 30
3. 转换步骤
下面是如何使用 JavaScript 和 Python 分别进行 HTML 转 TSV 的代码示例。

JavaScript 代码(适用于浏览器环境)
你可以使用 JavaScript 获取 HTML 表格内容,并转换为 TSV 格式。

javascript

function tableToTSV(tableId) {
const table = document.getElementById(tableId);
let tsv = '';

for (let row of table.rows) {
let rowData = [];
for (let cell of row.cells) {
rowData.push(cell.innerText.trim());
}
tsv += rowData.join('\t') + '\n'; // 使用制表符分隔,并添加换行符
}

return tsv;
}

// 示例:调用函数并在控制台输出
console.log(tableToTSV('myTable'));
假设 HTML 中有一个表格:

html

<table id="myTable">
<tr>
<th>Name</th>
<th>Age</th>
</tr>
<tr>
<td>John</td>
<td>25</td>
</tr>
<tr>
<td>Jane</td>
<td>30</td>
</tr>
</table>
调用 tableToTSV('myTable') 将输出:

nginx

Name Age
John 25
Jane 30
Python 代码(适用于服务器端或处理 HTML 文件)
如果你有一个 HTML 文件,并且想使用 Python 进行处理,可以用 BeautifulSoup 来解析 HTML,再将其转换为 TSV 格式。

首先,你需要安装 beautifulsoup4 库:

bash

pip install beautifulsoup4
然后使用如下代码:

python

from bs4 import BeautifulSoup

def html_to_tsv(html_content):
soup = BeautifulSoup(html_content, 'html.parser')
table = soup.find('table')

tsv = ""

for row in table.find_all('tr'):
cells = row.find_all(['td', 'th'])
tsv += '\t'.join(cell.get_text(strip=True) for cell in cells) + '\n'

return tsv

# 示例:读取 HTML 文件并转换为 TSV
html_content = '''<table>
<tr>
<th>Name</th>
<th>Age</th>
</tr>
<tr>
<td>John</td>
<td>25</td>
</tr>
<tr>
<td>Jane</td>
<td>30</td>
</tr>
</table>'''

tsv = html_to_tsv(html_content)
print(tsv)
输出:

nginx

Name Age
John 25
Jane 30
4. 总结
JavaScript 可以在浏览器中直接获取 HTML 表格并转换为 TSV,适用于前端应用。
Python 配合 BeautifulSoup 可以解析 HTML 文件并转换为 TSV,适用于后端或本地文件处理。