將 HTML 轉換為 Markdown 是指將 HTML 格式的內容(例如標題、段落、列表等)轉換為簡潔的 Markdown 語法,以便更容易編寫和分享文本內容。Markdown 是一種輕量級的標記語言,具有簡單的語法,便於編寫格式化的文檔。
目標:將 HTML 轉換為 Markdown
HTML 轉 Markdown 的過程是從 HTML 元素提取其結構,並將其轉換為對應的 Markdown 格式。
轉換規則:
<h1>, <h2>, <h3>, ... 轉換為 Markdown 中的 # 標題語法。
<ul> 和 <ol> 轉換為無序列表或有序列表。
<p> 轉換為段落。
<a> 轉換為鏈接語法 [text](url)。
<b> 和 <strong> 轉換為 **text**(粗體)。
<i> 和 <em> 轉換為 *text*(斜體)。
<img> 轉換為圖片語法 。
假設的 HTML 示例:
html
<h1>Welcome to My Website</h1>
<p>This is a <b>bold</b> paragraph with an <i>italic</i> word and a <a href="https://example.com">link</a>.</p>
<ul>
<li>Item 1</li>
<li>Item 2</li>
<li>Item 3</li>
</ul>
目標 Markdown 格式:
markdown
# Welcome to My Website
This is a **bold** paragraph with an *italic* word and a [link](https://example.com).
- Item 1
- Item 2
- Item 3