如何將數據從Pandas DataFrame寫入HTML文件,今天番茄加速就來講一下。
讀取HTML
我們可以使用read_html()函數讀取HTML文件的表。此函數將HTML文件的表作為Pandas DataFrames讀取。它可以從文件或URL中讀取。
從文件中讀取HTML數據
本文中,我們將使用一組輸入數據。一個包含程式語言及其創建年份的表。另一個表中有土地面積及其成本(美元)。
將以下HTML內容保存在名為table_data.html的文件中:
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>Table Data</title>
</head>
<body>
<table>
<thead>
<tr>
<th>Programming Language</th>
<th>Creator</th>
<th>Year</th>
</tr>
</thead>
<tbody>
<tr>
<td>C</td>
<td>Dennis Ritchie</td>
<td>1972</td>
</tr>
<tr>
<td>Python</td>
<td>Guido Van Rossum</td>
<td>1989</td>
</tr>
<tr>
<td>Ruby</td>
<td>Yukihiro Matsumoto</td>
<td>1995</td>
</tr>
</tbody>
</table>
<table>
<thead>
<tr>
<th>
Area (sq.ft)
</th>
<th>
Price (USD)
</th>
</tr>
</thead>
<tbody>
<tr>
<td>
12000
</td>
<td>
500
</td>
</tr>
<tr>
<td>
32000
</td>
<td>
700
</td>
</tr>
</tbody>
</table>
</body>
</html>
Pandas 需要另一個名為lxml的庫的幫助來解析HTML和XML文件。為了使read_html()函數正常工作,您需要安裝lxml:
$ pip install lxml
一旦安裝了lmxl,我們就可以使用read_html()函數。它返回一個DataFrames列表,其中每個DataFrame是給定HTML文件的整個表元素。我們通過索引列表將每個表作為DataFrame進行讀取。