今天小编就为大家分享一篇python 获取页面表格数据存放到csv中的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

获取单独一个table,代码如下:

#!/usr/bin/env python3
# _*_ coding=utf-8 _*_
import csv
from urllib.request import urlopen
from bs4 import BeautifulSoup
from urllib.request import HTTPError
try:
  html = urlopen("http://en.wikipedia.org/wiki/Comparison_of_text_editors")
except HTTPError as e:
  print("not found")
bsObj = BeautifulSoup(html,"html.parser")
table = bsObj.findAll("table",{"class":"wikitable"})[0]
if table is None:
  print("no table");
  exit(1)
rows = table.findAll("tr")
csvFile = open("editors.csv",'wt',newline='',encoding='utf-8')
writer = csv.writer(csvFile)
try:
  for row in rows:
    csvRow = []
    for cell in row.findAll(['td','th']):
      csvRow.append(cell.get_text())
    writer.writerow(csvRow)
finally:
  csvFile.close()

获取所有table,代码如下:

#!/usr/bin/env python3
# _*_ coding=utf-8 _*_
import csv
from urllib.request import urlopen
from bs4 import BeautifulSoup
from urllib.request import HTTPError
try:
  html = urlopen("http://en.wikipedia.org/wiki/Comparison_of_text_editors")
except HTTPError as e:
  print("not found")
bsObj = BeautifulSoup(html,"html.parser")
tables = bsObj.findAll("table",{"class":"wikitable"})
if tables is None:
  print("no table");
  exit(1)
i = 1
for table in tables:
  fileName = "table%s.csv" % i
  rows = table.findAll("tr")
  csvFile = open(fileName,'wt',newline='',encoding='utf-8')
  writer = csv.writer(csvFile)
  try:
    for row in rows:
      csvRow = []
      for cell in row.findAll(['td','th']):
        csvRow.append(cell.get_text())
      writer.writerow(csvRow)
  finally:
    csvFile.close()
  i += 1

以上这篇python 获取页面表格数据存放到csv中的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持爱安网。

最新资讯
消息称字节跳动2020年营收350亿美元 正寻求部分业务在港上市

消息称字节跳动2020年

知情人士透露,抖音母公司字节跳动有限公司(ByteDance )去
分析师预计特斯拉Q4将保持盈利能力 调整后每股收益将显著增长

分析师预计特斯拉Q4将

分析师预计,特斯拉将在2020年第四季度保持盈利能力,该公
华为云与计算BG人事调整 余承东兼任总裁

华为云与计算BG人事调

1月27日下午消息,华为今日内部发文宣布云与计算BG人事
特斯拉研究伙伴杰夫·达恩:将帮助特斯拉降低电池成本

特斯拉研究伙伴杰夫·

著名电池研究专家、特斯拉研究合作伙伴杰夫•达恩(Jef
响应“就地过年”:申通给快递员人均发2500元现金奖励

响应“就地过年”:申通

申通给出针对一线快递员的关怀政策:不打烊期间,由申通总
贴片“纹身”搞定疾病预警:石墨烯电子皮肤展现光明前景

贴片“纹身”搞定疾病

仅需在皮肤表面贴附一片薄薄的“纹身”,便可以实现心律
最新文章
在pycharm中为项目导入anacodna环境的操作方法

在pycharm中为项目导

这篇文章主要介绍了在pycharm中为项目导入anacodna环
tensorflow的ckpt及pb模型持久化方式及转化详解

tensorflow的ckpt及pb

今天小编就为大家分享一篇tensorflow的ckpt及pb模型持
PyTorch笔记之scatter()函数的使用

PyTorch笔记之scatter

这篇文章主要介绍了PyTorch笔记之scatter()函数的使用
python3实现网页版raspberry pi(树莓派)小车控制

python3实现网页版ras

这篇文章主要为大家详细介绍了python3实现网页版raspb
完美解决pycharm导入自己写的py文件爆红问题

完美解决pycharm导入

今天小编就为大家分享一篇完美解决pycharm导入自己写
pycharm内无法import已安装的模块问题解决

pycharm内无法import

今天小编就为大家分享一篇pycharm内无法import已安装