IMPORTXML函数:Google表格独有函数,用于从外部网页获取XML数据

スポンサーリンク
スポンサーリンク

关于IMPORTXML函数

IMPORTXML的简介

从网页提取特定数据Google表格函数

=IMPORTXML( URL, XPath查询 )

简介 IMPORTXML函数通过指定的XPath查询,从给定的网页HTML或XML结构中提取数据。

  • 高度自定义,能够精准提取需要的数据。
  • 适合实时获取网页数据。
  • 特别适用于提取特定信息(如标题、价格、日期等)。

IMPORTXML的适用场景

  • 从网页提取特定信息(如标题、价格、日期等)。
  • 提取静态而非动态生成的数据。
  • 将HTML元素或属性转化为可用数据。

IMPORTXML的使用方法

以下是IMPORTXML函数的基本用法示例。

  A B C
1 说明 公式 结果
2 获取网页标题 =IMPORTXML(“https://example.com”, “//title”) 页面标题
3 提取特定链接 =IMPORTXML(“https://example.com”, “//a/@href”) 链接URL

结果

  • 在B2单元格中显示指定网页的标题。
  • 在B3单元格中提取指定网页中的链接URL列表。

IMPORTXML的应用示例

IMPORTXML函数可以自动化特定数据的获取。以下是一些应用示例。

  A B C
1 应用示例 公式 结果
2 获取最新汇率 =IMPORTXML(“https://example.com/forex”, “//rate[@id=’USD-EUR’]”) 美元兑欧元汇率
3 提取商品价格 =IMPORTXML(“https://example.com/product”, “//span[@class=’price’]”) 商品价格

注意事项

  • 指定的网页必须为HTTPS,否则可能无法获取数据。
  • 动态生成的内容(通过JavaScript加载)无法提取。
  • 确保XPath查询语法正确,否则会返回错误。
  • 使用前请遵守网页的使用条款,避免违规抓取。

总结

  • IMPORTXML函数是从网页获取特定信息的强大工具。
  • 通过XPath实现灵活的数据提取。
  • 适合实时数据利用,但需注意网页结构变化和使用规范。