IMPORTXML関数 Googleスプレッドシート独自関数で外部ウェブページからXMLデータを取得

スポンサーリンク
スポンサーリンク

IMPORTXML関数について

IMPORTXMLの概要

ウェブページから特定のデータを抽出Googleスプレッドシート関数

=IMPORTXML( URL, XPathクエリ )

概要 IMPORTXML関数は、指定したウェブページのHTMLやXML構造から、XPathを使用して特定のデータを取得するための関数です。

  • カスタマイズ性が高く、必要な部分のみを抽出できます。
  • リアルタイムのウェブデータの取得に便利です。
  • 特定の情報をピンポイントで取得する際に役立ちます。

IMPORTXMLはどのような時に使用するか

  • ウェブページから特定の情報(タイトル、価格、日付など)を取得したい場合。
  • 動的に生成されない静的なデータを抽出したい場合。
  • 特定のHTML要素や属性を抽出してデータとして活用したい場合。

IMPORTXMLの使い方

以下のtableを使ってIMPORTXML関数の基本的な使い方を説明します。

  A B C
1 説明 結果
2 ウェブページのタイトルを取得 =IMPORTXML(“https://example.com”, “//title”) ページタイトル
3 特定のリンクを取得 =IMPORTXML(“https://example.com”, “//a/@href”) リンクURL

結果

  • セルB2では、指定したウェブページのタイトルが表示されます。
  • セルB3では、指定したウェブページ内のリンクURL一覧が取得されます。

IMPORTXMLの応用例

IMPORTXML関数を使うことで、特定のデータ取得を自動化できます。以下は応用例です。

  A B C
1 応用例 結果
2 最新の為替レートを取得 =IMPORTXML(“https://example.com/forex”, “//rate[@id=’USD-EUR’]”) USDからEURのレート
3 商品の価格を抽出 =IMPORTXML(“https://example.com/product”, “//span[@class=’price’]”) 商品の価格

注意点

  • 指定したウェブページがHTTPSでない場合、データが取得できないことがあります。
  • JavaScriptで生成される動的コンテンツは取得できません。
  • XPathクエリの構文エラーに注意してください。
  • ウェブサイトの規約を確認し、適切に使用してください。

まとめ

  • IMPORTXML関数は、ウェブページから必要な情報を取得する非常に強力なツールです。
  • XPathを利用することで柔軟なデータ抽出が可能です。
  • リアルタイムデータの活用に最適ですが、ウェブサイトの構造変更や規約に注意が必要です。