IMPORTXML関数について
IMPORTXMLの概要
ウェブページから特定のデータを抽出Googleスプレッドシート関数 | ||
=IMPORTXML( URL, XPathクエリ ) 概要 IMPORTXML関数は、指定したウェブページのHTMLやXML構造から、XPathを使用して特定のデータを取得するための関数です。 |
||
|
IMPORTXMLはどのような時に使用するか
- ウェブページから特定の情報(タイトル、価格、日付など)を取得したい場合。
- 動的に生成されない静的なデータを抽出したい場合。
- 特定のHTML要素や属性を抽出してデータとして活用したい場合。
IMPORTXMLの使い方
以下のtableを使ってIMPORTXML関数の基本的な使い方を説明します。
A | B | C | |
---|---|---|---|
1 | 説明 | 式 | 結果 |
2 | ウェブページのタイトルを取得 | =IMPORTXML(“https://example.com”, “//title”) | ページタイトル |
3 | 特定のリンクを取得 | =IMPORTXML(“https://example.com”, “//a/@href”) | リンクURL |
結果
- セルB2では、指定したウェブページのタイトルが表示されます。
- セルB3では、指定したウェブページ内のリンクURL一覧が取得されます。
IMPORTXMLの応用例
IMPORTXML関数を使うことで、特定のデータ取得を自動化できます。以下は応用例です。
A | B | C | |
---|---|---|---|
1 | 応用例 | 式 | 結果 |
2 | 最新の為替レートを取得 | =IMPORTXML(“https://example.com/forex”, “//rate[@id=’USD-EUR’]”) | USDからEURのレート |
3 | 商品の価格を抽出 | =IMPORTXML(“https://example.com/product”, “//span[@class=’price’]”) | 商品の価格 |
注意点
- 指定したウェブページがHTTPSでない場合、データが取得できないことがあります。
- JavaScriptで生成される動的コンテンツは取得できません。
- XPathクエリの構文エラーに注意してください。
- ウェブサイトの規約を確認し、適切に使用してください。
まとめ
- IMPORTXML関数は、ウェブページから必要な情報を取得する非常に強力なツールです。
- XPathを利用することで柔軟なデータ抽出が可能です。
- リアルタイムデータの活用に最適ですが、ウェブサイトの構造変更や規約に注意が必要です。