IMPORTXML: Obtén datos XML de páginas web externas en Google Sheets

スポンサーリンク
スポンサーリンク

Acerca de la función IMPORTXML

Descripción general de IMPORTXML

Extrae datos específicos de páginas webFunción de Google Sheets

=IMPORTXML( URL, Consulta XPath )

Descripción La función IMPORTXML permite obtener datos específicos de la estructura HTML o XML de una página web utilizando consultas XPath.

  • Alta personalización para extraer únicamente la información necesaria.
  • Ideal para obtener datos en tiempo real desde páginas web.
  • Útil para capturar información específica de elementos HTML o atributos.

¿Cuándo usar IMPORTXML?

  • Cuando necesitas extraer información específica (títulos, precios, fechas, etc.) de una página web.
  • Para trabajar con datos estáticos generados directamente en la página web (no dinámicos).
  • Cuando deseas capturar elementos HTML o atributos particulares para usarlos como datos.

Cómo usar IMPORTXML

El siguiente ejemplo explica cómo utilizar la función IMPORTXML.

  A B C
1 Descripción Fórmula Resultado
2 Obtener el título de una página web =IMPORTXML(“https://example.com”, “//title”) Título de la página
3 Obtener enlaces específicos =IMPORTXML(“https://example.com”, “//a/@href”) Lista de URLs

Resultado

  • En la celda B2, se mostrará el título de la página web especificada.
  • En la celda B3, se obtendrá una lista de enlaces (URLs) presentes en la página.

Ejemplos avanzados de IMPORTXML

La función IMPORTXML facilita la automatización de la obtención de datos. Aquí algunos ejemplos avanzados:

  A B C
1 Ejemplo Fórmula Resultado
2 Obtener la tasa de cambio actual =IMPORTXML(“https://example.com/forex”, “//rate[@id=’USD-EUR’]”) Tasa USD-EUR
3 Extraer el precio de un producto =IMPORTXML(“https://example.com/product”, “//span[@class=’price’]”) Precio del producto

Precauciones al usar IMPORTXML

  • IMPORTXML no puede extraer datos de páginas que utilizan contenido dinámico generado con JavaScript.
  • Solo funciona con páginas HTTPS; las páginas HTTP no son compatibles.
  • Verifica la estructura del XPath para evitar errores en la consulta.
  • Respeta los términos de uso de los sitios web antes de extraer sus datos.

Conclusión

  • La función IMPORTXML es una herramienta potente para extraer datos específicos de páginas web.
  • Permite un uso flexible del XPath para obtener información personalizada.
  • Es ideal para trabajar con datos en tiempo real, pero debes considerar posibles cambios en la estructura de las páginas web o restricciones legales.