[Tips] Como leer el HTML de una Pagina desde ASP.NET

Pregunta repetida, por lo tanto amerita post, acá te dejo el código y la explicación.

Para esto vamos a utilizar la clase WebClient de System.NET que nos provee métodos para enviar y recibir datos desde un recurso identificado mediante el URI. Luego a descargar los datos y dejarlos en un arreglo de Bytes para luego obtener el texto HTML encodeado. Por último este código HTML lo asignamos aun TextBox Multiline para ver el resultado.

El código necesario es simplemente:

Dim MyWebClient As New WebClient
Dim ArregloBytes() As Byte
ArregloBytes = MyWebClient.DownloadData(http://www.bing.com/)
Dim oUTF8 As New UTF8Encoding
resultado.Text = oUTF8.GetString(ArregloBytes)

image

Posteriormente puedes buscar cadenas de texto, en el caso que necesites “replicar” algunas cosillas, ejejeje.

Saludos!
Gonzalo

5 comentarios en “[Tips] Como leer el HTML de una Pagina desde ASP.NET”

  1. Esto funciona en visual Basic 2008?. tengo una aplicación escrita en visual Basic y deseo recorrer una tabla de resultados de una pagina web y obtener los valores de esa tabla para luego guardarlos en una base de datos.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *