Как получить текстовое (в частности, табличное) содержимое веб-страницы

Предположим, что перед нами стоит задача. Есть страница Google Analytics с табличными значениями (Отчёт -> Демография -> Местоположение).

табличные данные, Google Analytics, статистика посещений

Необходимо вытащить оттуда перечень стран.

Как же эффективнее и проще всего получить текстовое содержимое нашей веб-страницы с табличными данными?

Данные подгружаются на страницу, судя по всему, через ajax, так что опция Просмотр кода страницы (View page source) ничего не даст.

Пробуем вариант «скопировать всё и вставить напрямую в лист Excel».

В результате получим табличные данные с исходным форматированием:

таблица, табличные данные, excel, исходное форматирование

Если нужно получить табличные данные без сохранения форматирования, то копированный текст сначала пропускаем через Блокнот (Notepad):

скопированные в Блокнот табличные данные

И потом уже из Блокнота копируем всё и вставляем в Excel:

готовые к работе табличные данные

Задача решена; теперь извлечь столбец с названиями стран не составляет никакого труда.

По пути встретил «трудности гуглоперевода»:

Гернси, остров, шерсть, шерстяная фуфайка

:)

0 комментариев

Оставить комментарий