Экран соскоб ваш путь в RSS

Введение
RSS является одним из горячих технологий на данный момент, и даже больших веб-издателей (такие, как New York Times) получают в RSS, а также. Тем не менее, Есть еще много сайтов, которые не имеют RSS-каналы.


Если вы все еще хотите, чтобы иметь возможность проверить эти веб-сайты в своей программе чтения, вы должны создать свой собственный RSS канал для тех веб-сайтов. Это может быть сделано автоматически с PHP, используя метод, называемый экран слом. Экран слом, как правило, с неодобрением, а это в основном используется для кражи содержимое с других сайтов.

Я лично считаю, что в этом случае, чтобы автоматически генерировать канал, экран слом не плохо. Теперь, на код!

Начало содержимого
В этой статье мы будем использовать PHPit в качестве примера, несмотря на тот факт, что PHPit уже RSS-каналы.

Мы хотим, чтобы создать канал из содержания перечисленных на главной странице. Первый шаг на экране соскоб становится полной страницы. В PHP это можно сделать очень легко, с помощью взрываться (файл ("", "[URL здесь ]")); Если ваш веб-сервер позволяет это. Если вы не можете использовать файл (), вам придется использовать другой способ получения страницы, например с использованием CURL библиотеки.

Теперь у нас есть контент, доступный, мы можем разобрать его на содержание с помощью некоторых регулярных выражений. Ключ к экрану соскоб ищет моделей, которые соответствуют содержанию, например, все элементы содержимого, завернутые в ы <div> "или нечто другое? Если вам удается успешно обнаружить модели, то вы можете использовать preg_match_all () для получения всех элементов контента.

Для PHPit, картины, которые соответствуют содержание <div classu003d"contentitem"> [Содержание здесь] <div>. Вы можете проверить это самостоятельно, выбрав на главной странице PHPit и просмотра источника.

Теперь у нас есть матч мы можем получить все содержимое элементов.

18 Февраля 2010, 12:02
Отзывы
Написать комментарий
capcha
Написать