Читати статтю
Знадобилося виконати парсинг всіх зображень з одного ресурсу.
На допомогу прийшли регулярні вираження і звичайно ж PHP (не найбільша і наймогутніша мова для парсинга необхідної інформації, але цілком підходить для цих цілей). Якщо трохи видозмінити код – можна вибирати з потрібної сторінки абсолютно будь-які дані, посилання (внутрішні, зовнішні) або електронні адреси або файли – і взагалі все, що душа забажає.
$data = ''; // HTML сторінка, наприклад отримана за допомогою file_get_content():
$images = array();
preg_match_all('/(img|src)=("|\')[^"\'>]+/i', $data, $media);
unset($data);
$data = preg_replace('/(img|src)("|\'|="|=\')(.*)/i', "$3", $media[0]);
foreach ($data as $url) {
$info = pathinfo($url);
if (isset($info['extension'])) {
if (($info['extension'] == 'jpg') ||
($info['extension'] == 'jpeg') ||
($info['extension'] == 'gif') ||
($info['extension'] == 'png'))
array_push($images, $url);
}
}
Можна подивитися наш зібраний масив:
print_r($images);
Далі можна робити з цим масивом те, що потрібно в поставленому завданні.