Формируем список файлов картинок, которые встречаются в html-файле
В случае необходимости получения списка файлов из html-документа можно воспользоваться следующими решениями:
Долгий и некачественный способ
sed -n -e 's/.*<img src="\([^"]*\)".*/\1/p' source >dest
Быстрый и более качественный
ruby -ne 'puts $_.scan(/img src=\"(.[^"]*)/)' source >dest