Photogallery Movies & audiobooks Forum Home Search

Go Back   Russian America - Форум Русских Иммигрантов > INTERNET AND TECHNOLOGY > интернет и компьютеры > Unix


Unix обсуждения всего, что связано с этой замечательной операционной системой

Reply
 
LinkBack Thread Tools Display Modes
  #1 (permalink)  
Old 04-22-2008, 10:13 PM
Ulitka's Avatar  
Join Date: Oct 2003
Location: USA
Posts: 6,767
Thanks: 152
Thanked 172 Times in 134 Posts
Rep Power: 3762
Ulitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant future
Default HOWTO: wget, lynx, awk - parsing html pages for rapidshare links

HOWTO: parsing html pages for rapidshare links using wget, lynx, awk, egrep

большинство фильмов и книг на этом сайте было добыто при помощи rapidshare.com и командной строки linux. Ниже я хочу рассказать, какие команды были для этого использованы.

самый благоприятный случай, это когда у вас есть линк, ведущий в директорию того или иного пользователя на rapidshare.com, к примеру, вот такой:
Code:
http://rapidshare.com/users/JI39C
"разобрать" подобного рода страничку очень легко, используя текстовый браузер lynx и команды grep и awk:

Code:
lynx -dump http://rapidshare.com/users/JI39C|egrep rapidshare.*\.rar|awk {'print $2'} > url.list.txt
получив список файлов в таком вот "чистом" виде:
Code:
http://rapidshare.com/files/41973330/Pover.v.Mechtu._1985_.rar
http://rapidshare.com/files/41973085/Music.from.Movies._1994_.part2.rar
http://rapidshare.com/files/41973417/Neset.Menya.Techenie._1996_.rar
http://rapidshare.com/files/41973427/Dolgozhdanny.Samolet._1986_.rar
http://rapidshare.com/files/41973455/Music.from.Movies._1994_.part1.rar
http://rapidshare.com/files/41973321/Ot.Pechali.Do.Radosti._1987_.rar
http://rapidshare.com/files/41973066/Bonus.rar
http://rapidshare.com/files/41973574/Zerkalo._1996_.rar
http://rapidshare.com/files/41973315/Krysha.Doma.Tvoego._1983_.rar
http://rapidshare.com/files/41973411/Lunnaya.Dorozhka._1996_.rar
мы можем использовать его как источник данных для команды, которая будет загружать файлы с серверов rapidshare. Если у вас есть аккаунт на rapidshare.com то можно использовать следующий скрипт для загрузки:
Code:
#!/bin/bash
usage="Usage: `basename $0` [file]"
if [ $# -ne 1 ] ; then echo $usage; exit 1; fi
username="username"
password="password"
wget --user=$username --password=$password -i $1
сохраните данный скрипт в файле, скажем rapida, сделайте его выполняемым,
Code:
chmod 755 rapida;mv rapida /your/path
поместите в директорию, находящуюся в вашем system path и вы теперь имеете возможность, находясь в любой директории, загружать туда файлы в автоматическом режиме, используя вот такую команду:
Code:
#rapida url.list.txt
после того, как процесс выгрузки заданного вами списка завершился, вы можете автоматически же разархивировать все загруженные файлы при помощи одной команды. Представьте, если у вас в директрии содержится 100 и более архивных файлов, сколько времени у вас займет распаковать их каждый по отдельности?
Code:
for files in `ls|egrep "[^1-9]*1\.rar|[^0-9]\.rar"`;do rar -y x $files;done
код, приведенный выше, немного громоздкий, но зато достаточно универсальный, по крайней мере для тех архивов, которые встречались мне последнее время. Если у вас в директории ТОЛЬКО многотомные архивы из более чем 10 томов, то команда может быть короче:
Code:
for files in `ls *part01.rar`;do rar -y x $files;done
часто возникает необходимость переименовать больше количество файлов по заданному шаблону. Создадим скрипт, который принимает в качестве параметров:
  1. расширение файлов
  2. часть, которую нужно заменить
  3. часть, на которую нужно заменить

далее, сохраним наш скрипт в файле renamer.sh, сделаем его исполняемым:

Code:
#!/bin/bash
mask=$1
pattern=$2
replace=$3
    for files in `ls -A *$mask`;
        do
          source=$files
          dest=`echo $files|sed "s/$pattern/$replace/"`
          mv $source $dest;
        done
и, к примеру, чтобы переименовать кучу файлов с расширением mp3 в другую кучу, но заменив в имени файла один куск на другой, выполним следующую команду:

Code:
./renamer.sh mp3 oldname newname
часто возникает ситуация, когда нужно сравнить два текстовых файла с линками и выделить только разницу. Для этого следует использовать команду diff вот так:
Code:
diff file1 file2
еще бывает, что в процессе загрузки большого списка файлов вы превысили ваш лимит в 25 гигабайт за 5 дней (это текущий лимит на rapidshare.com). В таком случае все линки сверх лимита будут сохранены на диске в файлах с нулевым или иным, но очень небольшим размером. Если потом запустить скрипт снова, то новые архивы будут переписаны в формате filename.ext.1 filename.ext.2 filename.ext.3 и так делее.
Для того, чтобы выбрать из большого списка линков только те, которые в прошлый раз не были загружены, ножно выбрать все файлы малого размера, сравнить их имена с именами в первоначальном списке и сгенерировать новый листинг. Делаем это так:

Code:
for lines in `find . -size -10k|grep rar`;do cat full.list.txt|grep $lines;done > rest.txt
в результате мы получаем на выходе новый список, но только с теми файлами, коотрые не были загружены в прошлый раз.

встречаются и другие ситуации, но я пока вспомнил только самые "популярные". Возможно, данная тема будет иметь продолжение.
__________________
looking into the sky is looking into the past...

Last edited by Ulitka; 04-23-2008 at 08:17 AM.
Reply With Quote
  #2 (permalink)  
Old 04-24-2008, 10:48 AM
Ulitka's Avatar  
Join Date: Oct 2003
Location: USA
Posts: 6,767
Thanks: 152
Thanked 172 Times in 134 Posts
Rep Power: 3762
Ulitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant futureUlitka has a brilliant future
Default Re: HOWTO: wget, lynx, awk - parsing html pages for rapidshare links

скрипт, который помогает автоматически загружать списки файлов с rapidshare.com (я его описал в предыдущем сообщении) можно немного усовершенствовать. Дело в том, что в том виде скрипт работает ТОЛЬКО с файлами, содержащими списки, а если возникает необходимость загрузить всего один файл, то приходилось пароль и логин вводить вручную или создавать файл с одним единственным линком внутри. Добавив в скрипт проверку передаваемого параметра ( файл это с линками или строка (url) ), мы сделаем наш скрипт более удобным и функциональным:

Code:
#!/bin/bash
usage="Usage: `basename $0` [file]|url (single file)"
if [ $# -lt 1 ] ; then echo $usage; exit 1; fi
username="username"
password="password"
auth=" --user=$username --password=$password"
if [ -f $1 ] && [ -s $1 ]; then
   wget $auth -i $1
else
   wget $auth $1
fi
__________________
looking into the sky is looking into the past...
Reply With Quote
Reply

Bookmarks


Currently Active Users Viewing This Thread: 1 (0 members and 1 guests)
 
Thread Tools
Display Modes

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off
Trackbacks are On
Pingbacks are On
Refbacks are On

Similar Threads
Thread Thread Starter Forum Replies Last Post
Howto: Как получить МБА в США Piter образование по-американски 10 02-06-2008 12:46 PM
HTML 6.0 - Проект новационной технологии в Web computer20 интернет и компьютеры 1 02-06-2007 06:24 AM


All times are GMT -4. The time now is 04:07 PM.

*.ape arvo part rapidshare avi to mov carfax.com dv 2010 dv-2010 filmi filmi online free calls russia free calls to russia garmin карты скачать green card job offer ken park middle name money order online стратегии russkie filmi russkie filmi online torens url радиостанций www.cars.com znacomstva Александр Маршал Американские женские имена Африканская музыка ПОСОЛЬСТВО США В УЗБЕКИСТАНЕ РАБОТА БЕЗ ОБРАЗОВАНИЯ Таблица измерений американские имена американские чаты американское посольство в киеве арабески группа беременность в картинках военные карты грузинские короткометражки группа space гсвг дискотечная музыка империя добра империя добра скачать как жить 24 часа в сутки как звонить в москву как обмануть банкомат как позвонить в казахстан какой ноутбук лучше киевавиа малосольные огурчики музыка для бега мультфильм Анастасия перевод денег в сша песни про любовь песня из сериала татьянин день поделки из овощей поиск людей в США программа для скачивания фильмов программы для скачивания фильмов работа в Чикаго работа в минске работа на аляске руководство по excel русские мультики русские песни о любви сгорел на солнце сказки онлайн скачать карты garmin скачать карты для garmin скачать программу для скачивания фильмов татьянин день песня торенс форум русских в америке хочу в америку чем проигрывать flac эмиграция в америку

Powered by vBulletin® Version 3.7.2
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0 RC7

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121