Times выложили в интернет весь свой архив

Dim_Ka

Издание Times выложило в интернет цифровые копии всех своих выпусков, начиная с 1785 года. В настоящий момент архив бесплатен, затем за контент придется платить.
Архив доступен по адресу http://archive.timesonline.co.uk/tol/archive/ и предлагает невероятную возможность познакомиться с развитием мировой истории глазами очевидцев. Корреспонденты Times описывали события от гильотинирования Марии Антуанетты, битвы при Ватерлоо, убийства президента Линкольна, зверства Джека-потрошителя до убийства Эрцгерцога Фердинанда, Великой депрессии, самоубийства Гитлера и многих, многих других.
Судя по тому, что сайт в настоящее время работает с некоторыми затруднениями, он пользуется огромной популярностью.

asgrig

афигенна

gribanov

В настоящий момент архив бесплатен, затем за контент придется платить.
было бы хорошо, чтобы его кто нибудь выкачал весь, пока он бесплатен :)

asgrig

зачем?

gribanov

вещь любопытная
чтоб в будущем не париться по поводу оплаты

asgrig

а тебе не кажется, что хранить и каталогизировать всё это гораздо дороже и муторнее, чем заплатить, когда понадобится?
Вот, блин, психология совка...

nefirma

Мне так не кажется. И "совок" тут ни при чём.

Dim_Ka

было бы хорошо, чтобы его кто нибудь выкачал весь, пока он бесплатен
Либрусековцы уже качают. Пока выкачано порядка 18 гигов - это архив за первый 31 год. Всего получается около 120 гигов будет. Скрипт сюда запосить?

nefirma

Давай :cool:

Dim_Ka

Формат jpg, можно тянуть 1706х2734 (как в скрипте сейчас размер - около 370 к
можно 1500х2400 - в переменной $res Заменить 80 на 50. Размер - около 700 к.
можно 900х1440 - заменить 80 на 19. Размер - около 600 к.
Как все это связано с качеством - черт его знает. Поглядите, что по вкусу придется...
use Date::Calc qw (:all);
use LWP::Simple;

@mon = ('JAN', 'FEB', 'MAR', 'APR', 'may', 'jun', 'jul', 'aug', 'sep', 'oct', 'nov', 'dec');

$baseurl = 'http://archive.timesonline.co.uk/archiveimg/paid/';
$year = 1785;
$month = 1;
$day = 1;
$fileprefix = '0FFO';
$res = '80';

$page = 1;

$lastYear = 1985;

while (1) {
$urlMon = sprintf("%02d", $month);
$urlDay = sprintf("%02d", $day);
$nameMon = uc $mon[$month-1];
# $nameDay = sprintf("%02d", $day);
$urlPage = sprintf("%02d", $page);

$namePage = $nameDay = sprintf("%03d", $page);

$fname = "$fileprefix-$year-$nameMon$urlDay-$namePage-$res.jpg";
$url = "$baseurl$year/$urlMon/$urlDay/$urlPage/$fname";
print "$url\n";
$file = get($url);
if (defined($file) && length($file) > 200) {
open FILE, ">$fname";
binmode FILE;
print FILE $file;
close FILE;
++$page;
} else {
$page = 1;
($year, $month, $day) = Add_Delta_Days($year,$month,$day, 1);
next if $year > $lastYear;
}
}

Satellite

Ура! Вот молодцы. Уважаю.
Качайте. Обязательно себе скачаю.
Федечке: ты неправ. Вот ведь психология буржуя: только платить и платить.
Если это удобно тебе, то не значит, что всем: не распространяй на всех свои личные комплексы совка и пр.

flightplan

Либрусековцы уже качают
блин! круто :)

flightplan

прочитал про Ватерлоо - интересно вообще проследить взгляд американцев на мировые исторические события :)

pita

там давали интервью американцы? :ooo:

asgrig

не только платить и платить, а...
Потратить навсегда 120 гигов места на винте по 0.2-1.0$ за гигабайт, скачав море вряд ли понадобящейся информации, или оплатить копейку, когда понадобится одна-две газеты?

shumilelena

вася спутал, что Times издают не американцы, а англичане :grin:

pita

ну да, есть же ещё New York Times

niki12

ну, не марсиане, чай
может и давали -

shumilelena

или оплатить копейку, когда понадобится одна-две газеты?
на sciencedirect'e сколько там статья стоит? что-то около $30... думаешь, тут они шибко дешевле сделают?

flightplan

вася спутал, что Times издают не американцы, а англичане
вот думаю, чо они так странно пишут :grin:
каюсь :grin:

asgrig

научные журналы издаются не таким огромным тиражом, как Times, и они имеют гораздо более узкую аудиторию. Так что да, дешевле.

pita

думаешь, тут они шибко дешевле сделают?
да, дешевле
ибо журналистская статья и научная - это две большие разницы

Satellite

Потратить навсегда 120 гигов места на винте по 0.2-1.0$ за гигабайт, скачав море вряд ли понадобящейся информации, или оплатить копейку, когда понадобится одна-две газеты?

Вот-вот. ПО себе же судишь. А я и говорю: не суди.
Ну вот с чего ты взял, что мне понадобится только 1-2 газеты изредка? Никак не пойму.
И не проще ли тебе мыслить шире и свободнее?
Сразу понимая, что люди разные, у всех разные потребности, в том числе в старинной американской прессе, и не обязательно они жлобы и совки, если не поступают так, как поступил бы ты.

pita

в старинной американской прессе

ещё один.

liliya63

Ну, и толку-то с этих картинок?
Поиска по ним нет. А на сайте есть полнотекстовый поиск, довольно удобный.

Alexey_G77

ты качаешь фильмы из сетки?или платишь за каждый при просмотре?
думаю такая информация да и еще бесплатная не будет лишней
всем качать! :)

MadCat

ты качаешь фильмы из сетки?или платишь за каждый при просмотре?
Ты зазеркалил(а) все фильмы с бегемота в надежде, что через пару лет тебе понадобится просмотреть один из них, или скачаешь один нужный фильм через 2 года, например, за 10 рублей.

pita

некорректная аналогия
бегемот - не единственный источник фильмов
в то время как полная подборка Times (пока) есть только у Times.

asgrig

я качаю и храню только потому, что качаю HDTV, которого в нашей локалке
1) очень мало
2) в основном 720p, а не 1080p
3) даже из локалки фильм будет качаться полчаса, из торрентов - несколько часов при хорошей доступности
Если бы я смотрел обычные дивиксы по 700 мегов, то ессно у меня бы не стояло винтов на 2.5ТБ (вскоре - больше а хватало бы 500 гигов на всё про всё. И для просмотра я бы качал каждый раз или вовсе пользовался вебдрайвом

geva

стояло винтов на 2.5ТБ (вскоре - больше)
выебнулся :lol:

asgrig

ну а куда ж без этого
потому мне и известна стоимость хранения данных и что проще и дешевле держать на винте, а что проще и дешевле качать, когда надо

rivenandko

спасибо за новость! :) по квакерам статейки покачаю

rivenandko

сайт в настоящее время работает с некоторыми затруднениями
глюки с сохранением есть: когда нажимаешь save/print в некоторых статьях, исчезает фрейм со статьей и ссылка для сохранения :(