chingachguk: (Default)
chingachguk ([personal profile] chingachguk) wrote2005-09-06 09:55 am

Удивительное рядом

Наткнулся тут в ЖЖ:

"Юрист Игорь Краев, Российская фонографическая ассоциация: "С лета 2006 года вступают в силу поправки, согласно которым запись MP3-файла на винчестер или отправка его по электронной почте будет приравниваться к незаконному копированию CD от 10 тысяч до 5 миллионов рублей"." (с)Журнал Rolling Stone.

А между тем с подачи [livejournal.com profile] mashaaaa зарылся на http://print.google.com и обнаружил там массу замечательных книжек вроде:

Grammar of Mangghuer: A Mongolic Language of China's Qinghai-Gansu Sprachbund by Keith W Slater
Languages of China by S. Robert Ramsey

The Mongolic Languages edited by Juha Janhunen

American Studies in Altaic Linguistics by Poppe, N

Manchu: A Textbook for Reading Documents by Gertraude Roth Li

Studies in Turkic and Mongolic Linguistics by Gerard Clauson

The Korean Language by Ho-Min Sohn


И еще множество книг.
Предполагается, что Вы можете только прочесть несколько страниц из этих книг, однако народные умельцы предлагают простой алгоритм по вытаскиванию из Гугла всех нужных страниц. Еще бы придумать, как это автоматизировать, и было бы совсем хорошо.

[identity profile] prokaznick.livejournal.com 2005-09-06 06:20 am (UTC)(link)
>> алгоритм по вытаскиванию из Гугла всех нужных страниц
к сожалению запись защищенная :( Может у кого-то еще есть подробности?

[identity profile] chingachguk.livejournal.com 2005-09-06 06:33 am (UTC)(link)
А, ну это не проблема. Проблема в том, что вытаскивать надо по одной страничке и текст оказывается средней читабельности. Вот алгоритм этот:

"Многим конечно же известен этот популярный сервис, однако для тех, кто с ним не знаком, даю краткую справку - этот сервис предоставляет просмотр нескольких страниц из нескольких миллионов книг. По умолчанию доступно всего несколько страниц, однако это можно легко обойти, и бесплатно получить всю книгу.

Необходимые инструменты: 1 (лучше 2) аккаунта на gmail, браузер mozilla firefox, в редких случаях 1-2 анонимных прокси сервера, програмное обеспечение для создания pdf/djvu, для эстетов программа распознавания отсканированных текстов.

Рецепт:

1) Заходим на официальный сайт Google Print.

2) Вводим название интересующей книги (типа Linux and Unix Shell Programming, или там Lisp in Small Pieces), или ключевое слово (типа Adobe Photoshop CS)

3) Найдя нужную книгу, щелкаем по ее названию

4) После открытия, слева от скана будет поиск по книге. Вводим туда (0|1|2|3|4|5|6|7|8|9). После данной процедуры будут доступны практически все страницы данной книги. Однако, по непонятной причине, иногда всетаки не все страницы - для таких страниц (а их очень мало) вводите в поиск номер страницы.

5) В Firefox заходим в меню Инструменты -> Информация о странице, переходим на вкладку Мультимедиа, выбираем нужное изображение, сохраняем. Повторяем действия.

6) Через некоторое время, рано или поздно обязательно наткнетесь на заблокированные (restricted) страницы. Обходится это элементарно - в верхнем правом углу жмем Sign out, и продолжаем копировать страницы. Когда заблокированные страницы встретятся вновь, обратно логинимся, и т.д.

7) Когда книга будет полностью скопирована на хард, собираем страницы в готовый pdf/djvu, при желании распознаем"

[identity profile] prokaznick.livejournal.com 2005-09-06 06:35 am (UTC)(link)
Гениально!

Но есть нюанс

[identity profile] pantoja.livejournal.com 2005-09-06 08:20 am (UTC)(link)
1. Заблокированные страницы - они, по-моему, одинаковы для всех.

2. Чтобы вытянуть одну книжку нужно несколько гмайловский аккаунтов.

Re: Но есть нюанс

[identity profile] chingachguk.livejournal.com 2005-09-06 08:27 am (UTC)(link)
1. Пока у меня получалось все заблокированные странцицы скачать.
2. Гмэйловские там для примера. Можно хоть на народе.


Вы ко мне случайно не из-за этого пришли?

Re: Но есть нюанс

[identity profile] pantoja.livejournal.com 2005-09-06 08:28 am (UTC)(link)
Нет, отнюдь. Я долго за Вами наблюдаю. Это просто совпало - решение зафрендить и эта, гхм, клевета.

Все-таки не понимаю

[identity profile] pantoja.livejournal.com 2005-09-17 12:39 pm (UTC)(link)
Скачал пол-книги ("Byzantinoturcica" Моравичка, кстати). И практически на середине пошли restricted pages, кои никак не желают открываться, ни с разными аккаунтами, ни с проксями.

Может, попробуете для самоубеждения? Мне на странице, куда ведет ссылка, недоступны 569, 574, 575, 579, 580, 581 584 страницы. Я хочу понять - только мне или всем...