Книги Osprey (военная тематика). Часть 2

Status
Not open for further replies.

pinkyshor

Member
Joined
Oct 12, 2005
Messages
205
Reaction score
2,140
Age
50
Location
Romania
B-24 Liberator Units of the Fifteenth Air Force (Osprey Combat Aircraft 21)
Author: Robert F. Dorr
URL: http://www.amazon.com/exec/obidos/redirect?tag=songstech-20&path=ASIN/1841760811
1841760811.01._SCLZZZZZZZ_.jpg

Product Details
pages: 96 pages
Publisher: Osprey Publishing (UK)
ISBN: 1841760811
Average Customer Review:
stars-5-0.gif
Based on 1 review(s).
Format: PDF
Size: 23,2 MB
Summary:
The B-24 was heavily utilised in the North African and Mediterranean theatres by the USAAF's Fifteenth Air Force, with operations over the Ploesti oilfields in Rumania being some of the most famous missions undertaken by the big American 'heavy' in World War 2. The stirling work of the Fifteenth Air Force is often overshadowed by the glamorous 'Mighty Eighth', yet the men flying the B-24 fought ceaselessly right through to VE Day. This is the third of five titles planned to chart the operational history of the Consolidated heavy bomber, and is the first single volume to exclusively cover the Fifteenth Air Force's B-24 units.

Code:
http://z05.zupload.com/download.php?file=getfile&filepath=834
 

derbenat

Member
Joined
Mar 3, 2004
Messages
339
Reaction score
271
Msha said:
2) EH044 это OCR. Это ты делал или скачал её в таком виде?

Она в твком виде в осле лежала.
 

chse

Member
Joined
Dec 21, 2003
Messages
16
Reaction score
0
pinkyshor said:
TBF/TBM Avenger Units of World War 2 (Osprey Combat Aircraft 16)
Author: Barrett Tillman
URL: http://www.amazon.com/exec/obidos/redirect?tag=songstech-20&path=ASIN/1855329026

Product Details
pages: 96 pages
Publisher: Stackpole Books
ISBN: 1855329026
Average Customer Review: N/A
Format: PDF
Size: 52,7 MB
Summary:
As its name suggests, the Avenger meted out severe retribution on the Japanese in the Pacific, participating in every major engagement through to VJ-Day. As a key weapon of war, the Avenger was so highly valued by the US Navy that its demand for the aircraft soon outstripped Grumman's production capacity, so General Motors [GM] was contracted to build the near identical TBM from September 1942 onwards. Over 1000 Avengers also saw action with the Fleet Air Arm in both the Atlantic and the Pacific through to VJ-Day, and two squadrons of RNZAF TBDs fought alongside American Avengers on Bougainville in 1944.

Code:
http://z28.zupload.com/download.php?file=getfile&filepath=12265

Перезалейте пожалуйста на rapid, а то zup докачку не поддерживает. Второй день немогу скачать. Книга очень нужна.
Зарание спасибо
 

115580

Member
Joined
Dec 5, 2003
Messages
310
Reaction score
233
Osprey - в каком формате хранить?

Данный пост можно считать и оффтопом. Если будет угодно модераторам, его следует переместить в положенное место (желательно конечно сохранить ссылку туда).

На данный момент размер книг в формате PDF действительно зашкаливает - 25 гиг это уже не шутки.
Сейчас Derbenat и другие (конечно не забываем нашего модератора Msha) занимаются распознаванием книг с использование FineReader и Winword - каждый на свой лад. (Но об этом будет ниже). Есть другой вариант хранения книг. Предлагаю результаты перегона в Djvu (пока без вставки текста).

Исходный файл: Osprey - Warrior 001 - Norman Knight 950-1204 AD.pdf
Исходный размер: 38 008 128

1. Действие: Извлечение картинок при помощи Adobe Acrobat 7
Полученные файлы: *.jpg
Полученный размер: 37 962 425
Полученное разрешение: 300 dpi
Полученная глубина цвета: 24 bit
Полученный размер: около 2100 на 2900

2. Действие: Создание Djvu при помощи Djvu Solo 3.1 NonCm
При Encode DjVu существует 4 режима
2.1. Scanned размер: 03 025 920
(http://www.megaupload.com/?d=MTNDQIC2)
2.2. Clean размер: 03 112 783
(http://www.megaupload.com/?d=1BPFKMRT)
2.3. Photo размер: 29 715 300
2.4. Bitonal размер: 02 676 275

Время кодирования не превышает 2 минут. Исключение составило Photo > 4

Photo - вся картинка попадает только на слой Background.
Bitonal - вся картинка попадает только на слой Black&White.

Поэтому они и не могут представлять для нас интерес

Scanned & Clean - чуть-чуть по разному распределяют изображение по слоям Foreground и Black&White

Для сравнения есть 3 файла в формате BMP
(http://www.megaupload.com/?d=S8943J8C).
*jpg.bmp - прямая конвертация с использованием iView 3.80 из Jpg
*clean.bmp - экспорт из созданного DjVu в режиме Clean
*scan.bmp - экспорт из созданного DjVu в режиме Scanned

Все 3 файла имеют разрешение 300dpi, в отличие от картинок в PDF, получаемых с помощью Distiller

Вставка текста возможна в (полу)автоматическом режиме с использованием утилит от Gencho.





В любом случае следует (по моему мнению, ака IMHO) определиться с форматом и если будет идти перегонка через Word - с шаблоном - причем полным.

Определить размеры и имена шрифтов. Размеры колонок, отступов и самого размера листа, и только после этого привлекать широкую общественность к
данному процессу.

Честно скажу, что мне не очень приятно смотреть на Times New Roman в книге, почему-то приелся. Намонго лучше смотрится текст ЗА картинкой (эта опция вроде есть в FineReader, но я ее не пробывал), чем голый текст.

Сейчас, судя по распознанным ПДФ файлам используется в основном Таймс и Ариал, в варианте Эбона от Msha также есть требуше и омега (судя по инфе акробата), а вот того же Nimes (о котором шла речь) - там нет. При печати (видимо) подставляются шрифты вида Т1, которые есть в наличие.

Для определения реальных шрифтов, используемых издательством можно воспользоваться ресурсом MyFonts.com, однако для этого нужен исходник как минимум в 600dpi, а то и в 1200.

Надо при печати в ПДФ - если он останется эталоном - четко определить все настройки - ведь по умолчанию (для Adobe Disdtiller 7) картинки сжимаются до 150dpi при Image Quality = Medium для Jpeg.
Т.е. нужно создать шаблон для серии (как минимум) в формате DOT и Adobe PDF Settings в формате *.joboptions.

Сейчас, насколько я понимаю, картинки сохраняются с разрешением окола 100 dpi. Но если всерьез будет происходить распознавание и потеря исходников, то потом что либо исправить уже будет невозможно - улучшАть будет нечего.
 

derbenat

Member
Joined
Mar 3, 2004
Messages
339
Reaction score
271
115580 said:
На данный момент размер книг в формате PDF действительно зашкаливает - 25 гиг это уже не шутки.
...
[Предлагаю результаты перегона в Djvu (пока без вставки текста).
...
Хорошее предложение?

А зачем? Весь мир сохраняет в PDF, а мы, то есть "заключенный" 115580, предлагаем djvu. Все идиоты, а мы - самые умные. Качество DJVU всем известно - этот формат похож на навязчивые воспоминания о DOS'овских временах с кривыми видеокартами с ручной подстройкой. Может быть он еще больше уменьшит размер файла? Но картинку сильнее чем в jpg не сожмешь. По тексту используется векторный формат, который дает одинаковый размер в любом формате (технология уже давно отработана), тем более что соотношение растр-вектор в PDF регулируется. Остается размер отводимый под служебную информацию формирования файла, что в PDF можно существенно сокращать. Так что, уменьшить размер PDF'а не удастся, при сохранении того же качества. Как и с форматом Divx - чтобы получить качество полностью соответствующее DVD, надо сделать файл того же размера - уменьшение размера влечет ухудшение качества.
Это технические аргументы. А теперь по бытовому.
В осле было всего 2 Оспреевских файла в формате DJVU (их было 6, но 4 убрали) и скачал я их только потому, что в PDF'е этих книг не было. Это стоило больших трудов, так как источник был один и никак не размножался. Все встало на место, когда наши люди переделали эти книги в PDF. Так что данный формат, по моему опыту, никому не нужен, кроме кучки революционеров, которым все равно как выглядит книга. Был бы распространен DJVU, они предлагали бы PDF.

Кстати, вопрос к модераторам. Что такое репутация и как она вычисляется. Двумя страницами назад человек с одним постом имеет репутацию около 15 (точно не помню). Здесь с 27 постами - 25, больше чем у tarlith'a, asseco и других заслуженных членов форума. Если это оценка глупости, то прошу мне ее понизить.:mad: :confused: :p
 
Last edited by a moderator:

Msha

ex-Team DUMPz
Hacker
Professional Carder
Joined
Oct 12, 2014
Messages
7,156
Reaction score
2,481
В любом случае следует (по моему мнению, ака IMHO) определиться с форматом и если будет идти перегонка через Word - с шаблоном - причем полным.

Я уже параметры для своего варианта приводил. Проблема в том, что книги издавались в разные годя и имеют разный стиль оформления. (размеры колонок, например)

Определить размеры и имена шрифтов. Размеры колонок, отступов и самого размера листа, и только после этого привлекать широкую общественность к
данному процессу.

выше...

Честно скажу, что мне не очень приятно смотреть на Times New Roman в книге, почему-то приелся. Намонго лучше смотрится текст ЗА картинкой (эта опция вроде есть в FineReader, но я ее не пробывал), чем голый текст.

Мне абсолютно всё равно, я предпочитаю Arial i times New Roman мне они не приелись.

Текст за картинкой это конечно хорошо, только весит будет значительно больше + иногда текст на картинке настолько кривой, что это не имеет смысл.


Сейчас, судя по распознанным ПДФ файлам используется в основном Таймс и Ариал, в варианте Эбона от Msha также есть требуше и омега (судя по инфе акробата), а вот того же Nimes (о котором шла речь) - там нет. При печати (видимо) подставляются шрифты вида Т1, которые есть в наличие.

Все нестандартные шрифты я использовал только для подгонки логотипа, а также когда подбирал букву ''g'' для текста с нужным начертанием.


Для определения реальных шрифтов, используемых издательством можно воспользоваться ресурсом MyFonts.com, однако для этого нужен исходник как минимум в 600dpi, а то и в 1200.


Заморачиваться влом. Меня больше интересует время, за которое будут перегнаны файлы в OCR. Если учесть, что у меня их около 800 и на 1 мне тербуется неделя, а derbenat'y 1 день (тратить пару часов в день на это не более), то по любому нам работы более чем на год.


Надо при печати в ПДФ - если он останется эталоном - четко определить все настройки - ведь по умолчанию (для Adobe Disdtiller 7) картинки сжимаются до 150dpi при Image Quality = Medium для Jpeg.
Т.е. нужно создать шаблон для серии (как минимум) в формате DOT и Adobe PDF Settings в формате *.joboptions.

Я не использую Acrobat Distiller. У меня стоит PDF Factory pro и опция ''downsample images to xx dpi'' у меня отключена, т.е. размер картинок остаётся таким какой он есть. derbenat использует FineReader, там размер картинок задётся.

Сейчас, насколько я понимаю, картинки сохраняются с разрешением окола 100 dpi.

Я подставляю картинки с таким разрешением, при котором картинка смотрится нормально при увелечинии 100-150%. Если что-то очень фигурное или интересное, могу оставить картинку чуть побольше. Разрешение меня абсолютно не интересует я на него не смотрю. В FineReader я поставил разрешение картинок 120 dpi, но большинство выдерал Photoshop'ом, а там уж каое разрешение получалось. Важно то в общем не разрешение, а размер картинки по пикселям. Разрешение может быть и 10 dpi, а размер по пикселям 10000х10000 (понимаешь что я имсею в виду?). Я подбирал в Photoshop размер изображения, соответствующий вышеуказанным требованиям.

Кроме того, я картинки многие поправил - они были отсканирвоаны криво (угол наклона до 1,5 градусов).

Но если всерьез будет происходить распознавание и потеря исходников, то потом что либо исправить уже будет невозможно - улучшАть будет нечего.

Вот именно поэтому я переделывал Eben Emael, сделанный derbenat'ом. Именно поэтому он и выложил исходники. Я сделал так, как меня на 100% устраивает. Если кому-то не нравится, то он волен делать такой файл сам (как сделал я). Но я считаю, что лучше (по качеству картинок) делать смысла нет.

Конечно, хорошо бы прийти к компромису, чтобы не ходело по сети 10 разных версий OCR. Но на вкус и цвет товарищей нет. Меня лично полностью устроило как derbanat сделал Warrior 49. Если он продолжит в том же духе, то и договариватся не о чем. Там было толко 2 штриха, которые я бы подправил, но они не принципиальны с точки зрния сожержания книги.

В конце концов этим занмиаемся только мы вдвоём(!), причём БОЛЬШУЮ часть делает derbenat (от меня всего 2 книги, точнее даже одна...). О чём и с кем договариваться будем?

_____________________

djvu хороший формат для остканированных картинок. И если хранить именно сканы, то я бы, конечно, предпочёл такой формат (он экономичнее чем ПДФ). Поскольку речь идёт о OCR, я однозначно за ПДФ.
 

pariman

ex-Team DUMPz
Joined
Mar 10, 2004
Messages
1,718
Reaction score
983
Location
Ukraine
DJVU мне лично просто не нравиться. Ну не нравиться и все. Место, занимаемое на харде не критично вообще, поскольку по мере наполнения оного, я просто записываю все на ДВД-болванки.
По поводу репутации: пока еще настраивается...

PS. Шапку поправлю на выходных ;)
 

BobFIA

Member
Joined
Jun 27, 2005
Messages
19
Reaction score
0
Age
54
Location
Краснодар
Камрады!
А можно перезалить погибших на qfile
1) Essential Histories 025 The Mexican War 1846–1848
2) Essential Histories 001 The crusades
3) Men-at-Arms 101 The Conquistadores?
И вопросик - а с бетахом новостей нет ? Или есть надежда ? Знает кто ?
И что с Аваксом ? Он у меня уже неделю не открывается ...
 
Last edited by a moderator:

pinkyshor

Member
Joined
Oct 12, 2005
Messages
205
Reaction score
2,140
Age
50
Location
Romania
BobFIA said:
Камрады!
А можно перезалить погибших на qfile Essential Histories 025 The Mexican War 1846–1848 и Men-at-Arms 101 The Conquistadores?
И вопросик - а с бетахом новостей нет ? Или есть надежда ? Знает кто ?
И что с Аваксом ? Он у меня уже неделю не открывается ...
There are pretty good news with betah, just pay a visit. Avax on the other hand...
 

chse

Member
Joined
Dec 21, 2003
Messages
16
Reaction score
0
Пожалуйста перезалейте на рапид "TBF/TBM Avenger Units of World War 2 (Osprey Combat Aircraft 16)", или положите на zup кусками. Правда, очень нужно.
Спасибо.
 

Lenok

Member
Joined
Aug 10, 2005
Messages
107
Reaction score
42
ESS_01 (6,5 Mb)
_http://www.megaupload.com/?d=6S6R1RYN

Пароль - http://netz.ru
Предлагаю tarlith, derbenat и другим использовать этот пароль для удобства других пользоватателей

В поддержку предыдущего "оратора" :): указанный им файл я тоже не могу скачать уже несколько дней (при наличии "толстого" канала)!!!
 
Last edited by a moderator:

Lenok

Member
Joined
Aug 10, 2005
Messages
107
Reaction score
42
ESS_25(1) (19 Mb)
_http://www.megaupload.com/?d=NYZZ4UBC

ESS_25(2) (14,5 Mb)
_http://www.megaupload.com/?d=LOUYZJ6C

Пароль см. выше
 

Msha

ex-Team DUMPz
Hacker
Professional Carder
Joined
Oct 12, 2014
Messages
7,156
Reaction score
2,481
derbenat, на счёт djvu ты не совсем прав. Но меня инетерсует другой вопрос. На сообщения в личку ты не овтечаешь из принципа?
 

derbenat

Member
Joined
Mar 3, 2004
Messages
339
Reaction score
271
Msha said:
derbenat, на счёт djvu ты не совсем прав. Но меня инетерсует другой вопрос. На сообщения в личку ты не овтечаешь из принципа?

Я постоянно забываю о ее существрвании. Сейчас посмотрю и отвечу после вторника, так как уезжаю в командировку. Да и с сетью что-то непонятное творится. Постоянно рвется, так что надо разбираться.

А насчет djvu... Этот формат был разработан корпорацией, которая занимается исключительно связью (если не считать языка С) и ориентирован он был на передачу картинок и текста, условно - компьютерный факс. PDF же был разработан в пакете издательских программ и ориентирован на создание красивого издания. А я очень люблю не просто книгу, а красивую книгу. Вот ее то и нельзя получить в djvu - он слишком, для меня, уродлив. Можете считать это моим бзиком, но меня уже трудно переделать.
 
Last edited by a moderator:

Msha

ex-Team DUMPz
Hacker
Professional Carder
Joined
Oct 12, 2014
Messages
7,156
Reaction score
2,481
derbenat если книжка с распознанным текстом, то пожалуй можно с тобой согласиться. Если скан, то лучше djvu. Если бы мои неск. тысяч книг по математике, физике, химии и др. естественным наукам хранились в ПДФ у меня бы не хватило места на харде. А записывать неотсортированные до конца книги, кол-во которых потсоянно растёт (либо чатсь заменяется на OCR) я пока не хочу.

Кстати, я думаю о форматах можно пообщаться где-нибудь в другой теме.
 
Last edited by a moderator:

derbenat

Member
Joined
Mar 3, 2004
Messages
339
Reaction score
271
По полученному мной сообщению в осле выложили новые книги Osprey, даю линки:

Privateers and pirates 1730 – 1830 (Elite 74)
ed2k://|file|Pirates.and.Privateers.pdf|42986018|8AAE5C557298069A13716042B387FF91|/

Matchlock Musketeer 1588–1688 (Warrior 43)
ed2k://|file|[Osprey.Publishing].-.Warrior.#043-.Matchlock.Musketeer..1588-1688.pdf|67906420|DEDE63BE4BAEF50877D763A27314E6BC|/

Jagdgeschwader 52 The Experten (Aviation Elite Units 15)
ed2k://|file|Osprey_Aviation_Elite_015_Jagdgeschwader_52.pdf|53636123|1D3CE2EC402E60BAAC52161ED8BCE841|/

Ju 88 Kampfgeschwader on the Western Front (Combat Aircraft 17)
ed2k://|file|Osprey-CA017-ju88_kampfgeschwader_on_the_western_front_(plates_only).pdf|3233393|B40ED1F14C3F91DE01C6480388F9869E|/


ed2k://|file|Osprey_Men_At_Arms_NВ°237_French.Army_1870-71_franco-prussian_war_(2)_republican_troops.retry.pdf|54469977|702648A19F5614175BF975D122D03C6A|/

ed2k://|file|Osprey_Men_At_Arms_NВ°118_Jacobite.Rebellions_1689-1745_(rescan).pdf|49094147|858BCAC10DD26F9C42EEEDC5EC9DF8D1|/

Прошу присоединяться, чтобы скачка пошла быстрее.
 

axeman99

Member
Joined
Nov 18, 2005
Messages
33
Reaction score
164
Location
-
derbenat said:
По полученному мной сообщению в осле выложили новые книги Osprey, даю линки:

Privateers and pirates 1730 – 1830 (Elite 74)
ed2k://|file|Pirates.and.Privateers.pdf|42986018|8AAE5C557298069A13716042B387FF91|/

Not Osprey, Star Wars D6...
 

asseco-2

Member
Joined
Jun 15, 2005
Messages
235
Reaction score
43
Age
67
Location
Москва
derbenat said:
А я очень люблю не просто книгу, а красивую книгу. Вот ее то и нельзя получить в djvu - он слишком, для меня, уродлив. Можете считать это моим бзиком, но меня уже трудно переделать.

Да никакой не бзик, а нормальное желение, нормального человека, в отнощении Оспри, где основное - это картинки, что цветные, что ч.б. качество рисунка очень важно, иначе "ни туда ни сюда".
 
Status
Not open for further replies.
Top