Оцифровка книг
Материал из Википедии — свободной энциклопедии
Эта страница предлагается к удалению из Википедии в соответствии с правилами удаления. Пояснение причин и обсуждение — на странице Википедия:К удалению. Пока процесс обсуждения не завершён, статью можно попытаться улучшить, однако следует воздерживаться от переименований или удаления содержания. Если вы автор этой статьи, прочтите руководство к дальнейшему действию. Администраторам: ссылки сюда, история (последнее изменение), удалить. |
Оцифровка книг — это процесс перевода бумажных книг в электронные. Электронные копии книг зачастую помещают в электронные библиотеки. Как правило, осуществляется путем сканирования или фотографирования с последующей обработкой. В прошлом чаще применялся ручной набор текста книги.
Содержание |
[править] Способы оцифровки книг
После сканирования текст книги может быть распознан или сохранен в графическом формате. Существуют следующие стратегии обработки отсканированных книг:
- Распознавание изображений и сохранение распознанного текста в одном из форматов электронных книг. Преимущества: текст книги переводится в машиночитаемый вид, становится возможен поиск по книге и индексация больших массивов электронных книг. Недостатки: теряется оформление книги, изображения, схемы и формулы; неизбежны ошибки распознавания.
- Хранение в графическом формате. При этом каждая страница сохраняется в виде сжатого графического файла. Достоинства: сохраняются все нетекстовые элементы книги, оформление. Исключены ошибки. Недостатки: невозможен поиск и дальнейшая компьютеризированная обработка текста книги.
- Все чаще применяется смешанный подход: текст книги распознается в автоматическом режиме и подкладывается под оригинальные изображения. Это позволяет совместить преимущества обоих методов.
[править] Книжные сканеры
[править] Крупные проекты по сканированию книг
- Google Book Search
- Проект «Гутенберг»
- Проект Gallica Национальной библиотеки Франции
Как правило, в ходе таких проектов обрабатываются книги, перешедшие в общественное достояние. Google Book Search оцифровывает все книги, но книги, защищенные авторским правом, предоставляются лишь в виде фрагментов.