Многие из читателей наверняка знают, что такое архивы, и сталкивались с ними еще до знакомства с Интернетом, однако не лишним будет напомнить, что архив – это файл, содержащий в себе один или несколько файлов в сжатом виде. Впоследствии из архива можно извлечь все содержащиеся в нем данные без потери информации. Разумеется, с учетом невысоких скоростей передачи данных в Интернете сжатие информации здесь весьма актуально.
С развитием компьютерной техники возникли и получили развитие многие форматы архивов, различающихся между собой степенью сжатия и скоростью обработки. Наиболее распространены в Интернете архивы форматов ZIP и RAR (последний – преимущественно в русскоязычном сегменте Сети). Есть, конечно, и другие, например ARJ, CAB, LZH, TAR (последний используется в операционных системах семейства Unix). Однако архивы таких форматов крайне редки, а работать с ними можно, используя архиваторы – программы для работы с архивами. Стандартные для архивов ZIP и RAR – соответственно архиваторы WinZip и WinRAR. Работа с этими программами во многом схожа и напоминает работу с Проводником Windows с той лишь разницей, что в программах-архиваторах можно заходить в архивы, как в обычные папки.
Примечание
В операционных системах Windows XP и Windows Vista можно работать с архивами формата ZIP, как с обычными папками, так что в таких случаях использование архиватора вообще не является необходимостью.
В архиваторе WinRAR (http://www.rarlab.com/) (рис. 2.11), как и в WinZip (http://www.winzip.com), можно зайти в любой архив и нажать кнопку Извлечь в, после чего выбрать место, куда следует записать извлеченные из архива файлы.
Рис. 2.11. Архиватор WinRAR
Совет
Современные программы-архиваторы при установке интегрируются в Windows и позволяют выполнять основные действия с помощью контекстного меню, открываемого щелчком правой кнопки мыши.
В последнее время обретает популярность новый формат архивов – 7Z, однако в силу малой распространенности этого архиватора файлы с его помощью обычно упаковываются в самораспаковывающиеся архивы, в результате чего получается исполняемый файл, и для распаковки такого архива внешняя программа не требуется.
Графические файлы
Форматы графических файлов не менее разнообразны, чем форматы архивов. Чаще всего в Интернете встречаются следующие форматы графики: JPEG, GIF, TIF, PNG, BMP и др. Для работы с графическими файлами, как и с файлами видео и аудио, можно обойтись стандартными средствами Windows, в частности Программой просмотра изображений и факсов. Однако ее возможности оставляют желать лучшего, поэтому обратимся к альтернативным программным продуктам, с помощью которых просматривать рисунки, фотографии и другие изображения гораздо удобнее. Такие программы, как ACDSee, IrfanView, Picasa, получили заслуженное уважение многих пользователей компьютеров. Сначала опишем основные возможности, присущие большинству современных программ для просмотра графики, а затем остановимся на особенностях упомянутых приложений этого класса.
Во всех рассматриваемых программах присутствуют следующие функции:
• получение изображений со сканера;
• создание снимков экрана;
• просмотр изображений в виде эскизов, а также в режиме слайд-шоу;
• масштабирование изображения;
• применение к изображению различных эффектов (поворот, изменение яркости и контрастности и др.);
• установка изображений в качестве рисунка Рабочего стола, а также создание экранных заставок из выбранных изображений;
• преобразование форматов файлов.
Есть и другие функции, общие для этих программ, полное перечисление которых заняло бы несколько страниц, поэтому поговорим об особенностях каждой из них отдельно.
ACDSee
Программа ACDSee, расположенная по адресу http://www.acdsee.com/, условно бесплатная, что не мешает ей на равных конкурировать с другими приложениями своего класса. Когда-то первые версии ACDSee были небольшими по размеру и в то же время достаточно функциональными. В настоящее время приложение представляет собой этакий «комбайн» размером в несколько десятков мегабайт и по сути является набором самостоятельных программ, предназначенных для самых разных целей: создание презентаций, слайд-шоу, редактирование изображений. Даже вполне функциональный графический редактор FotoCanvas включен в состав пакета ACDSee.
Новичку непросто будет разобраться со всеми возможностями ACDSee, тем более что большинству пользователей чаще всего нужна только одна основная функция программы – просмотр изображений. Однако опытным пользователям, пожелавшим потратить некоторое количество своего времени на изучение возможностей ACDSee, многие из них покажутся интересными. Минус программы – отсутствие официальной поддержки русского языка.
IrfanView
Небольшая по размеру бесплатная программа, которая тем не менее обладает достаточным набором возможностей и идеально подходит для начинающих пользователей. IrfanView (http://www.irfanview.com/) не имеет такого красивого и современного интерфейса, как у конкурентов, однако его лаконичность скорее даже является плюсом. Программа обладает возможностью расширения функциональности с помощью дополнительных модулей, что позволяет настроить ее под свои потребности.
Picasa2
Программа известного в Интернете и не только в нем бренда Google. Picasa2 расположена по адресу http://www.picasa2.com/, она бесплатна и имеет русскоязычный интерфейс. Особенность приложения в том, что во время простоя компьютера программа ищет на жестком диске изображения и группирует их по альбомам. Присутствует достаточно интересная возможность группировки изображений по месяцам и годам их создания. Доступны функции простейшего редактирования изображений. Кроме того, программа интегрируется с другими сервисами Google и позволяет «на лету» размещать свои фотографии в Интернете, отправлять их по электронной почте и обмениваться ими со знакомыми.
Документы
Загрузка документов из Сети, пожалуй, интересна всем пользователям Интернета, начиная от школьника, который ищет реферат для доклада на уроке, или домохозяйки, интересующейся рецептом праздничного пирога, и заканчивая ученым, который загружает на компьютер документы с материалами исследований своих коллег. Форматы документов не так разнообразны, как рассмотренные выше форматы графики или архивов, тут присутствует определенная «однородность».
Значительная часть документов в Сети создана с использованием пакета Microsoft Office, являющегося практически монополистом на рынке офисных приложений. Файлы текстовых документов, электронных таблиц, мультимедийных презентаций часто созданы именно в среде Microsoft Office. Разумеется, для работы с такими файлами потребуется этот пакет. Хотя в настоящее время появились и успешно развиваются альтернативные программы, среди русскоязычных пользователей форматы DOC и XLS пока остаются стандартом. Об особенностях работы с Microsoft Office говорить лишний раз не будем, а рассмотрим еще один популярный в Интернете формат для хранения и обмена документами – PDF.
PDF (от англ. Portable Document Format) – формат документов, разработанный компанией Adobe Systems. Документы в таком формате предназначены обычно исключительно для просмотра, редактирование в них не предусмотрено, хотя и возможно с помощью специализированных платных программ. Кроме того, технология, используемая в PDF-документах, позволяет защищать хранящуюся в них информацию от копирования. Для просмотра документов формата PDF чаще всего используют программу Acrobat Reader (www.adobe.com/products/reader/) той же компании Adobe Systems, распространяемую бесплатно. Помимо этой утилиты существует еще и ставшая в последнее время до статочно популярной Foxit PDF Editor (http://www.foxitsoftware.com/pdf/pe_intro.php), которая также распространяется бесплатно и по сравнению с Acrobat Reader имеет намного меньший размер, характеризуется более высокой скоростью работы и меньшей требовательностью к ресурсам компьютера.
Функциональность обеих программ практически идентична: просмотр документов, возможность копирования графики и текста (и та и другая программа некорректно копирует тексты с кириллическими шрифтами), масштабирования документа при просмотре, распечатка на принтере. Так что при необходимости просмотра документов формата PDF следует обзавестись одной из названных программ.
Очевидно, что загрузка файлов из Интернета – очень полезная функция Всемирной паутины, ведь помимо текстовой информации на веб-сайтах содержится еще много интересного в виде разнообразных файлов.
Глава 3Поиск в Интернете
Поисковые серверы. Некоторые правила поиска
Поисковые запросы: подробно
Альтернативные средства поиска
Поиск рисунков в Интернете
Поиск музыки и видео
Поиск по FTP-серверам
Проблема поиска во Всемирной паутине не в том, что информации мало, а в том, что ее много. Поэтому отыскать то, что нужно, порой достаточно трудно. Вообще, поиск информации в Интернете – краеугольный камень эффективной работы в Сети. Владение навыками поиска делает Интернет для пользователя полезным инструментом для работы и отдыха. В этой главе поговорим о том, как правильно искать в Сети необходимую информацию. Кроме того, разберемся с поиском файлов (который имеет некоторые особенности по сравнению с поиском текстовой информации), картинок и других ресурсов.
Поисковые серверы. Некоторые правила поиска
Для организации поиска в Интернете существуют специализированные службы, называемые поисковыми серверами. На практике – это веб-сайты, где можно набрать в соответствующей строке ключевые слова, касающиеся интересующей темы, и получить множество ссылок на ресурсы с нужной информацией. Например, на запрос домашние животные поисковый сервер «Яндекс» (подробнее о нем см. ниже) выдает более 14 000 000 ссылок на страницы, содержащие нужные, на его взгляд, сведения. Однако далеко не все так гладко: при посещении некоторых найденных страниц выясняется, что искомой информации на них недостаточно, а то и вовсе нет.
Чтобы искать с максимальной результативностью, не лишне будет знать, как работают поисковые серверы.
Принципы работы поисковых серверов
Поисковый сервер – это довольно сложная программа, точнее комплекс программ, в которых используются специальные алгоритмы анализа содержимого веб-сайтов в масштабах всего Интернета.
Интересный момент: на обработку того же запроса домашние животные у «Яндекса» ушло менее секунды. Невольно возникает вопрос: «А можно ли проанализировать весь Интернет за столь короткое время?» Однозначный ответ на это: «За столь короткое время проанализировать весь Интернет нельзя». Тем не менее факт остается фактом: на обработку запроса затрачено меньше секунды. Ответом на возникшее недоразумение будет описание принципов работы поисковых серверов.
Работа над запросом конкретного пользователя (а заодно и над всеми другими возможными запросами) началась задолго до его введения. Специальная программа, называемая «пауком», просматривает содержимое веб-сайтов.
Ее задачи чем-то схожи с задачами обычного веб-браузера, только вместо того, чтобы показывать страницы на экране, «паук» передает их содержимое другой программе – «путешествующему пауку». Задача «путешествующего паука» – вычленение из загруженной страницы ссылок на другие сайты, по которым снова направляется «паук». Цикл этот повторяется многократно, точнее непрерывно.
На этом работа не заканчивается. За дело принимается программа-индексатор, которая, используя определенные правила, анализирует полученные «пауками» страницы и формирует сложную базу данных поискового сервера. Вот эта самая база данных потом и выдает результаты поиска, которые появляются после обработки введенного запроса. На принципах работы индексатора остановимся поподробнее, так как именно от него зависит то, что войдет в результаты поиска.
В основе работы большинства современных поисковиков лежит индекс цитирования, который вычисляется индексатором в результате анализа ссылок на текущую страницу с других страниц Интернета. Чем их больше, тем выше индекс цитирования анализируемой страницы и тем выше эта страница будет отображена в результатах поиска. Кроме того, учитывается индекс цитирования страниц, которые ссылаются на страницу, изучаемую индексатором.
Кроме индекса цитирования учитываются также следующие параметры:
• наличие искомых слов в заголовке страницы или названии сайта;
• частота повторений искомых слов на странице;
• размер шрифта, которым на странице написаны слова из поискового запроса, а также выделение этих слов шрифтами и стилями;
• тематика ссылающихся сайтов и некоторые другие.
После ввода запроса пользователем за дело берется последнее звено поискового сервера – система выдачи результатов. В итоге анализа и сопоставления упомянутых выше показателей эта система определяет степень соответствия содержимого страницы условиям запроса. Чем эта степень больше, тем выше страница будет представлена в списке найденных ресурсов.
Возвращаясь к вопросу о скорости обработки запроса, отмечу, что такая высокая скорость обеспечивается за счет того, что страницы Интернета проиндексированы заранее, а результаты поиска составляются на основе информации из базы данных поискового сервера.
Такой способ, как несложно догадаться, имеет очевидный недостаток, заключающийся в том, что содержимое веб-страниц может со временем изменяться, а «паук» не будет успевать найти их и обработать, следовательно, результаты поиска будут неточными. Еще раз, упомянув о времени, необходимом поисковому серверу для просмотра и индексации всего Интернета, скажу, что на это у разных поисковиков уходит от нескольких суток до нескольких недель в зависимости от алгоритма обработки информации. Так что сайты, появившиеся в Сети недавно, в результатах поиска представлены не будут.
Разработчики поисковых серверов борются с этим разными способами и с переменным успехом. Например, большинство современных поисковиков предоставляет такой сервис, как поиск по новостным лентам, обновляющимся каждые несколько минут, и поэтому они чаще индексируются поисковиками. Как бы там ни было, лучшего способа, чем предварительная индексация страниц, сегодня не существует.
Правила построения поисковых запросов
Как уже отмечалось, в Интернете существует множество поисковых серверов, отечественных и зарубежных.
Российские поисковые серверы:
• «Яндекс» – www.yandex.ru;
• «Рамблер» – www.rambler.ru;
• «Апорт» – www.aport.ru;
• Gogo – www.gogo.ru.
Зарубежные поисковые серверы:
• Google – www.google.com;
• Altavista – www.altavista.com;
• Yahoo! – www.yahoo.com.
Для поиска на русском языке лучше подходят российские серверы, на иностранном – зарубежные, хотя, например, Google неплохо справляется с поиском на многих языках. Подробнее о наиболее популярных поисковых системах поговорим позже, рассматривая расширенные возможности поиска, так как у каждой из этих систем есть свои особенности. Сейчас остановимся на некоторых базовых правилах построения поисковых запросов, общих для всех поисковиков.
Несмотря на заявления многих владельцев поисковых серверов, что запросы могут быть написаны практически на языке, который люди используют для общения между собой, это далеко не так. По всей видимости еще не скоро наступит время, когда компьютер и человек смогут общаться на естественном (для человека) языке. Впрочем, нужно отдать должное поисковым серверам: в последнее время они стали гораздо лучше понимать пользователя, и результаты поиска теперь больше соответствуют ожиданиям, чем это было несколько лет назад. Произошло это во многом благодаря внедрению новых языковых технологий.
Из вышесказанного следует, что на практике рядовому пользователю находить нужную информацию стало проще. Поисковики теперь ищут не только запрашиваемое слово, но и его словоформы, что позволяет делать результаты поиска более точными. Например, если в поисковом запросе присутствует слово умный, то его результаты будут содержать не только это слово, но и его производные: умного, умная, а также ум и даже разум. Конечно, страницы со словоформами будут не в числе первых результатов поиска, но элементы искусственного интеллекта налицо. Этот факт полезно учитывать при построении поисковых запросов. Теперь расскажу еще о нескольких таких фактах.
Поисковые серверы при обработке запроса не учитывают регистр символов. Поэтому запросы Отдых в Турции и отдых в турции с точки зрения поисковика идентичны.
Также следует помнить, что применять знаки препинания в поисковых запросах вовсе не обязательно, точнее, даже не нужно, так как они также игнорируются поисковыми серверами. Зато многие традиционные знаки препинания могут быть использованы при построении сложных расширенных запросов, результаты поиска по которым обычно гораздо ближе к ожидаемым.
Большинство поисковых серверов (кроме, пожалуй, Google) также игнорирует короткие слова, не несущие смысловой нагрузки. В русском языке это предлоги, союзы и т. д., в иностранных, например, артикли.
Многие поисковые серверы позволяют бороться с опечатками и неправильной раскладкой клавиатуры. Наверняка многим читателям часто случалось набрать при включенной английской раскладке клавиатуры русское слово, и получалось, например, gfhjdjp вместо паровоз. Тот же «Яндекс» сразу определит, что здесь что-то не так и вверху страницы с результатами поиска выдаст ссылку: Быть может, вы искали: паровоз, перейдя по которой можно получить страницу с правильными результатами. Аналогично можно бороться с опечатками. Если поисковому серверу покажется, что в слове допущена ошибка или опечатка, то он предупредит об этом той же фразой: Быть может, вы искали.
Поговорим о том, какие слова лучше взять для запроса поисковому серверу. Во-первых, из интересующей пользователя темы нужно взять самые важные по смыслу слова, отражающие только суть вопроса. Например, если необходим материал по теме «Ловля пингвинов в Антарктиде в условиях полярной ночи», то вовсе не обязательно писать фразу целиком, результаты поиска в этом случае, скорее всего, не устроят запрашивающего, так как будет много лишнего. Есть выражение «Машина должна работать, человек – думать», и сказано оно как раз о такой ситуации. Задача пользователя при составлении поискового запроса – выделить ключевые слова, задача поискового сервера – наилучшим образом обработать введенный запрос. В рассматриваемом примере ключевыми можно считать слова ловля пингвинов. Ведь известно, что кроме Антарктиды они нигде больше не водятся, ну а «полярную ночь» стоит отбросить хотя бы потому, что в реальности в таких условиях работать достаточно сложно.
Этот ироничный пример иллюстрирует, что пользователь, основываясь на своих знаниях и логике, должен выделить только необходимые ключевые слова, не перегружая запрос лишними терминами.
Рассмотрим пример, иллюстрирующий типичные ошибки начинающих пользователей при поиске в Интернете. На запрос загадки о музыкальных инструментах поисковик не выдал полезных результатов. Тогда пользователь решает исправить запрос, дополнив его и написав: загадки для детей о музыкальных инструментах – результаты поиска оказались еще хуже предыдущего. В такой ситуации говорят, что условия запроса стали более жесткими в отличие от более мягких, установленных в предыдущем случае. Для данного примера неплохим решением, как показала практика, явился поиск по ключевому слову загадки. В Интернете много таких сайтов, а зайдя на сам сайт и немного поискав по его разделам, вполне можно найти интересующую информацию.
Рассуждая о том, какие слова нужно использовать в поисковом запросе, можно сформулировать несколько правил:
• выбирайте только самые важные ключевые слова, касающиеся рассматриваемой темы;
• слов не должно быть слишком много или слишком мало; некоторые считают оптимальным запрос, состоящий из трех-четырех слов, однако в разных случаях это количество может различаться;
• при неудовлетворительных результатах поиска попробуйте применить более мягкие условия для запроса, но ни в коем случае не более жесткие;
• если вы не удовлетворены результатами поиска на одном поисковом сервере, то попробуйте поискать на другом; механизмы работы у серверов неодинаковые, так что результаты могут различаться коренным образом.
Надеюсь, что вышеизложенная информация поможет читателям находить в Сети необходимые сведения. Если найти что-то все равно никак не удается, то на помощь придут расширенные методы поиска.