DocFetcher
Функции поиска и индексирования файлов DocFetcher базируются на Apache Lucene.
Возможности
DocFetcher позволяет производить локальный поиск по имени файла или его содержимому, поддерживает различные форматы документов и расширенные настройки для поиска [2] [3] [4] .
- Поддерживает все основные форматы документов, такие как PDF, HTML, Microsoft Office (включая Office Open XML), OpenOffice.org, RTF, EPUB и другие
- Поддерживает поиск по файлам других форматов, в том числе Visio, JPEG, mp3 и SVG
- Поддерживаемые форматы архивов: zip,7z, rar, tar.*
- Поддерживается поиск по письмам Outlook (файлы PST)
- Поддерживается тонкая настройка для индексации любого файла с исходным кодом
- Индексы автоматически обновляются при изменении файлов
- Исключение из индекса файлов на основе регулярных выражений
- Поиск файлов по MIME-типу, то есть по его содержимому
- Синтаксис запросов с расширенными возможностями
- Поддержка Unicode
- Поддержка 64-разрядныхоперационных систем
- Наличие портативной версии
Портативность
DocFetcher доступен в виде портативной версии, что позволяет пользователю объединить DocFetcher и собственные личные файлы для того, чтобы создать портативный поисковый индекс файлов.
DocFetcher 1 1 19 免安裝繁體中文版
Пользователь может переносить этот индекс файлов на USB-накопителе или синхронизировать его на нескольких компьютерах с помощью службы синхронизации.
Также, в связи с тем, что DocFetcher основан на Java, такой индекс может быть использован на разных платформах.
См. также
Примечания
- ↑DocFetcher changelog(неопр.) .
- ↑Searching Inside Documents with DocFetcher — Linux Magazine(неопр.) . Дата обращения: 18 марта 2016.Архивировано 27 марта 2016 года.
- ↑DocFetcher Softpedia Review(неопр.) . Дата обращения: 18 декабря 2016.Архивировано 21 декабря 2016 года.
- ↑Quickly Search Documents For Words with DocFetcher(неопр.) . Дата обращения: 18 декабря 2016.Архивировано 16 декабря 2016 года.
- ↑Официальный сайт(неопр.) . Дата обращения: 18 марта 2016.Архивировано 23 марта 2016 года.
Литература
- Майк Сандерс.Hot Picks — DocFetcher // LinuxFormat. — 2013. — Май ( № 5 (170) ). — С. 102 .
- Alor-Hernández, Giner.Frameworks, Methodologies, and Tools for Developing Rich Internet Applications. — IGI Global, 2014. — С. 198. — 366 с. — ISBN 146666438X.
Ссылки
- Официальный сайт(рус.)
- DocFetcher-Wiki(англ.)
- Desktop Search Engine DocFetcher — gHacks Tech News(англ.)
- Portable desktop search: Make the most of DocFetcher — TechRepublic(англ.)
- Need better desktop search? Try DocFetcher — betanews(англ.)
- DocFetcher 1.1.16 — System https://xn--h1ajim.xn--p1ai/index.php/DocFetcher» target=»_blank»]xn--h1ajim.xn--p1ai[/mask_link]
佛學檢索工具:DocFetcher 小貓頭
DocFetcher
DocFetcher — удобное Java (AspectJ) / SWT приложение для поиска файлов и документов по локальным дискам.
DocFetcher приложение позволяющее выполнять быстрый поиск по содержимому документов, отыскивая содержащие ключевое слово или фразу. По словам разработчиков, это как бы Google для пользовательского репозитория документов на локальном жёстком диске.
DocFetcher при запуске создаёт так называемые «индексные файлы», по которым в последующем и осуществляется поиск. Для больших и редко меняющихся хранилищ можно создать постоянный «индексный файл», а для быстрого поиска в небольших каталогах с часто изменяющимися документами временный (можно проводить поиск без создания индекса, или создавая/обновляя индекс непосредственно в процессе поиска).
Временные «индексные файлы» создаются в исследуемом каталоге и автоматически удаляются при закрытии приложения (опционально, при желании/необходимости индексный файл может быть оставлен для использования в дальнейшем). Процесс индексации, при большом количестве документов, занимает некоторое время (200 документов разного формата обрабатываются примерно 1 мин), поэтому предусмотрено автоматическое обновление индексов.
За автоматическую индексацию файлов отвечает «демон» (DAEMONS), запущенный в фоновом режиме и отслеживающий наличие изменений в проиндексированных каталогах. Демон потребляет самый минимум системных ресурсов, потому что вместо постоянного индексирования каталогов, он только отслеживает изменения для обновления индекса при следующем запуске приложения.
DocFetcher при работе (индексации) может быть свёрнут в область уведомлений (трей), а после проведения индексации и задания ключевого слова отобразит список документов его содержащих. Документ можно сразу открыть в приложении «по умолчанию» или открыть каталог с этим документом, а так же можно просмотреть документ в окне предварительного просмотра. Результаты поиска могут быть отсортированы и отфильтрованы по различным критериям (формат файла, размер, дата создания, путь к файлу и пр. ).
DocFetcher полностью поддерживает поиск (в том числе и по содержимому) документов форматов: HTML, простой текст (.txt), AbiWord (abw, abw.gz, zabw), OpenOffice.org Writer, Calc, Draw и Impress (odt, ods, odg, odp), Portable Document Format (pdf), Rich Text Format (rtf), Microsoft Office (doc, xls, ppt), Microsoft Office 2007 (docx, xlsx, pptx), Microsoft Compiled HTML Help (chm), Microsoft Visio (vsd) и Scalable Vector Graphics (svg).
DocFetcher имеет частично настраиваемый интерфейс, полностью поддерживает Юникод (Unicode), может управляться как с помощью мыши, так и клавиатурными сочетаниями.
Лицензия: Eclipse Public License
Источник: zenway.ru
Name already in use
A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?
Cancel Create
docfetcher / src / net / sourceforge / docfetcher / website / ru / index.markdown
- Go to file T
- Go to line L
- Copy path
- Copy permalink
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Cannot retrieve contributors at this time
92 lines (66 sloc) 20 KB- Open with Desktop
- View raw
- Copy raw contents Copy raw contents Copy raw contents
Copy raw contents
DocFetcher – это приложение с открытым исходным кодом, позволяющее вам совершать поиск по содержанию файлов на вашем компьютере. — вы можете считать это чем-то вроде Google для ваших файлов. Приложение работает на Windows, Linux и Mac OS X. Приложение распространяется по лицензии Eclipse Public License.
Приведённые ниже скриншоты отображают основной пользовательский интерфейс. Поисковые запросы вводятся в текстовое поле (1). Результаты поиска отображаются в панели результатов (2). Панель предпросмотра (3) отображает текстовый предпросмотр файла, выделенного в панели результатов. Все совпадения выделены жёлтым.
Вы можете фильтровать результаты указав минимальный или максимальный размер файла (4), тип файла (5) и его местоположение (6). Кнопки, отмеченные цифрой (7), используются для вызова руководства, настроек и свёртывания программы в трей.
Для работы DocFetcher необходимо создать так называемые индексы для тех папок, в которых вы хотите осуществлять поиск. Что такое индексация и как она работает подробнее описано ниже. Вкратце, индекс позволят DocFetcher быстро (счёт идёт в милисекундах) определить, в каких файлах содержится определённый набор слов, поэтому ускоряется скорость поиска. Данный скриншот показывает диалог DocFetcher по созданию новых индексов.
Нажатие на кнопку «Запуск» внизу этого диалогового окна запускает индексацию. Процесс индексирования может занять некоторое время, в зависимости от количества и размера файлов для индексирования.
Создание индекса занимает время только один раз для каждой папки. Обновление индекса после изменения содержимого папки происходит гораздо быстрее. Этот процесс обычно занимает несколько секунд.
Поддерживаемые форматы документов
- Microsoft Office (doc, xls, ppt)
- Microsoft Office 2007 и новее (docx, xlsx, pptx, docm, xlsm, pptm)
- Microsoft Outlook (pst)
- OpenOffice.org (odt, ods, odg, odp, ott, ots, otg, otp)
- Portable Document Format (pdf)
- HTML (html, xhtml, . )
- Plain text (customizable)
- Rich Text Format (rtf)
- AbiWord (abw, abw.gz, zabw)
- Microsoft Compiled HTML Help (chm)
- MP3 Metadata (mp3)
- FLAC Metadata (flac)
- JPEG Exif Metadata (jpg, jpeg)
- Microsoft Visio (vsd)
- Scalable Vector Graphics (svg)
А вот, что некоторые люди думают об этой программе…
Кроме того, DocFetcher получил одобрительный рейтинг на нашей странице Sourceforge.net.
Сравнение с другими приложениями похожего функционала.
Вот чем выделяется DocFetcher на фоне других приложений по поиску на локальном компьютере:
Отсутсвие мусора: Мы стараемся держать интерефейс DocFetcher свободным от суеты и мусора. Никакой рекламы и всплывающих окон с предложением зарегестрироваться. Ничего ненужного не устанавливается в ваш браузер, реестр или ещё куда-нибудь.
Приватность DocFetcher не собирает вашу личную информацию. Никакую и никогда. Если у кого-то возникнут в этом сомнения, он может проверить это в нашем открытом исходном коде.
Бесплатно навсегда: Так как DocFetcher имеет всегда доступный открытый исходный код, вам не стоит бояться, что программа когда-нибудь устареет и перестанет развиваться. Говоря о поддержке, слышали ли вы о том, что Google Desktop, один из основных коммерческих конкурентов DocFetcher перестал разрабатываться в 2011? Итак…
Кроссплатформенность: В отличие от многих конкурентов, DocFetcher работает не только на Windows, но и на Linux, и на Mac OS X. Таким образом, если вы когда-нибудь решите перейти с одной платформы на другую, DocFetcher будет ждать вас там.
*Портативность: Один из главных плюсов Docfetcher – это портативность. В общем, вы можете создать полноценный доступный для поиска репозиторий документов на USB-носителе. Подробнее в следующем разделе.
Индексирование только необходимых документов: Среди коммерческих конкурентов DocFetcher наблюдается тенденция по побуждению пользователей сканировать жёсткий диск целиком— Возможно, это делается для того, чтобы лишить якобы «немого» пользователей вариантов действий, или, что ещё хуже, для того, чтобы собрать как можно больше пользовательских данных. Практика показывает, что большинство пользователей не хотят индексировать весь жёсткий диск: Не только из-за того, что это пустая трата времени и дискового пространства, но ещё и потому, что это засоряет поисковую выдачу ненужными файлами. DocFetcher же индексирует только те папки, на которые вы недвусмысленно укажете, кроме того, вам доступно множество опций фильтрации.
Портативные хранилища документов
Одна из выдающихся особенностей DocFetcher – это то, что он доступен в виде портативной версии, которая позволяет вам создавать портативное хранилище документов — полностью доступное для индекса и поиска хранилище ваших важных документов, которое вы можете взять с собой.
Примеры использования: Вот что вы можете делать с таким хранилищем документов: вы можете взять его с собой на USB-диске, записать его на CD в целях архивации, поместить его на защищённый раздел диска (рекомендуем использовать TrueCrypt), синхронизировать его с множеством компьютеров через облачное хранилище вроде DropBox. Кроме того, так как DocFetcher имеет открытый исходный код, вы можете распространять ваше хранилище файлов: Загрузить его и поделиться со всем миром, если у вас есть такое желание.
Java: Производительность и портативность: Особенностью программы, с которой многие могут поспорить является то, что DocFetcher написан с использованием Java, имеющей репутацию «медленной». Это было справедливо десять лет назад, но с тех пор производительность Java значительно возросла, согласно Википедии. Как бы то ни было, Java позволяет одному и тому же пакету DocFetcher быть запущеным на Windows, Linux и Mac OS X — В то же время многие другие программы требуют разных пакетов для каждой платформы. В итоге вы можете, например, поместить ваше портативное хранилище документов на USB-диск, а потом получить доступ к нему из любой из вышеперечисленных операционных систем, убедившись, что в системе установлена Java.
Как работает индексация
Данный раздел даёт базовое представление о том, что такое индексация и как она работает.
Простой подход к поиску файлов: Основной подход к поиску файлов – это просто «посещение» каждого файла в определённой папке один за одним. Это отлично подходит для поиска только по именам файлов, так как анализ имён файлов происходит очень быстро. Однако, это не подходит, когда вы хотите осуществить поиск по содержимому файлов, так как извлечение полного текст – более трудоёмкая задача, чем анализ имён файлов.
Поиск, основанный на индексе: Вот почему DocFetcher, выполняя поиск по содержимому, использует подход, называемый «индексация»: Основная идея заключается в том, что большинство файлов, в которых пользователи хотят осуществить поиск изменяются очень нечасто или не изменяются вообще. И, вместо извлечения всего текста каждый раз, более эффективным будет сделать извлечение текста из всех фалов лишь однажды и создать так называемый индекс из этого извлечённого текста. Это что-то вроде словаря, позволяющего находить файлы по словам, которые они содержат.
Сравнение с телефонной книгой: Для сравнения, подумайте, насколько более эффективно искать чей-то номер телефона в телефонной книге («индекс), а не обзванивать каждый возможный номер телефона с целью узнать, не является ли человек на другом конце провода тем, кого вы ищете. — Звонок кому-либо и извлечение текста из файла могут быть рассмотренны как «трудоёмкие операции». Кроме того, то, то люди не меняют свои номера очень часто, аналогично тому, что большинство фалов на компьютере очень редко изменяются, если вообще изменяются.
Обновления индекса: Конечно, индекс отображает только то состояние фалов, которое существовало, когда он был создан, не обязательно последнее состояние файлов. Таким образом, если индекс не соответсвует действительности, вы можете получить устаревшие результаты поиска, телефонная книга устаревает точно так же.
Однако, это не проблема, так как мы знаем, что большинство фалов изменяются очень редко. Кроме того, DocFetcher может автоматически обновлять индексы: (1) Когда он запущен, он определяет изменённые файлы и, соответственно, обновляет их индексы. (2) Когда он не запущен, маленький фоновый процесс будет определять изменения в файлах и составлять список из файлов, требующих обновления индекса. DocFetcher обновит эти индексы при следующем запуске. Вы можете не беспокоиться об этом фоновом процессе: он действительно мало нагружает процессор и память, так как не делает ничего, кроме обнаружения изменения в папках, оставляя боле затратное обновления индекса DocFetcher.
Источник: github.com
DocFetcher — умный поиск файлов
Удобная программа для поиска файлов на компьютере с использованием разнообразных фильтров. Позволяет искать объекты по маскам определенных типов и указывать минимальный и максимальный размер. Можно использовать регулярные выражения, а также удобно сортировать по различным критериям найденные файлы и папки.
DocFetcher это удобная замена встроенному в Windows инструменту поиска файлов и папок. Позволяет производить быстрый поиск в пределах указанных типов файлов, например видео или изображения. Интерфейс программы хорошо продуман и интуитивно понятен.
При первом запуске DocFetcher необходимо произвести индексирование файлов и папок, вызвав соответствующую функцию в окне программы. Это даст возможность искать объекты гораздо быстрее, чем встроенным в систему инструментом поиска.
В программе есть возможность указывать минимальные и максимальные пределы размера искомого объекта. Также в приложении удобно реализована функция использования регулярных выражений для условий поиска файлов и папок по названию.
Примеры использования регулярных выражений в DocFetcher:
- абв OR 123 — (в имени файла должно присутствовать строки «абв» или «123» или обе вместе)
- абв AND 123 — (в имени файла должно присутствовать строки «абв» и «123»)
- абв NOT 123 — (в имени файла должно присутствовать строка «абв», но не должно быть «123»)
- (абв OR 123) AND гдж — (в имени файла должно присутствовать строки «абв» или «123» или обе вместе, а также должно включать «гдж»)
Для работы DocFetcher не требуется ни каких настроек, но при желании Вы можете изменить некоторые опции программы. Доступны параметры поведения при закрытии приложения. Можно удалять историю поиска или нет, выбрать «горячую клавишу» для вызова программы (по умолчанию Ctrl + F8), также можно настроить подсветку типов для отображения результатов.
Список изменений:
v1.1.22 [2018-07-30]
- DocFetcher нельзя было запустить на операционной системе X с Java 9 или новее.
- Отказ на Windows из-за проблем с горячими клавишами (ошибка #1466 и др.).
- Ошибка некоторых PDF-файлов (ошибка #1477 и др.).
- Не удалось прочитать файлы MS Office, содержащие очень большое количество текста.
- DocFetcher не мог прочитать метаданные некоторых JPEG файлов (ошибка #1493).
Источник: freeexe.net